王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute

如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据技术向前跨越了一大步。数据是企业的核心资产,但十年前阿里巴巴的算力已经无法满足当时急剧增长数据量的需求。基于Hadoop搭建集群是当时解决大规模数据计算的主流方案,Hadoop生态已经比较成熟,而且在规模上也可以解决当时阿里遇到的性能瓶颈。但刚加入阿里的王坚却另辟蹊径,决定自研一个大数据计算平台,也就是今天的MaxCompute。但王坚看到,当时淘宝的业务还在快速增长,如果用Hadoop搭建的计算平台会再次遇到挑战,更别提为外部企业提供算力。也正是因为这一坚持,才有了今天EB级的大数据计算平台MaxCompute。过去十年,MaxCompute打破了多个记录:2013年,突破了单集群内5000台服务器同时计算的局限,如今单集群已超过1万台的规模;2015年,打破计算界奥运会SortBenchmark的4个世界纪录,用不到7分钟便完成了100TB的数据排序,刷新了ApacheSpark23.4分钟的纪录;2017年成为全球首个100TB规模Bigbench测试通过...

企业级性能、安全可靠 阿里云发布企业级大数据平台开发者版

/摘要: 作为可以承载EB级的数据存储能力,百PB级的单日计算能力的企业级计算平台,积极的在“智能+”重要战略中,释放技术红利,普惠大数据生态,帮助企业和个人开发者深化大数据、人工智能等研发应用,拓展“智能+”为更多开发者提供资源并进行赋能。3月20日,阿里云宣布推出企业级大数据计算平台MaxCompute开发者版。该版本基于MaxCompute原有的分布式架构,具备高可靠、企业级安全能力、全面融合开源等特点,可轻松做到开箱即用,分钟级拥有大数据开发项目,帮助开发者突破技术壁垒,降低门槛和成本,提高大数据开发效率,实现个人技术能力和业务的快速增长。MaxCompute作为阿里巴巴的通用计算平台,承担了阿里巴巴集团99%的数据存储和95%的统一计算,每天有超过18000名阿里巴巴内部的开发者在这个平台上进行开发,几乎涵盖阿里内部所有的数据体系。同时,MaxCompute在云上服务着上万家客户,客户遍及全球各主要市场的金融、互联网、生物医疗、能源、交通,传媒等行业。开箱即用的在线服务Severless在线服务,无需关心基础设施与软件运维,开通即可使用完整的平台服务。计算与存储单独...

阿里开源自用 OpenJDK 版本,Java 社区迎来中国力量

阿里开源自用OpenJDK版本,Java社区迎来中国力量/3月21日,阿里巴巴将宣布开源AlibabaDragonwell。届时,开发者可通过阿里云开发者中心及Github社区下载使用。InfoQ记者独家专访了阿里云智能基础产品事业部资深技术专家李三红、阿里云智能基础产品事业部研究员KingsumChow(周经森),听他们如何看待AlibabaDragonwell与Java归途。作者|赵钰莹受访嘉宾|阿里云智能基础产品事业部资深技术专家李三红阿里云智能基础产品事业部研究员KingsumChow(周经森)阿里巴巴即将重磅开源OpenJDK长期支持版本AlibabaDragonwell。众所周知,Oracle对Java的态度已经发生系列转变,由于Java用户群体庞大,预计此事在很长一段时间内都是开发者的讨论焦点。作为世界上最大的Java用户之一,阿里巴巴此时选择开源OpenJDK长期支持版本AlibabaDragonwell是出于哪些考量呢?Oracle撒手,宣布对个人用户(PersonalUsers),Java8官方支持时间持续到2020年12月;对商业用户(CommercialUser...

本地 vs. 云:大数据厮杀的最终幸存者会是谁?— InfoQ专访阿里云智能通用计算平台负责人关涛

/摘要: 本地大数据服务是否进入消失倒计时?云平台大数据服务最终到底会趋向多云、混合云还是单一公有云?集群规模增大,上云成本将难以承受是误区还是事实?InfoQ将就上述问题对阿里云智能通用计算平台负责人关涛进行了专访。一家企业什么时候会决定上云?过去,这个问题的答案可能是当企业发现需要购买新的硬件进行新一轮资本投入时,往往倾向于考虑另一种替代方案,比如云,这可能更多还是从成本方面考虑;或者,当企业出现某种弹性计算需求时,云平台是非常好的实现IT资源“削峰”的方案。不同于现有技术边界的“替换”,如今,这个问题的答案可以再加上一条:技术边界的“扩张”。当企业需要某种能力,比如AI或者大数据,但自身技术实力达不到或者企业核心竞争力不在技术本身,此时就可能会考虑上云,甚至这已经成为不少企业选择云平台的重要原因。通过选择云平台,企业实现了自己技术边界的扩张,从而为业务边界扩张提供技术上的保障。过去几年,云平台大数据服务越来越成熟,单就这一项,主流云厂商可提供的服务列表就达到数十种,本地大数据服务的声音似乎越来越弱,这在Cloudera与Hortonworks合并之后尤为明显。有分析人士...

如何构建批流一体数据融合平台的一致性语义保证?

本文根据陈肃老师在ApacheKafkaxFlinkMeetup深圳站的分享整理而成,文章首先将从数据融合角度,谈一下DataPipeline对批流一体架构的看法,以及如何设计和使用一个基础框架。其次,数据的一致性是进行数据融合时最基础的问题。如果数据无法实现一致,即使同步再快,支持的功能再丰富,都没有意义。另外,DataPipeline目前使用的基础框架为KafkaConnect。为实现一致性的语义保证,我们做了一些额外工作,希望对大家有一定的参考意义。最后,会提一些我们在应用KafkaConnect框架时,遇到的一些现实的工程问题,以及应对方法。尽管大家的场景、环境和数据量级不同,但也有可能会遇到这些问题。希望对大家的工作有所帮助。批和流是数据融合的两种应用形态下图来自Flink官网。传统的数据融合通常基于批模式。在批的模式下,我们会通过一些周期性运行的ETLJOB,将数据从关系型数据库、文件存储向下游的目标数据库进行同步,中间可能有各种类型的转换。另一种是DataPipeline模式。与批模式相比相比,其最核心的区别是将批量变为实时:输入的数据不再是周期性的去获取,而是源源不断的...

阿里云代码管理平台 Teambition Codeup(行云)亮相,为企业代码安全护航

2019杭州云栖大会企业协作与研发效能专场,企业协同平台Teambition负责人齐俊元正式发布阿里云自研的代码管理平台TeambitionCodeup(行云),Codeup是一款企业级代码管理产品,提供代码托管、代码评审、代码扫描、质量检测等功能,通过智能算法保护企业资产安全、稳定、高效交付。Teambition负责人齐俊元在代码资产安全保护方面,Codeup首次结合人工智能技术实现代码中的敏感信息检测,通过多层风控模型并结合传统防治方式提供企业级安全保障,具备事前可防控,事后可追溯的能力。Codeup平台的技术负责人陈鑫表示,Codeup在阿里巴巴内部已运行近3年,统一管理阿里巴巴的代码资产,服务过阿里全部核心业务包括淘宝、天猫、阿里云等,此次是首次面向业界的开发者开放,希望借此帮助提升行业整体研发效率。Codeup不仅支持与持续集成流水线的打通,实现开发、构建在应用内的闭环,还将与Teambition的项目管理、知识库打通,真正实现一站式产品研发,帮助开发者实现工作全流程的数字化和自动化。一站式产品研发解决方案框架图未来Codeup针对企业级场景会提供更加丰富的能力,利用人工智能...

阿里0代码开发平台“宜搭”亮相杭州云栖大会,现场观众体验30秒拼搭应用!

被称为史上“最程序员”的杭州云栖大会今天在杭州云栖小镇正式开幕了。两天两场主论坛、110余场峰会和分论坛、20000平方米的展区呈现最前沿的科技。在今年云栖展台上,一个“不用写代码也能开发应用”的产品也吸引了大批到场嘉宾目光。不少观众甚至上手“玩”起应用拼搭。最快30秒就搭建了一个审批流程。(图:现场观众咨询宜搭解决方案)这是阿里巴巴内部经过2年多孵化出0代码开发平台“宜搭”,开发者在可视化界面上,以拖拉拽的方式编辑和配置页面、表单与流程,并且一键发布在PC和手机端。即便不会写代码的人也能轻松搭建应用。(图:现场观众拖拽搭建应用)以差旅报销流程为例,通过传统开发模式,完成同类的应用,大约需要开发2~3周,用宜搭配置只需1小时即可完成,大大降低了开发周期及人力资源的投入。据了解,今年3月,宜搭作为阿里云SaaS加速器的重要底座,已正式上云对外服务各大企业。截止目前,已有超过1000家企业使用宜搭搭建应用,覆盖新零售、酒店、生产制造、医疗、能源、教育等六大行业领域。表单、流程快速搭建的背后,是宜搭强大、开放的生态PaaS能力,这也是宜搭区别于市面上其他同类产品的核心。宜搭经过不断迭代升级,...

Spring 社区的唯一一个国产开源项目

/阿里妹导读:一年多前,Java界最近发生了一件大事,阿里开源SpringCloudAlibaba,并推出首个预览版。SpringCloud本身是一套微服务规范,并不是一个拿来即可用的框架,而SpringCloudAlibaba的开源为开发者们提供了这套规范的实现方式。同时,SpringCloudAlibaba提供的完整的微服务组件、中文文档和本地化的开源服务提高了开发者们接入微服务的速率,并降低了后续的运维难度。经过一年多的孵化,SpringCloudAlibaba作为Spring社区的唯一一个国产开源项目,正式从SpringCloudIncubator孵化器毕业,并发布了适配SpringCloudEdgware、Finchley、Greenwich三个版本的新版本。SpringCloudAlibaba是Spring社区第一个也是唯一一个国产开源项目。(官方毕业公告参考SpringBlog: https://spring.io/blog/2019/07/24/simplifying-the-spring-cloud-release-train)SpringCloudAlib...

阿里云生活物联网平台3.0发布,助力智能家电“中国造、全球卖”

视频地址:https://yunqivedio.alicdn.com/user-upload/ADbPHDMQY2.mp4查看产品:生活物联网平台点击了解:“阿里云新品发布会频道”立即订阅:阿里云新品发布会·周刊在物联网行业蓬勃发展的大潮中,阿里云IoT致力于将物理世界数字化,构建了云端一体化的平台,为智能生活、智能工业、智慧城市等各行业提供助力。阿里云发布生活物联网平台(飞燕平台)3.0,为行业合作伙伴提供安全、稳定、高扩展、低成本的智能生活解决方案,同时还将通过阿里云的全球化部署助力中国企业出海,共同打造物联网的生态。“创建产品-功能产品-在线调试-配置界面-发布量产”,通过这四步,传统硬件厂商可以快速定义产品功能和属性、选择认证模组、在线调试端到云链路、配置所见即所得的人机界面,从而大大节省设备上云的工作量。传统的智能硬件开发包括设备端、服务端和客户端开发,至少需要20个以上的基本工作环节,还需要面对高并发稳定性、安全保障、运维服务等方面的问题。现在,智能硬件厂商可以快捷配置和服务选择,低成本的完成从硬件到用户交互的产品交付,并且拥有专属的运营管理中心,从而只需要专注于硬件产品本...

阿里PB级Kubernetes日志平台建设实践

/摘要: 将在QCon上分享的《阿里PB级Kubernetes日志平台建设实践》整理出来,分享给大家。阿里PB级Kubernetes日志平台建设实践QCon是由InfoQ主办的综合性技术盛会,每年在伦敦、北京、纽约、圣保罗、上海、旧金山召开。有幸参加这次QCon10周年大会,作为分享嘉宾在刘宇老师的运维专场发表了《阿里PB级Kubernetes日志平台建设实践》,现将PPT和文字稿整理下来,希望和更多的爱好者分享。计算形态的发展与日志系统的演进在阿里的十多年中,日志系统伴随着计算形态的发展在不断演进,大致分为3个主要阶段:在单机时代,几乎所有的应用都是单机部署,当服务压力增大时,只能切换更高规格的IBM小型机。日志作为应用系统的一部分,主要用作程序Debug,通常结合grep等Linux常见的文本命令进行分析。随着单机系统成为制约阿里业务发展的瓶颈,为了真正的Scaleout,飞天项目启动:2009年开始了飞天的第一行代码,2013年飞天5K项目正式上线。在这个阶段各个业务开始了分布式改造,服务之间的调用也从本地变为分布式,为了更好的管理、调试、分析分布式应用,我们开发了Tr...

【小程序案例】支付宝小程序-MQTT模器,IoT设备通过WSS接入阿里云IoT物联网平台

小程序效果:1.1注册阿里云账号开通阿里云账号,并通过支付宝实名认证 https://www.aliyun.com1.2免费开通IoT物联网套件产品官网 https://www.aliyun.com/product/iot2.1创建产品 JSON格式 2.2产品功能定义添加产品属性温度temperature,湿度humidity2.3注册设备在产品下注册设备,获得身份三元组3.1设备上线3.2上报数据3.3订阅主题和数据下行先点击 订阅主题,再去控制台推送消息。发布指令日志小程序效果 4.1支付宝小程序socket接口适配socket接口my.sendSocketMessage和my.onSocketMessage都是base64的string,不支持ArrayBuffer,需要自己转换importminiBase64from'mini-base64';miniBase64.arrayBufferToBase64()4.2阿里云IoT身份认证签名constparams={productKey:pageThat.data.pro...

初识 Knative: 跨平台的 Serverless 编排框架

Knative是Google在2018的GoogleCloudNext大会上发布的一款基于Kubernetes的Serverless框架。Knative一个很重要的目标就是制定云原生、跨平台的Serverless编排标准。Knative是通过整合容器构建(或者函数)、工作负载管理(和动态扩缩)以及事件模型这三者来实现的这一Serverless标准。Knative社区的主要贡献者有Google、Pivotal、IBM、RedHat。可见其阵容强大,CloudFoundry、OpenShift这些PAAS提供商都在积极的参与Knative的建设。在Knative之前社区已经有很多Serverless解决方案,如下所示这些:kubelessFissionOpenFaaSApacheOpenWhisk...除了上面这些社区的开源解决方案以外各大云厂商也都有各自的FAAS产品的实现比如:AWSLambdaGoogleCloudFunctionsMicrosoftAzureFunctions阿里云的函数计算业务代码部署到Serverless平台上就离不开源码的编译、部署和事件的管理。然而无论是开源...

BigData NoSQL —— ApsaraDB HBase数据存储与分析平台概览

一、引言时间到了2019年,数据库也发展到了一个新的拐点,有三个明显的趋势:越来越多的数据库会做云原生(CloudNative),会不断利用新的硬件及云本身的优势打造CloudNative数据库,国内以阿里云的CloudHBase、POLARDB为代表,此块文章会有一定的引述,但不是本文的重点。NoSQL正在解决BigData领域的问题。根据ForresterNoSQL的报告,BigDataNoSQL是提供存储、计算处理、支持水平扩展、Schemaless以及灵活的数据模型,特别提到需要支持复杂计算,一般通过集成Spark或者实现单独的计算引擎实现。Cassandra商业化公司Datastax提供的产品是直接在Cassandra之上集成了Spark,另外ScyllaDB公司首页的宣传语就是TheReal-TimeBigDataDatabase。大数据的5V特性,包括Volume:数据量大,包括采集、存储和计算的量都非常大;Variety:种类和来源多样化,包括结构化、半结构化和非结构化数据;Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵;Velocity:数据增长速度快...

一周集成行业智能监控应用,阿里云发布智能视频监控平台

在4月22-25日于上海举办的2019联通合作伙伴大会上,阿里云首次对外发布了智能视频监控平台,同时向参会的数千名伙伴及业界人士演示了一分钟视频监控上云系统,阐述了阿里云智能视频监控平台助力传统监控领域上云的优势和方法。在视频监控领域,上云和AI是未来的趋势,阿里云智能视频监控解决方案无缝集成了视频监控产品和智能视觉产品。该平台依托遍布全球的边缘接入节点和出色的视频技术,面向监控设备提供统一开放的视频流接入、处理和分发服务。将传统的本地监控视频内容接入云端,进行存储、录制回看、全网分发,同时通过智能视觉产品,最快可实现五分钟自助训练视觉AI模型,并可复用阿里内外部成熟的行业AI算法,以快速构建行业级智能监控解决方案。阿里云智能视频监控平台支持摄像机视频流的接入、存储、处理、分发、管理一站式集成,通过开放的OpenAPI快速与业务对接,最快一周实现集成智能视频监控行业方案。在视频接入环节,支持RTMP、GB/T28181标准协议摄像头、智能设备、视频监控平台接入与管理;在媒体处理环节,依托于阿里云视频服务深厚的媒体处理技术沉淀,支持截图、收录、转码、混流等处理,同时支持实时、历史流按需播...

阿里云POLARDB如何助力轻松筹打造5亿用户信赖的大病筹款平台?

轻松筹首创了“大病救助”模式,帮助了众多病患在第一时间解決了医疗资金等问题,为了从源头解决了医疗资金问题。而在轻松筹这样全球5.5亿用户信赖的大病筹款平台的背后,是日益增长的各种数据。面对这样数据量所造成的巨大挑战,阿里云POLARDB是如何帮助轻松筹践行“善DNA”的呢?本文就为大家分享。关于轻松筹2014年9月,轻松筹成立。“轻松筹”作为公司旗下的首要产品,“善DNA”可谓贯穿了整个发展历程。轻松筹将目标聚焦在公众健康保障领域,各功能板块都与百姓的健康息息相关。由轻松筹首创的“大病救助”模式帮助众多病患在第一时间解決了医疗资金等问题。为了从源头解决医疗资金问题,轻松筹于2016年4月推出了“轻松互助”业务,其目的在于抱团抵抗大病风险,一人患病,众人均推救助金。并与多家保险公司达成合作,推出多款会员定制的保险产品,至此,轻松筹“全民健康保障体系”正式建成。目前,轻松筹在自主研发的“区块链”技术的加持下,再一次开创了行业先河。“阳光链”将大病救助、公益机构及互助行动的捐赠记录、资金流向公开透明,为公益事业及大病救助的发展指明了新方向。历时4年,轻松筹体系(包含大病救助、轻松互助、轻松e...
首页上一页12345...下一页尾页