#数据集

阿里巴巴集团副总裁贾扬清:开源大数据生态前瞻

/简介: 本文整理自开源大数据专场中阿里巴巴集团副总裁,阿里巴巴计算平台事业部总裁贾扬清先生的精彩演讲,将为大家讲述开源大数据与人工智能生态前瞻,分享阿里云对开源的态度,以及对大数据和人工智能的未来规划。2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基...

Future Maker | 领跑亚太 进击的阿里云数据库

7月31日,阿里云马来西亚峰会在吉隆坡召开,阿里巴巴集团副总裁、阿里云智能数据库事业部总裁李飞飞在演讲中表示:“作为亚太地区第一的云服务提供商,阿里云数据库已为多家马来西亚知名企业提供技术支持,助力企业用户和合作伙伴加速上云,推动交通、金融等多个行业的数字化转型。”基于多年的内部实践以及技术迭代,阿里云数据库现已稳居亚...

更简单易用的数据仓库,阿里云重磅推出分析型数据库3.0版

7月31⽇,阿⾥云PB级实时数据仓库AnalyticDB重磅升级,推出AnalyticDBforMySQL3.0版。全新的AnalyticDB采⽤分布式云盘三副本机制,为企业客户提供99.9999999%的数据可靠性保证。此外,性能⼤幅度提升,基准测试写⼊性能提升50%,查询性能提升40%。实例存储空间可变,灵活控制C...

什么是飞天?全球级大数据计算平台,自主研发!

又一个注定载入史册的日子!7月25日。又一个注定让人更有底气的核心科技!阿里云飞天大数据平台!这是目前国内规模最大的计算平台,当然也是全球级的。它可以扩展到10万台计算集群,用通俗的比喻,就相当于把10万台计算机组成一个巨大的计算力池子,当成一台超级计算机来使用;单日数据处理量超过600PB,相当于6亿部高清的电影。大...

阿里云数据库自研产品亮相国际顶级会议ICDE 推动云原生数据库成为行业标准

4月9日,澳门当地时间下午4:00-5:30,阿里云在ICDE2019举办了主题为“云时代的数据库”的专场分享研讨会。本次专场研讨会由阿里巴巴集团副总裁、高级研究员,阿里云智能数据库产品事业部负责人李飞飞(花名:飞刀)主持,五位学术界知名学者和教授受邀参加作为PanelDiscussion的嘉宾,与现场近百位与会者进行...

基于MaxCompute的数仓数据质量管理

声明本文中介绍的非功能性规范均为建议性规范,产品功能无强制,仅供指导。参考文献《大数据之路——阿里巴巴大数据实践》——阿里巴巴数据技术及产品部著。背景及目的数据对一个企业来说已经是一项重要的资产,既然是资产,肯定需要管理。随着业务的增加,数据的应用越来越多,企业在创建的数仓过程中对数据的管理也提出了更高的要求,而数据质...

王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute

如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据技术向前跨越了一大步。数据是企业的核心资产,但十年前阿里巴巴的算力已经无法满足当时急剧增长数据量的需求。基于Hadoop搭建集群是当时解决大规模数据计算的主流方案,Hadoop生态已经比较成熟,...

使用Data Lake Analytics读/写RDS数据

DataLakeAnalytics 作为云上数据处理的枢纽,最近加入了对于RDS(目前支持 MySQL , SQLServer ,Postgres 引擎)的支持,这篇教程带你玩转DLA的RDS支持。我们文章中会以 MySQL 的介绍为主,最...

使用Data Lake Analytics从OSS清洗数据到AnalyticDB

前提必须是同一阿里云region的DataLakeAnalytics(DLA)到AnalyticDB的才能进行清洗操作;开通并初始化了该region的DLA服务;开通并购买了AnalyticDB的实例,实例规模和数据清洗速度强相关,与AnalyticDB的实例资源规模基本成线性比例关系。整体执行流程示意图:步骤1:在A...

云数据库RDS存储能力进化解析!

数据库是企业IT系统的核心,其性能表现会直接影响整体业务系统的性能表现,而影响数据库性能因素包括系统架构设计、应用程序业务SQL语句、数据库参数优化配置、数据库运行的资源能力。系统架构设计和应用程序业务SQL语句都属于数据库外围,需要从整体业务上去设计优化;数据库的参数配置,核心是要根据数据库上的业务和硬件特点细调参数...

邀您共赴数据库学术顶会ICDE 2019——阿里云专场 零距离接触达摩院数据库“最强大脑”

/摘要: 当学术大家遇到技术大拿,会碰撞出怎样的火花?为进一步加深产学研学术交流,阿里云将于ICDE2019大会期间(4月9日)举办以“云时代的数据库”为主题的技术专场(Workshop)作为全球数据库领域三大顶级学术会议之一,ICDE2019(第35届数据工程国际学术会议)即将于4月8日-11日在中国澳门召...

PB 级数据处理挑战,Kubernetes如何助力基因分析?

/摘要: 一家大型基因测序功能公司每日会产生10TB到100TB的下机数据,大数据生信分析平台需要达到PB级别的数据处理能力。这背后是生物科技和计算机科技的双向支撑:测序应用从科研逐步走向临床应用,计算模式从离线向在线演进,交付效率越来越重要。作者李鹏,原文首发于InfoQ,《容器混合云,Kubernetes...

一条SQL完成跨数据库实例Join查询

背景随着业务复杂程度的提高、数据规模的增长,越来越多的公司选择对其在线业务数据库进行垂直或水平拆分,甚至选择不同的数据库类型以满足其业务需求。原本在同一数据库实例里就能实现的SQL查询,现在需要跨多个数据库实例才能完成。业务的数据被“散落”在各个地方,如何方便地对这些数据进行汇总关联查询,已经成为困扰用户的一大难题。针...

信用算力基于 RocketMQ 实现金融级数据服务的实践

导读:微服务架构已成为了互联网的热门话题之一,而这也是互联网技术发展的必然阶段。然而,微服务概念的提出者MartinFowler却强调:分布式调用的第一原则就是不要分布式。纵观微服务实施过程中的弊端,可以推断出作者的意图,就是希望系统架构者能够谨慎地对待分布式调用,这是分布式系统自身存在的缺陷所致。但无论是RPC框架,...

云数据库将进入企业级百万IOPS时代

IOPS(Input/OutputOperationsPerSecond),即每秒进行读写(I/O)操作的次数,以衡量存储每秒可接受多少次主机发出的访问。数据库,特别是关系型数据库由于需要处理实时业务,因此几乎所有变化的数据都必须完成落盘写入,以实现ACID的各项要求,特别针对持久性。因此更高的IOPS对于数据库整体性...
首页上一页...2021222324...下一页尾页