#数据清洗

最佳实践 | 数据库迁云解决方案选型 & 流程全解析

 /Oracle是非常强大的综合数据库,但同时也存在一些劣势,比如由于采用集中式架构,无法很好地实现横向扩展,并且其稳定性依赖于硬件。出于架构升级、降低成本和云化等需求,越来越多的企业需要“去Oracle”。日前,阿里云数据库技术专家樊文凯在2019数据技术嘉年华大会上,为大家分享了Oracle数据库异构上云...

MongoDB与阿里云达成战略合作,最新数据库独家上线阿里云!

 11月26日,开源数据库厂商MongoDB与阿里云在北京达成战略合作,作为合作的第一步,最新版MongoDB4.2数据库产品正式上线阿里云平台。目前阿里云成为全球唯一可提供最新版MongoDB服务的云厂商,双方合作打通了企业在云上使用最新版开源数据库的通道。错过直播没关系,戳下方看回放:https://de...

悠星网络基于阿里云分析型数据库PostgreSQL版的数据实践

说到“大数据”,当下这个词很火,各行各业涉及到数据的,目前都在提大数据,提数据仓库,数据挖掘或者机器学习,但同时另外一个热门的名词也很火,那就是“云”。越来越多的企业都在搭建属于自己的云平台,也有一些会选择使用技术比较成熟的云商业化产品服务,比如阿里云的分析型数据库产品。本文将结合我们自己企业内部正在使用的阿里云产品分...

在MaxCompute中利用bitmap进行数据处理

很多数据开发者使用bitmap技术对用户数据进行编码和压缩,然后利用bitmap的与/或/非的极速处理速度,实现类似用户画像标签的人群筛选、运营分析的7日活跃等分析。本文给出了一个使用MaxComputeMapReduce开发一个对不同日期活跃用户ID进行bitmap编码和计算的样例。供感兴趣的用户进一步了解、分析,并...

阿里巴巴集团副总裁贾扬清:开源大数据生态前瞻

/简介: 本文整理自开源大数据专场中阿里巴巴集团副总裁,阿里巴巴计算平台事业部总裁贾扬清先生的精彩演讲,将为大家讲述开源大数据与人工智能生态前瞻,分享阿里云对开源的态度,以及对大数据和人工智能的未来规划。2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基...

Future Maker | 领跑亚太 进击的阿里云数据库

7月31日,阿里云马来西亚峰会在吉隆坡召开,阿里巴巴集团副总裁、阿里云智能数据库事业部总裁李飞飞在演讲中表示:“作为亚太地区第一的云服务提供商,阿里云数据库已为多家马来西亚知名企业提供技术支持,助力企业用户和合作伙伴加速上云,推动交通、金融等多个行业的数字化转型。”基于多年的内部实践以及技术迭代,阿里云数据库现已稳居亚...

更简单易用的数据仓库,阿里云重磅推出分析型数据库3.0版

7月31⽇,阿⾥云PB级实时数据仓库AnalyticDB重磅升级,推出AnalyticDBforMySQL3.0版。全新的AnalyticDB采⽤分布式云盘三副本机制,为企业客户提供99.9999999%的数据可靠性保证。此外,性能⼤幅度提升,基准测试写⼊性能提升50%,查询性能提升40%。实例存储空间可变,灵活控制C...

什么是飞天?全球级大数据计算平台,自主研发!

又一个注定载入史册的日子!7月25日。又一个注定让人更有底气的核心科技!阿里云飞天大数据平台!这是目前国内规模最大的计算平台,当然也是全球级的。它可以扩展到10万台计算集群,用通俗的比喻,就相当于把10万台计算机组成一个巨大的计算力池子,当成一台超级计算机来使用;单日数据处理量超过600PB,相当于6亿部高清的电影。大...

阿里云数据库自研产品亮相国际顶级会议ICDE 推动云原生数据库成为行业标准

4月9日,澳门当地时间下午4:00-5:30,阿里云在ICDE2019举办了主题为“云时代的数据库”的专场分享研讨会。本次专场研讨会由阿里巴巴集团副总裁、高级研究员,阿里云智能数据库产品事业部负责人李飞飞(花名:飞刀)主持,五位学术界知名学者和教授受邀参加作为PanelDiscussion的嘉宾,与现场近百位与会者进行...

基于MaxCompute的数仓数据质量管理

声明本文中介绍的非功能性规范均为建议性规范,产品功能无强制,仅供指导。参考文献《大数据之路——阿里巴巴大数据实践》——阿里巴巴数据技术及产品部著。背景及目的数据对一个企业来说已经是一项重要的资产,既然是资产,肯定需要管理。随着业务的增加,数据的应用越来越多,企业在创建的数仓过程中对数据的管理也提出了更高的要求,而数据质...

王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute

如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据技术向前跨越了一大步。数据是企业的核心资产,但十年前阿里巴巴的算力已经无法满足当时急剧增长数据量的需求。基于Hadoop搭建集群是当时解决大规模数据计算的主流方案,Hadoop生态已经比较成熟,...

使用Data Lake Analytics读/写RDS数据

DataLakeAnalytics 作为云上数据处理的枢纽,最近加入了对于RDS(目前支持 MySQL , SQLServer ,Postgres 引擎)的支持,这篇教程带你玩转DLA的RDS支持。我们文章中会以 MySQL 的介绍为主,最...

使用Data Lake Analytics从OSS清洗数据到AnalyticDB

前提必须是同一阿里云region的DataLakeAnalytics(DLA)到AnalyticDB的才能进行清洗操作;开通并初始化了该region的DLA服务;开通并购买了AnalyticDB的实例,实例规模和数据清洗速度强相关,与AnalyticDB的实例资源规模基本成线性比例关系。整体执行流程示意图:步骤1:在A...

云数据库RDS存储能力进化解析!

数据库是企业IT系统的核心,其性能表现会直接影响整体业务系统的性能表现,而影响数据库性能因素包括系统架构设计、应用程序业务SQL语句、数据库参数优化配置、数据库运行的资源能力。系统架构设计和应用程序业务SQL语句都属于数据库外围,需要从整体业务上去设计优化;数据库的参数配置,核心是要根据数据库上的业务和硬件特点细调参数...

邀您共赴数据库学术顶会ICDE 2019——阿里云专场 零距离接触达摩院数据库“最强大脑”

/摘要: 当学术大家遇到技术大拿,会碰撞出怎样的火花?为进一步加深产学研学术交流,阿里云将于ICDE2019大会期间(4月9日)举办以“云时代的数据库”为主题的技术专场(Workshop)作为全球数据库领域三大顶级学术会议之一,ICDE2019(第35届数据工程国际学术会议)即将于4月8日-11日在中国澳门召...
首页上一页...1516171819...下一页尾页