大数据与区块链的联系与区别主题的文章列表，还有大数据与区块链的联系与区别的技术要点_第29页

阿里巴巴飞天大数据架构体系与Hadoop生态系统

很多人问阿里的飞天大数据平台、云梯2、MaxCompute、实时计算到底是什么，和自建Hadoop平台有什么区别。先说HadoopHadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统，主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算，充分利用集群的威力进行高速运...

代码星球 ·2021-02-24

阿里云数据库再获学术顶会认可，一文全览VLDB最新亮点

一年一度的数据库领域顶级会议VLDB2019于当地时间8月26日-8月30日在洛杉矶圆满落幕。在本届大会上，阿里云数据库产品团队浓墨登场，不仅有多篇论文入选ResearchTrack和IndustrialTrack，为了进一步加深产学研学术交流，阿里云还在大会期间举办了“阿里之夜”交流晚宴。8月29日晚，超200名论文...

代码星球 ·2021-02-24

再不懂时序就 OUT 啦！，DBengine 排名第一时序数据库，阿里云数据库 InfluxDB 正式商业化！

云数据库InfluxDB®版介绍阿里云数据库InfluxDB®版已于近日正式启动商业化。云数据库InfluxDB®是基于当前最流行的开源数据库InfluxDB提供的在线数据库服务，相比较开源具有免运维，稳定可靠，可弹性伸缩的优势，广泛应用于互联网基础资源监控，容器监控，业务运营监控分析，物联网设备远程实时监控，工业安全...

代码星球 ·2021-02-24

数据库顶会VLDB论文解读：阿里数据库智能参数优化的创新与实践

一年一度的数据库领域顶级会议VLDB2019于美国当地时间8月26日-8月30日在洛杉矶召开。在本届大会上，阿里云数据库产品团队多篇论文入选ResearchTrack和IndustrialTrack。本文将对入围ResearchTrack的论文《iBTune:IndividualizedBufferTuningforL...

代码星球 ·2021-02-24

独家 | 10个数据科学家常犯的编程错误（附解决方案）

/简介：本文为资深数据科学家常见的10个错误提供解决方案。数据科学家是“比软件工程师更擅长统计学，比统计学家更擅长软件工程的人”。许多数据科学家都具有统计学背景，但是在软件工程方面的经验甚少。我是一名资深数据科学家，在Stackoverflow的python编程方面排名前1%，并与许多（初级）数据科学家共事...

代码星球 ·2021-02-24

MaxCompute 最新特性介绍 | 2019大数据技术公开课第三季

摘要：距离上一次MaxCompute新功能的线上发布已经过去了大约一个季度的时间，而在这一段时间里，MaxCompute不断地在增加新的功能和特性，比如参数化视图、UDF支持动态参数、支持分区裁剪、生成建表DDL语句功能等功能都已经得到了广大开发者的广泛使用。那么，近期MaxCompute究竟还有哪些新特性呢？本文就为...

代码星球 ·2021-02-24

阿里巴巴大数据产品最新特性介绍 | 2019大数据技术公开课第四季

本文作者：晋恒原文链接本文为云栖社区原创内容，未经允许不得转载。...

代码星球 ·2021-02-24

唱吧基于 MaxCompute 的大数据之路

使用MaxCompute之前，唱吧使用自建体系来存储处理各端收集来的日志数据，包括请求访问记录、埋点数据、服务器业务数据等。初期这套基于开源组件的体系有力支撑了数据统计、业务报表、风控等业务需求。但随着每天处理数据量的增长，积累的历史数据越来越多，来自其他部门同事的需求越来越复杂，自建体系逐渐暴露出了能力上的短板。同时...

代码星球 ·2021-02-24

从大数据到快数据数据智创未来——2019 CCF大数据与计算智能大赛正式开赛!

8月17日，以“数据驱动，智创未来”为主题的2019CCF大数据与计算智能大赛（CCFComputingIntelligenceContest，简称CCFBDCI）全球启动仪式，在北京大学正式启幕。CCFBDCI大赛是由中国计算机学会大数据专家委员会于2013年创办的国际化智能算法、创新应用和大数据系统大型挑战赛事。自...

代码星球 ·2021-02-24

只要三步！阿里云DLA帮你处理海量JSON数据

您可能有大量应用程序产生的JSON数据，您可能需要对这些JSON数据进行整理，去除不想要的字段，或者只保留想要的字段，或者仅仅是进行数据查询。那么，利用阿里云DataLakeAnalytics或许是目前能找到的云上最为便捷的达到这一目标的服务了。仅仅需要3步，就可以完成对海量JSON数据的处理，或者更为复杂的ETL流程...

代码星球 ·2021-02-24

再也不怕数据丢失！阿里云RDS MySQL 8.0上线回收站功能

背景MySQL在生产环境使用过程中，会伴随着开发和运维人员的误操作，比如DROPTABLE/DATABASE，这类DDL语句不具有可操作的回滚特性，而导致数据丢失，AliSQL8.0新特性支持回收站功能（RecycleBin），临时把删除清理的表转移到回收站，并保留可设置的时间，方便用户找回数据。为了方便，提供了DBM...

代码星球 ·2021-02-24

PAI-STUDIO通过Tensorflow处理MaxCompute表数据

PAI-STUDIO在支持OSS数据源的基础上，增加了对MaxCompute表的数据支持。用户可以直接使用PAI-STUDIO的Tensorflow组件读写MaxCompute数据，本教程将提供完整数据和代码供大家测试。为了方便用户快速上手，本文档将以训练iris数据集为例，介绍如何跑通实验。为了方便大家，我们提供了一...

代码星球 ·2021-02-24

基于Tablestore Tunnel的数据复制实战

前言数据复制主要指通过互联的网络在多台机器上保存相同数据的副本，通过数据复制方案，人们通常希望达到以下目的：1）使数据在地理位置上更接近用户，进而降低访问延迟；2）当部分组件出现故障时，系统依旧可以继续工作，提高可用性；3）扩展至多台机器以同时提供数据访问服务，从而提升读吞吐量。如果复制的数据一成不变，那么数据复制就非...

代码星球 ·2021-02-23

基于日志服务的GrowthHacking(1):数据埋点和采集(APP、Web、邮件、短信、二维码埋点技术)

在上文中，我们介绍了GrowthHacking的整体架构，其中数据采集是整个数据分析的基础，只有有了数据，才能进行有价值的分析；只有高质量的数据，才能驱动高质量的运营分析.可以说,数据质量决定了运营质量。在实际生产中，我们常常面临数据采集的痛点：数据分散在各处，有服务器日志，有前端日志，有APP日志。各种端的日志，采集...

代码星球 ·2021-02-23

Gartner：阿里云位列全球云数据库市场份额前三，数据库未来需上云

近日，国际权威研究机构Gartner发布《TheFutureoftheDatabaseManagementSystem(DBMS)MarketIsCloud》报告，鲜明指出：数据库的未来是上云，阿里云已位列全球云数据库市场份额前三。据Gartner统计，阿里云已位居全球云数据库市场份额第三，年增速在115%...

代码星球 ·2021-02-23

阿里巴巴飞天大数据架构体系与Hadoop生态系统

阿里云数据库再获学术顶会认可，一文全览VLDB最新亮点

再不懂时序就 OUT 啦！，DBengine 排名第一时序数据库，阿里云数据库 InfluxDB 正式商业化！

数据库顶会VLDB论文解读：阿里数据库智能参数优化的创新与实践

独家 | 10个数据科学家常犯的编程错误（附解决方案）

MaxCompute 最新特性介绍 | 2019大数据技术公开课第三季

阿里巴巴大数据产品最新特性介绍 | 2019大数据技术公开课第四季

唱吧基于 MaxCompute 的大数据之路

从大数据到快数据 数据智创未来——2019 CCF大数据与计算智能大赛正式开赛!

只要三步！阿里云DLA帮你处理海量JSON数据

再也不怕数据丢失！阿里云RDS MySQL 8.0上线回收站功能

PAI-STUDIO通过Tensorflow处理MaxCompute表数据

基于Tablestore Tunnel的数据复制实战

基于日志服务的GrowthHacking(1):数据埋点和采集(APP、Web、邮件、短信、二维码埋点技术)

Gartner：阿里云位列全球云数据库市场份额前三，数据库未来需上云

从大数据到快数据数据智创未来——2019 CCF大数据与计算智能大赛正式开赛!