Ax主题的文章列表，还有Ax的技术要点_第31页

如何制作可以在 MaxCompute 上使用的 crcmod

之前我们介绍过在PyODPSDataFrame中使用三方包。对于二进制包而言，MaxCompute要求使用包名包含cp27-cp27m的Wheel包。但对于部分长时间未更新的包，例如oss2依赖的crcmod，PyPI并未提供Wheel包，因而需要自行打包。本文介绍了如何使用quay.io/pypa/manylinux...

代码星球·2021-02-24

maxcompute 2.0复杂数据类型之array

1.含义类似于Java中的array。有序、可重复。2.场景什么样的数据，适合使用array类型来存储呢？这里列举了几个我在开发中实际用到的场景。2.1标签类的数据为什么说标签类数据适合使用array类型呢？（1）标签一般是一个只有key、没有value的结构；（2）标签的数量（枚举值个数）会非常多；（3）标签的变化会...

代码星球·2021-02-24

jQuery ajax模板

$.ajax({url:'',type:'POST',//GETasync:true,//或false,是否异步data:{name:'llc',age:22},timeout:5000,//超时时间dataType:'json',//返回的数据格式：json/xml/html/script/jsonp/textbef...

代码星球·2021-02-24

阿里云MaxCompute 2019-8月刊

您好，MaxCompute 2019.8月刊为您带来8月产品、技术最新动态，欢迎阅读。导读【重要发布】8月产品重要发布【文档更新】8月重要文档更新推荐【干货精选】8月精选技术文章推荐【精彩活动技术干货】8月重要活动回顾及技术干货整理【重要发布】8月产品重要发布1.MaxCompute存储降价查看详...

代码星球·2021-02-24

MaxCompute问答整理之8月

本文是基于对MaxCompute产品的学习进度，再结合开发者社区里面的一些问题，进而整理成文。希望对大家有所帮助。问题一、通过数据源数据增量同步后，如何查看某一条数据具体被同步到MaxCompute中的时间？不支持，查看不了，可以看表元数据的LastModifiedTime时间，但具体某个记录看不到时间。问题二、开发的...

代码星球·2021-02-24

MaxCompute 最新特性介绍 | 2019大数据技术公开课第三季

摘要：距离上一次MaxCompute新功能的线上发布已经过去了大约一个季度的时间，而在这一段时间里，MaxCompute不断地在增加新的功能和特性，比如参数化视图、UDF支持动态参数、支持分区裁剪、生成建表DDL语句功能等功能都已经得到了广大开发者的广泛使用。那么，近期MaxCompute究竟还有哪些新特性呢？本文就为...

代码星球·2021-02-24

唱吧基于 MaxCompute 的大数据之路

使用MaxCompute之前，唱吧使用自建体系来存储处理各端收集来的日志数据，包括请求访问记录、埋点数据、服务器业务数据等。初期这套基于开源组件的体系有力支撑了数据统计、业务报表、风控等业务需求。但随着每天处理数据量的增长，积累的历史数据越来越多，来自其他部门同事的需求越来越复杂，自建体系逐渐暴露出了能力上的短板。同时...

代码星球·2021-02-24

PAI-STUDIO通过Tensorflow处理MaxCompute表数据

PAI-STUDIO在支持OSS数据源的基础上，增加了对MaxCompute表的数据支持。用户可以直接使用PAI-STUDIO的Tensorflow组件读写MaxCompute数据，本教程将提供完整数据和代码供大家测试。为了方便用户快速上手，本文档将以训练iris数据集为例，介绍如何跑通实验。为了方便大家，我们提供了一...

代码星球·2021-02-24

利用InformationSchema与阿里云交易和账单管理API实现MaxCompute费用对账分摊统计

利用MaxComputeInformationSchema与阿里云交易和账单管理API实现MaxCompute费用对账分摊统计很多的企业用户选择MaxCompute按量付费模式构建自己的数据平台，利用MaxCompute按作业付费的计费模型，在获得高性能的同时避免"IDLE"状态的不必要资源费用支出，仅为实际使用付费。...

代码星球·2021-02-24

MaxCompute 费用暴涨之存储压缩率降低导致SQL输入量变大

现象：同样的SQL，每天处理的数据行数差不多，但是费用突然暴涨甚至会翻数倍。分析：我们先明确MaxComputeSQL后付费的计费公式：一条SQL执行的费用=扫描输入量️SQL复杂度️0.3(￥/GB)。变量主要是输入量和复杂度，如果SQL没有变更的情况下复杂度度也没有变化，那么费用上涨主要原因就是输入量增加，因此我们...

代码星球·2021-02-23

Kafka数据迁移MaxCompute最佳实践

/摘要：本文向您详细介绍如何使用DataWorks数据同步功能，将Kafka集群上的数据迁移到阿里云MaxCompute大数据计算服务。搭建Kafka集群进行数据迁移前，您需要保证自己的Kafka集群环境正常。本文使用阿里云EMR服务自动化搭建Kafka集群，详细过程请参见：Kafka快速入门。本文使用的E...

代码星球·2021-02-23

MaxCompute 预付费标准版VS套餐版

MaxCompute于5月7日正式售卖预付费（包年包月）套餐资源，主打存储密集型套餐，一共三个套餐：存储密集型160套餐存储密集型320套餐存储密集型600套餐本文主要给大家介绍预付标准版和套餐版的资源、售价以及两者对比的情况，以供大家选购时进行参考。标准版购买后只包含计算资源，具体如下规格类型计算资源（CU）存储资源...

代码星球·2021-02-23

从 Spark 到 Kubernetes — MaxCompute 的云原生开源生态实践之路

2019年5月14日，喜提浙江省科学技术进步一等奖的 MaxCompute 是阿里巴巴自研的EB级大数据计算平台。该平台依托阿里云飞天基础架构，是阿里巴巴在10年前做飞天系统的三大件之分布式计算部分。10年后的今天，MaxCompute已经是可以承载EB级的数据存储能力，百PB级的单日计算能力，公共...

代码星球·2021-02-23

解决大数据难题阿里云MaxCompute获科技大奖

/摘要：据介绍，MaxCompute（大规模分布式的数据计算平台）是国内最早自研的大数据计算平台之一，主要应用于大规模数据处理场景。目前，这项源自浙江、解决世界级难题的成果已拥有EB（百京）级别的数据存储能力、百PB（千兆）级的单日计算能力。今日浙江省科学技术奖励大会正式召开，阿里云自研大数据计算平台Max...

代码星球·2021-02-23

使用DataX同步MaxCompute数据到TableStore（原OTS）优化指南

概述现在越来越多的技术架构下会组合使用MaxCompute和TableStore，用MaxCompute作大数据分析，计算的结果会导出到TableStore提供在线访问。MaxCompute提供海量数据计算的能力，而TableStore提供海量数据高并发低延迟读写的能力。将 MaxCompute内数据导出至T...

代码星球·2021-02-23

如何制作可以在 MaxCompute 上使用的 crcmod

maxcompute 2.0复杂数据类型之array

jQuery ajax模板

阿里云MaxCompute 2019-8月刊

MaxCompute问答整理之8月

MaxCompute 最新特性介绍 | 2019大数据技术公开课第三季

唱吧基于 MaxCompute 的大数据之路

PAI-STUDIO通过Tensorflow处理MaxCompute表数据

利用InformationSchema与阿里云交易和账单管理API实现MaxCompute费用对账分摊统计

MaxCompute 费用暴涨之存储压缩率降低导致SQL输入量变大

Kafka数据迁移MaxCompute最佳实践

MaxCompute 预付费标准版VS套餐版

从 Spark 到 Kubernetes — MaxCompute 的云原生开源生态实践之路

解决大数据难题 阿里云MaxCompute获科技大奖

使用DataX同步MaxCompute数据到TableStore（原OTS）优化指南

解决大数据难题阿里云MaxCompute获科技大奖