#大数

数据分析与大数据分析的区别

数据分析是指采用恰当的统计分析方法对收集来的大量数据进行分析,提取出有用信息同时形成结论,即对数据加以详细研究和概括总结的过程。数据分析需要掌握数学知识和分析工具,数学知识包含统计学、概率论和数理统计、多元统计分析、时间序列、数据挖掘;工具一般应该掌握Excel、SQL、R、Python等。需要学习掌握基本数据处理及分...
开发笔记 ·2023-03-23

大数据,数据挖掘,机器学习的区别

指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。本质上就是让计算机自己在数据中学习规律,并根据所得到的规律对未来数据进行预测。机器学习包括如聚类、分类、决策树、贝叶斯、神经网络、深度学习(DeepL...

大数据4v是指哪四个

"大数据具有“4V”特性:1.数据量大(Volume):大数据的起始计量单位是PB(1024TB)、EB(1024PB,约100万TB)或ZB(1024EB,约10亿TB),未来甚至会达到YB(1024ZB)或BB(1024YB)。2.数据多样性(Variety):大数据类型繁多,包括...
开发笔记 ·2023-03-01

大数据毕业后去什么岗位就业?

1、大数据开发工程师大数据开发工程师,很多公司都在招聘的热门技术人才,工资也是相对于其他方向更高一些。想要成为大数据开发工程师需要掌握计算机技术、hadoop、spark、storm开发、hive数据库、Linux操作系统等知识,具备分布式存储、分布式计算框架等技术。2、大数据分析师大数据分析师是数据师的一种,指的是不...

大数据要学什么

大数据要学统计学、数学、计算机等三大支撑性学科,还有生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。  基础课程分为数学分析、高等代数、普通物理数学与信息科学概论、数据结构、数据科学导论、程序设计导论、程序设计实践。  必修课分为离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概述、计算机系...
开发笔记 ·2022-10-31

大数据分析工具有哪些

BI工具分为开源BI工具和商业BI工具两大类。开源BI工具有:Superset、Redash、Metabase、CBoard、Davinci、SpagoBI、Pentaho等等;商业BI工具有:FineBI、QlikView、Tableau、PowerBI、SmartBI、QuickBI等等。...
开发笔记 ·2022-10-18

大数据专业是干什么的

属于计算机专业,通俗讲的人工智能。 ...
开发笔记 ·2022-05-04

大数据上云第一课:(1)MaxCompute授权和外表操作躲坑指南

如果您是第一次使用子账号登录数加平台和使用DataWorks,需要确认以下信息:该子账号所属主账号的企业别名。该子账号的用户名和密码。该子账号的AccessKeyID和AccessKeySecret。确认主账号已经允许子账号启用控制台登录。确认主账号已经允许子账号自主管理AccessKey。1、子账号创建(1)创建子账...

Fuxi2.0—飞天大数据平台调度系统全面升级,首次亮相2019双十一

伏羲(Fuxi)是十年前创立飞天平台时的三大服务之一(分布式存储Pangu,分布式计算ODPS,分布式调度Fuxi),当时的设计初衷是为了解决大规模分布式资源的调度问题(本质上是多目标的最优匹配问题)。随着阿里经济体和阿里云业务需求(尤其是双十一)的不断丰富,伏羲的内涵也不断扩大,从单一的资源调度器(对标开源系统的YA...

实战课堂 | 让大数据分析更简单,4步教你玩转MongoDB BI Connector

MongoDB使用BIConnector支持BI组件直接使用SQL或ODBC数据源方式直接访问MongoDB,在早期MongoDB直接使用PostgresqlFDW实现SQL到MQL的转换,后来实现更加轻量级的mongosqld支持BI工具的连接。参考 InstallBIConnectorhttps://do...

阿里风控大脑关于大数据应用的探索与实践

以下内容根据演讲视频以及PPT整理而成。本次分享主要围绕以下三个方面:一、阿里风控大脑整体介绍二、近线引擎三、离线引擎1.阿里风控大脑是什么?阿里的风控主要分为两大块。一块是金融领域,主要业务是支付宝,另一块是非金融领域,如新零售、高德、大文娱等,我们负责的主要是非金融领域。阿里风控大脑的含义较为丰富,可以有不同的解读...

阿里经济体大数据平台的建设与思考

本文内容根据演讲视频以及PPT整理而成。首先从双11说起,双11已经成为阿里巴巴最大的单日促销活动。双11活动可能对于消费者而言只是一天而已,但是对于阿里巴巴和数百万商家而言,却是一个非常长线的工作。站在阿里巴巴的角度来看双11,其实无论是从业务线还是技术线,背后都存在着很多的思考。从“人、货、场”的角度看待双11。首...

阿里巴巴集团副总裁贾扬清:开源大数据生态前瞻

/简介: 本文整理自开源大数据专场中阿里巴巴集团副总裁,阿里巴巴计算平台事业部总裁贾扬清先生的精彩演讲,将为大家讲述开源大数据与人工智能生态前瞻,分享阿里云对开源的态度,以及对大数据和人工智能的未来规划。2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基...

什么是飞天?全球级大数据计算平台,自主研发!

又一个注定载入史册的日子!7月25日。又一个注定让人更有底气的核心科技!阿里云飞天大数据平台!这是目前国内规模最大的计算平台,当然也是全球级的。它可以扩展到10万台计算集群,用通俗的比喻,就相当于把10万台计算机组成一个巨大的计算力池子,当成一台超级计算机来使用;单日数据处理量超过600PB,相当于6亿部高清的电影。大...

王坚十年前的坚持,才有了今天世界顶级大数据计算平台MaxCompute

如果说十年前,王坚创立阿里云让云计算在国内得到了普及,那么王坚带领团队自主研发的大数据计算平台MaxCompute则推动大数据技术向前跨越了一大步。数据是企业的核心资产,但十年前阿里巴巴的算力已经无法满足当时急剧增长数据量的需求。基于Hadoop搭建集群是当时解决大规模数据计算的主流方案,Hadoop生态已经比较成熟,...
首页上一页12345...下一页尾页