ADO主题的文章列表，还有ADO的技术要点_第36页

大数据架构开发挖掘分析 Hadoop HBase Hive Flume ZooKeeper Storm Kafka Redis MongoDB Scala Spark 机器学习 Docker 虚拟化

第一阶段Java基础Linux基础第二阶段Hadoop第三阶段HBaseHiveSqoopFlumeZooKeeperStormKafkaRedisMongoDB第四阶段ScalaSpark机器学习第五阶段DockerKVM虚拟化OpenStack搜索引擎与爬虫第六阶段综合项目演练...

代码星球 ·2020-04-05

大数据分析- 基于Hadoop/Mahout的大数据挖掘

转载：https://blog.csdn.net/tcict/article/details/25955373随着互联网、移动互联网和物联网的发展，我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合，对大数据的分析已经成为一个非常重要且紧迫的需求。目前对...

代码星球 ·2020-04-05

hadoop 之Mahout 数据挖掘

转载：https://blog.csdn.net/u013378306/article/details/87179289Mahout仅提供一些java的算法包，通过Mahout执行这些算法包，并把hdfs上的文件作为输入可以在hadoop上做分布式计算提供的常用算法Mahout提供了常用算法的程序库，可以基于分布式做数...

代码星球 ·2020-04-05

【Hadoop入门学习系列之六】HBase基本架构、编程模型和应用案例

转载：https://blog.csdn.net/shengmingqijiquan/article/details/52922009HBase是一个构建在HDFS上的分布式列存储系统；HBase是ApacheHadoop生态系统中的重要一员，主要用于海量结构化数据存储；从逻辑上讲，HBase将数据按照表、行和列进行存...

代码星球 ·2020-04-05

【Hadoop入门学习系列之五】MapReduce 2.0编程实战

转载：https://blog.csdn.net/shengmingqijiquan/article/details/52916664一.MapReduce2.0编程模型关于MR编程模型请参考上一篇：【Hadoop入门学习系列之四】MapReduce2.0应用场景和原理、基本架构和编程模型二.MapReduce2.0编...

代码星球 ·2020-04-05

【Hadoop入门学习系列之四】MapReduce 2.0应用场景和原理、基本架构和编程模型

一.MapReduce的应用场景1.MapReduce特点易于编程良好的扩展性高容错性适合PB级以上海量数据的离线处理备注：*MR的最后一个特性就注定了它的应用场景的特定性，专门为处理离线批量大数据*而生。问：那MR不擅长什么啊？它不擅长的东西谁比较擅长呢？2.MapReduce的特色—不擅长的方面...

代码星球 ·2020-04-05

Hadoop之HDFS的Shell脚本命令总结

https://www.cppentry.com/bencandy.php?fid=115&id=223457一、HDFS的Shell的基本概念1.调用文件系统(FS)Shell命令应使用bin/hadoopfs命令或 bin/hdfsdfs 命令的形式。[为了简便，一般将bin目录添加到p...

代码星球 ·2020-04-05

Hadoop生态系统以及版本衍化

转：https://blog.csdn.net/yan_qinglong/article/details/11618767Hadoop生态系统以及版本衍化hadoop生态系统特点 1、源代码开源(免费) 2、社区活跃、参与者众多 ...

代码星球 ·2020-04-05

Hadoop YARN：调度性能优化实践(转)

https://tech.meituan.com/2019/08/01/hadoop-yarn-scheduling-performance-optimization-practice.html 文章对性能优化的思路，如果评测性能，找到性能瓶颈，优化，优化效果评估，上线部署给出了很好的教科书式的案例，值得一看...

代码星球 ·2020-04-05

spark使用hadoop native库

默认情况下，hadoop官方发布的二进制包是不包含native库的，native库是用C++实现的，用于进行一些CPU密集型计算，如压缩。比如apachekylin在进行预计算时为了减少预计算的数据占用的磁盘空间，可以配置使用压缩格式。默认情况下，启动spark-shell,会有无法加载native库的警告：19/02...

代码星球 ·2020-04-05

hadoop学习笔记系列（收藏)

https://www.cnblogs.com/edisonchou/category/542546.html...

代码星球 ·2020-04-05

hadoop1.2.1三种模式配置

1.本地模式本地模式的安装将hadoop安装包解压后不用任何配置就是默认的本地模式此时core-site.xml,hdfs-site.xml,marped.site.xml三个配置文件都为空此时没有hdfs文件系统，可以执行mapreducehadoopfs-ls/会列出本地的linux文件系统 2.伪分布式...

代码星球 ·2020-04-05

hadoop1.2.1 伪分布式配置

主要配置core-site.xml hdfs-site.xml mapred-site.xml ...

代码星球 ·2020-04-05

Hadoop笔记

1.Hive支持行级别的查询，数据更新，不支持多行事务；2.Hive有两种数据库，Derby内置的mysql或其他 3.连接MySQL时，需要将mysql-jdbc的驱动包放入hive的lib目录下4.变量和属性四种命名空间： hivavar:用户自定义变量空间&...

代码星球 ·2020-04-05

hadoop 权限错误 Permission denied: user=root, access=WRITE, inode="/":hdfs:super

关于不能执行Hadoop命令并报权限问题执行错误1、Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-xmkdir: Permission ...

代码星球 ·2020-04-05

大数据架构开发 挖掘分析 Hadoop HBase Hive Flume ZooKeeper Storm Kafka Redis MongoDB Scala Spark 机器学习 Docker 虚拟化

大数据分析- 基于Hadoop/Mahout的大数据挖掘

hadoop 之Mahout 数据挖掘

【Hadoop入门学习系列之六】HBase基本架构、编程模型和应用案例

【Hadoop入门学习系列之五】MapReduce 2.0编程实战

【Hadoop入门学习系列之四】MapReduce 2.0应用场景和原理、基本架构和编程模型

Hadoop之HDFS的Shell脚本命令总结

Hadoop生态系统以及版本衍化

Hadoop YARN：调度性能优化实践(转)

spark使用hadoop native库

hadoop学习笔记系列（收藏)

hadoop1.2.1三种模式配置

hadoop1.2.1 伪分布式配置

Hadoop笔记

hadoop 权限错误 Permission denied: user=root, access=WRITE, inode="/":hdfs:super

大数据架构开发挖掘分析 Hadoop HBase Hive Flume ZooKeeper Storm Kafka Redis MongoDB Scala Spark 机器学习 Docker 虚拟化