51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#ADO
大数据架构开发 挖掘分析 Hadoop HBase Hive Flume ZooKeeper Storm Kafka Redis MongoDB Scala Spark 机器学习 Docker 虚拟化
第一阶段Java基础Linux基础第二阶段Hadoop第三阶段HBaseHiveSqoopFlumeZooKeeperStormKafkaRedisMongoDB第四阶段ScalaSpark机器学习第五阶段DockerKVM虚拟化OpenStack搜索引擎与爬虫第六阶段综合项目演练...
代码星球
·
2020-04-05
数据
架构
开发
挖掘
分析
大数据分析- 基于Hadoop/Mahout的大数据挖掘
转载:https://blog.csdn.net/tcict/article/details/25955373随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。目前对...
代码星球
·
2020-04-05
数据分析
基于
Hadoop
Mahout
数据挖掘
hadoop 之Mahout 数据挖掘
转载:https://blog.csdn.net/u013378306/article/details/87179289Mahout仅提供一些java的算法包,通过Mahout执行这些算法包,并把hdfs上的文件作为输入可以在hadoop上做分布式计算提供的常用算法Mahout提供了常用算法的程序库,可以基于分布式做数...
代码星球
·
2020-04-05
hadoop
Mahout
数据挖掘
【Hadoop入门学习系列之六】HBase基本架构、编程模型和应用案例
转载:https://blog.csdn.net/shengmingqijiquan/article/details/52922009HBase是一个构建在HDFS上的分布式列存储系统;HBase是ApacheHadoop生态系统中的重要一员,主要用于海量结构化数据存储;从逻辑上讲,HBase将数据按照表、行和列进行存...
代码星球
·
2020-04-05
Hadoop
入门
学习
系列
之六
【Hadoop入门学习系列之五】MapReduce 2.0编程实战
转载:https://blog.csdn.net/shengmingqijiquan/article/details/52916664一.MapReduce2.0编程模型关于MR编程模型请参考上一篇:【Hadoop入门学习系列之四】MapReduce2.0应用场景和原理、基本架构和编程模型二.MapReduce2.0编...
代码星球
·
2020-04-05
Hadoop
入门
学习
系列
之五
【Hadoop入门学习系列之四】MapReduce 2.0应用场景和原理、基本架构和编程模型
一.MapReduce的应用场景1.MapReduce特点易于编程良好的扩展性高容错性适合PB级以上海量数据的离线处理备注:*MR的最后一个特性就注定了它的应用场景的特定性,专门为处理离线批量大数据*而生。问:那MR不擅长什么啊?它不擅长的东西谁比较擅长呢?2.MapReduce的特色—不擅长的方面...
代码星球
·
2020-04-05
Hadoop
入门
学习
系列
之四
Hadoop之HDFS的Shell脚本命令总结
https://www.cppentry.com/bencandy.php?fid=115&id=223457一、HDFS的Shell的基本概念1.调用文件系统(FS)Shell命令应使用bin/hadoopfs命令或 bin/hdfsdfs 命令的形式。[为了简便,一般将bin目录添加到p...
代码星球
·
2020-04-05
Hadoop
HDFS
Shell
脚本
命令
Hadoop生态系统以及版本衍化
转:https://blog.csdn.net/yan_qinglong/article/details/11618767Hadoop生态系统以及版本衍化hadoop生态系统特点 1、源代码开源(免费) 2、社区活跃、参与者众多 ...
代码星球
·
2020-04-05
Hadoop
生态系统
以及
版本
衍化
Hadoop YARN:调度性能优化实践(转)
https://tech.meituan.com/2019/08/01/hadoop-yarn-scheduling-performance-optimization-practice.html 文章对性能优化的思路,如果评测性能,找到性能瓶颈,优化,优化效果评估,上线部署给出了很好的教科书式的案例,值得一看...
代码星球
·
2020-04-05
Hadoop
YARN
调度
性能
优化
spark使用hadoop native库
默认情况下,hadoop官方发布的二进制包是不包含native库的,native库是用C++实现的,用于进行一些CPU密集型计算,如压缩。比如apachekylin在进行预计算时为了减少预计算的数据占用的磁盘空间,可以配置使用压缩格式。默认情况下,启动spark-shell,会有无法加载native库的警告:19/02...
代码星球
·
2020-04-05
spark
使用
hadoop
native
hadoop学习笔记系列(收藏)
https://www.cnblogs.com/edisonchou/category/542546.html...
代码星球
·
2020-04-05
hadoop
学习
笔记
系列
收藏
hadoop1.2.1三种模式配置
1.本地模式本地模式的安装将hadoop安装包解压后不用任何配置就是默认的本地模式此时core-site.xml,hdfs-site.xml,marped.site.xml三个配置文件都为空此时没有hdfs文件系统,可以执行mapreducehadoopfs-ls/会列出本地的linux文件系统 2.伪分布式...
代码星球
·
2020-04-05
hadoop1.2.1
三种
模式
配置
hadoop1.2.1 伪分布式配置
主要配置core-site.xml hdfs-site.xml mapred-site.xml ...
代码星球
·
2020-04-05
hadoop1.2.1
分布式
配置
Hadoop笔记
1.Hive支持行级别的查询,数据更新,不支持多行事务;2.Hive有两种数据库,Derby内置的mysql或其他 3.连接MySQL时,需要将mysql-jdbc的驱动包放入hive的lib目录下4.变量和属性 四种命名空间: hivavar:用户自定义变量空间&...
代码星球
·
2020-04-05
Hadoop
笔记
hadoop 权限错误 Permission denied: user=root, access=WRITE, inode="/":hdfs:super
关于不能执行Hadoop命令 并报权限问题执行错误1、Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-xmkdir: Permission ...
代码星球
·
2020-04-05
quot
hadoop
权限
错误
Permission
首页
上一页
...
34
35
36
37
38
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他