51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#oop
【Hadoop入门学习系列之六】HBase基本架构、编程模型和应用案例
转载:https://blog.csdn.net/shengmingqijiquan/article/details/52922009HBase是一个构建在HDFS上的分布式列存储系统;HBase是ApacheHadoop生态系统中的重要一员,主要用于海量结构化数据存储;从逻辑上讲,HBase将数据按照表、行和列进行存...
代码星球
·
2020-04-05
Hadoop
入门
学习
系列
之六
【Hadoop入门学习系列之五】MapReduce 2.0编程实战
转载:https://blog.csdn.net/shengmingqijiquan/article/details/52916664一.MapReduce2.0编程模型关于MR编程模型请参考上一篇:【Hadoop入门学习系列之四】MapReduce2.0应用场景和原理、基本架构和编程模型二.MapReduce2.0编...
代码星球
·
2020-04-05
Hadoop
入门
学习
系列
之五
【Hadoop入门学习系列之四】MapReduce 2.0应用场景和原理、基本架构和编程模型
一.MapReduce的应用场景1.MapReduce特点易于编程良好的扩展性高容错性适合PB级以上海量数据的离线处理备注:*MR的最后一个特性就注定了它的应用场景的特定性,专门为处理离线批量大数据*而生。问:那MR不擅长什么啊?它不擅长的东西谁比较擅长呢?2.MapReduce的特色—不擅长的方面...
代码星球
·
2020-04-05
Hadoop
入门
学习
系列
之四
Hadoop之HDFS的Shell脚本命令总结
https://www.cppentry.com/bencandy.php?fid=115&id=223457一、HDFS的Shell的基本概念1.调用文件系统(FS)Shell命令应使用bin/hadoopfs命令或 bin/hdfsdfs 命令的形式。[为了简便,一般将bin目录添加到p...
代码星球
·
2020-04-05
Hadoop
HDFS
Shell
脚本
命令
Hadoop生态系统以及版本衍化
转:https://blog.csdn.net/yan_qinglong/article/details/11618767Hadoop生态系统以及版本衍化hadoop生态系统特点 1、源代码开源(免费) 2、社区活跃、参与者众多 ...
代码星球
·
2020-04-05
Hadoop
生态系统
以及
版本
衍化
Hadoop YARN:调度性能优化实践(转)
https://tech.meituan.com/2019/08/01/hadoop-yarn-scheduling-performance-optimization-practice.html 文章对性能优化的思路,如果评测性能,找到性能瓶颈,优化,优化效果评估,上线部署给出了很好的教科书式的案例,值得一看...
代码星球
·
2020-04-05
Hadoop
YARN
调度
性能
优化
sqoop import mysql to hive table:GC overhead limit exceeded
1.ScenariodescriptionwhenIusesqooptoimportmysqltableintohive,Igotthefollowingerror:19/07/1215:41:35WARNhcat.SqoopHCatUtilities:TheSqoopjobcanfailiftypesarenotas...
代码星球
·
2020-04-05
sqoop
import
mysql
to
hive
spark使用hadoop native库
默认情况下,hadoop官方发布的二进制包是不包含native库的,native库是用C++实现的,用于进行一些CPU密集型计算,如压缩。比如apachekylin在进行预计算时为了减少预计算的数据占用的磁盘空间,可以配置使用压缩格式。默认情况下,启动spark-shell,会有无法加载native库的警告:19/02...
代码星球
·
2020-04-05
spark
使用
hadoop
native
hadoop学习笔记系列(收藏)
https://www.cnblogs.com/edisonchou/category/542546.html...
代码星球
·
2020-04-05
hadoop
学习
笔记
系列
收藏
hadoop1.2.1三种模式配置
1.本地模式本地模式的安装将hadoop安装包解压后不用任何配置就是默认的本地模式此时core-site.xml,hdfs-site.xml,marped.site.xml三个配置文件都为空此时没有hdfs文件系统,可以执行mapreducehadoopfs-ls/会列出本地的linux文件系统 2.伪分布式...
代码星球
·
2020-04-05
hadoop1.2.1
三种
模式
配置
hadoop1.2.1 伪分布式配置
主要配置core-site.xml hdfs-site.xml mapred-site.xml ...
代码星球
·
2020-04-05
hadoop1.2.1
分布式
配置
Hadoop笔记
1.Hive支持行级别的查询,数据更新,不支持多行事务;2.Hive有两种数据库,Derby内置的mysql或其他 3.连接MySQL时,需要将mysql-jdbc的驱动包放入hive的lib目录下4.变量和属性 四种命名空间: hivavar:用户自定义变量空间&...
代码星球
·
2020-04-05
Hadoop
笔记
hadoop 权限错误 Permission denied: user=root, access=WRITE, inode="/":hdfs:super
关于不能执行Hadoop命令 并报权限问题执行错误1、Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-xmkdir: Permission ...
代码星球
·
2020-04-05
quot
hadoop
权限
错误
Permission
Hadoop集群安装配置教程_Hadoop2.6.0_Ubuntu/CentOS
为了方便新手入门,我们准备了两篇不同系统的Hadoop伪分布式配置教程。但其他Hadoop教程我们将不再区分,可同时适用于Ubuntu和CentOS/RedHat系统。例如本教程以Ubuntu系统为主要演示环境,但对Ubuntu/CentOS的不同配置之处、CentOS6.x与CentOS7的操作区别等都会尽量给出注明...
代码星球
·
2020-04-05
Hadoop
集群
安装
配置
教程
Hadoop安装教程_单机/伪分布式配置
本教程使用 CentOS6.432位 作为系统环境,请自行安装系统(可参考使用VirtualBox安装CentOS)。如果用的是Ubuntu系统,请查看相应的 Ubuntu安装Hadoop教程。本教程基于原生Hadoop2,在 Hadoop2.6.0(stable) 版...
代码星球
·
2020-04-05
Hadoop
安装
教程
单机
分布式
首页
上一页
...
32
33
34
35
36
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他