51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#hadoop
Hadoop框架
1、Hadoop的整体框架Hadoop由HDFS、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统HDFS(HadoopDistributedFileSystem)来执行MapReduce程序的MapReduce引擎。(1)Pig...
代码星球
·
2020-04-18
Hadoop
框架
Hadoop学习笔记(1) ——菜鸟入门
Hadoop学习笔记(1)——菜鸟入门Hadoop是什么?先问一下百度吧:【百度百科】一个分布式系统基础架构,由Apache基金会所开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistrib...
代码星球
·
2020-04-18
Hadoop
学习
笔记
菜鸟
入门
Hadoop Federation联邦
单NameNode的架构使得HDFS在集群扩展性和性能上都有潜在的问题,当集群大到一定程度后,NameNode进程使用的内存可能会达到上百G,NameNode成为了性能的瓶颈。因而提出了namenode水平扩展方案--Federation。 Federation中文意思为联邦,联盟,是NameNode的Feder...
代码星球
·
2020-04-14
Hadoop
Federation
联邦
hadoop中,combine、partition、shuffle作用分别是什么?
combine和partition都是函数,中间的步骤应该只有shuffle!combine分为map端和reduce端,作用是把同一个key的键值对合并在一起,可以自定义的。combine函数把一个map函数产生的<key,value>对(多个key,value)合并成一个新的<key2,value...
代码星球
·
2020-04-14
hadoop
combine
partition
shuffle
作用
Hadoop的下载和安装
Apache的Hadoop是一个开源的、可靠的、可扩展的系统架构,可利用分布式架构来存储海量数据,以及实现分布式的计算。 Hadoop许使用简单的编程模型在计算机集群中对大型数据集进行分布式处理。可以从单个服务器扩展到数千台机器, 每个机器都提供本地计算和存储,而不是依靠硬件来提供高可用性。 ...
代码星球
·
2020-04-13
Hadoop
下载和
安装
RHadoop计算平台搭建
原创文章,转载请注明:转载自www.cnblogs.com/tovin/p/3824554.html 本文基于CentOS6.4系统介绍基于RHadoop平台的搭建,Hadoop的搭建可以参考http://www.cnblogs.com/tovin/p/3818908.html,以下着重介绍在Ha...
代码星球
·
2020-04-12
RHadoop
计算
平台
搭建
Hadoop 权威指南学习1 (主要框架)
1.Hadoop最出名的是 MapReduce和HDFS,不过也有很多其他有用的子项目。 技术栈如下: Core 一系列分布式文件系统和通用I/O的组件和接口(序列化、JavaRPC和持久化数据结构)Avro 一种提供高效、跨语言RP...
代码星球
·
2020-04-11
Hadoop
权威
指南
学习
主要
hadoop/hdfs/yarn 详细命令搬运
转载自文章 http://www.cnblogs.com/davidwang456/p/5074108.html 安装完hadoop后,在hadoop的bin目录下有一系列命令:container-executorhadoophadoop.cmdhdfshdfs.cmdmapredmapred.cm...
代码星球
·
2020-04-11
hadoop
hdfs
yarn
详细
命令
Hadoop 学习笔记3 Develping MapReduce
小笔记:Mavon是一种项目管理工具,通过xml配置来设置项目信息。MavonPOM(projectofmodel). Steps:1.setupandconfigurethedevelopmentenvironment.2. writingyourmap andreducefunctio...
代码星球
·
2020-04-11
Hadoop
学习
笔记
Develping
MapReduce
Hadoop 权威指南学习2 (Sqoop)
6.SqoopApachesqoopisanopensourcetoolthatallowuserstoextractdatafromstructureddatastoreintoHadooporback.1)runself: $SQOOP_HOME/bin/sqoopst...
代码星球
·
2020-04-11
Hadoop
权威
指南
学习
Sqoop
Hadoop调度器
一、FIFO调度器(先进先出调度)上图为FIFO调度器的执行过程示意图。FIFOScheduler是最简单也是最容易理解的调度器,它缺点是不适用于共享集群。大的应用可能会占用所有集群资源,这就导致其它应用被阻塞。在共享集群中,更适合采用CapacityScheduler或FairScheduler,这两个调度器都允许大...
代码星球
·
2020-04-08
Hadoop
调度
Hadoop Shell命令
调用文件系统(FS)Shell命令应使用 bin/hadoopfs<args>的形式。所有的的FSshell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和...
代码星球
·
2020-04-08
Hadoop
Shell
命令
hadoop全分布式的搭建
修改主机名:vim/etc/sysconfig/network 1修改hadoop-env.sh 2修改core-site.xml /hadoop/tmpdir:产生namenode中fsimasage和edits文件合并元数据3修改hdfs-site....
代码星球
·
2020-04-08
hadoop
分布式
搭建
hadoop伪分布式环境搭建
1.关防火墙2.设置IP地址3.设置network文件hosts映射文件4.安装jdk5.安装hadoop6.配置hadoop:hadoop-env.sh、core-site.xml、hdfs-site.xml、Mapred-site.xml、yarn-site.xml 1.1重启网卡(命名行重启)1.2机器...
代码星球
·
2020-04-08
hadoop
分布式
环境
搭建
给用户配置hadoop权限
参考文献:https://my.oschina.net/hetiangui/blog/143364root登入集群后:chown-Rnewday:newday/usr/local/hadoop//我的yong用户名是newday,集群的安装目录是/usr/local/hadoopmkdir/tmp/hadoopfile...
代码星球
·
2020-04-08
给用户
配置
hadoop
权限
首页
上一页
...
17
18
19
20
21
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他