#hadoop

Hadoop框架

1、Hadoop的整体框架Hadoop由HDFS、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统HDFS(HadoopDistributedFileSystem)来执行MapReduce程序的MapReduce引擎。(1)Pig...
代码星球 ·2020-04-18

Hadoop学习笔记(1) ——菜鸟入门

Hadoop学习笔记(1)——菜鸟入门Hadoop是什么?先问一下百度吧:【百度百科】一个分布式系统基础架构,由Apache基金会所开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistrib...

Hadoop Federation联邦

  单NameNode的架构使得HDFS在集群扩展性和性能上都有潜在的问题,当集群大到一定程度后,NameNode进程使用的内存可能会达到上百G,NameNode成为了性能的瓶颈。因而提出了namenode水平扩展方案--Federation。  Federation中文意思为联邦,联盟,是NameNode的Feder...
代码星球 ·2020-04-14

hadoop中,combine、partition、shuffle作用分别是什么?

combine和partition都是函数,中间的步骤应该只有shuffle!combine分为map端和reduce端,作用是把同一个key的键值对合并在一起,可以自定义的。combine函数把一个map函数产生的<key,value>对(多个key,value)合并成一个新的<key2,value...

Hadoop的下载和安装

    Apache的Hadoop是一个开源的、可靠的、可扩展的系统架构,可利用分布式架构来存储海量数据,以及实现分布式的计算。    Hadoop许使用简单的编程模型在计算机集群中对大型数据集进行分布式处理。可以从单个服务器扩展到数千台机器,    每个机器都提供本地计算和存储,而不是依靠硬件来提供高可用性。    ...
代码星球 ·2020-04-13

RHadoop计算平台搭建

 原创文章,转载请注明:转载自www.cnblogs.com/tovin/p/3824554.html 本文基于CentOS6.4系统介绍基于RHadoop平台的搭建,Hadoop的搭建可以参考http://www.cnblogs.com/tovin/p/3818908.html,以下着重介绍在Ha...
代码星球 ·2020-04-12

Hadoop 权威指南学习1 (主要框架)

1.Hadoop最出名的是 MapReduce和HDFS,不过也有很多其他有用的子项目。  技术栈如下: Core  一系列分布式文件系统和通用I/O的组件和接口(序列化、JavaRPC和持久化数据结构)Avro  一种提供高效、跨语言RP...

hadoop/hdfs/yarn 详细命令搬运

转载自文章 http://www.cnblogs.com/davidwang456/p/5074108.html 安装完hadoop后,在hadoop的bin目录下有一系列命令:container-executorhadoophadoop.cmdhdfshdfs.cmdmapredmapred.cm...

Hadoop 学习笔记3 Develping MapReduce

小笔记:Mavon是一种项目管理工具,通过xml配置来设置项目信息。MavonPOM(projectofmodel). Steps:1.setupandconfigurethedevelopmentenvironment.2. writingyourmap andreducefunctio...

Hadoop 权威指南学习2 (Sqoop)

6.SqoopApachesqoopisanopensourcetoolthatallowuserstoextractdatafromstructureddatastoreintoHadooporback.1)runself:    $SQOOP_HOME/bin/sqoopst...

Hadoop调度器

一、FIFO调度器(先进先出调度)上图为FIFO调度器的执行过程示意图。FIFOScheduler是最简单也是最容易理解的调度器,它缺点是不适用于共享集群。大的应用可能会占用所有集群资源,这就导致其它应用被阻塞。在共享集群中,更适合采用CapacityScheduler或FairScheduler,这两个调度器都允许大...
代码星球 ·2020-04-08

Hadoop Shell命令

调用文件系统(FS)Shell命令应使用 bin/hadoopfs<args>的形式。所有的的FSshell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和...
代码星球 ·2020-04-08

hadoop全分布式的搭建

 修改主机名:vim/etc/sysconfig/network 1修改hadoop-env.sh  2修改core-site.xml  /hadoop/tmpdir:产生namenode中fsimasage和edits文件合并元数据3修改hdfs-site....
代码星球 ·2020-04-08

hadoop伪分布式环境搭建

1.关防火墙2.设置IP地址3.设置network文件hosts映射文件4.安装jdk5.安装hadoop6.配置hadoop:hadoop-env.sh、core-site.xml、hdfs-site.xml、Mapred-site.xml、yarn-site.xml 1.1重启网卡(命名行重启)1.2机器...

给用户配置hadoop权限

参考文献:https://my.oschina.net/hetiangui/blog/143364root登入集群后:chown-Rnewday:newday/usr/local/hadoop//我的yong用户名是newday,集群的安装目录是/usr/local/hadoopmkdir/tmp/hadoopfile...
首页上一页...1718192021...下一页尾页