#hadoop

hadoop ha环境下的datanode启动报错java.lang.NumberFormatException: For input string: "10m"

hadoopha环境启动start-dfs.sh的时候datanode启动不了,并且报错。[hadoop@datanode2~]$cat/home/hadoop/hadoop-2.7.3/logs/hadoop-hadoop-datanode-datanode2.log2019-03-2418:40:46,422FAT...

初始化ha环境下的hadoop的hdfs

1)启动zookeeper2)启动所有的journalnode[hadoop@datanode1~]$~/hadoop-2.7.3/sbin/hadoop-daemon.shstartjournalnode3)主节点执行初始化操作namenode1~/hadoop-2.7.3/bin/hdfsnamenode-form...

hadoop大数据

http://blog.csdn.net/u010156024/article/details/50147697http://blog.fens.me/hadoop-mapreduce-log-kpi/...
代码星球 ·2021-02-03

Hadoop伪分布模式配置

1、安装配置JDK并配置环境变量,此处省略...2、SSH(SecureShell)的免密码登录  [root@VM_0_3_centos~]#ssh-keygen-trsa [root@VM_0_3_centos~]#ls-a .   .bash_...
代码星球 ·2021-01-30

Hadoop开启后jps显示只有jps

之前在用Mapreduce写代码时,在DFSLocation下的会报一个error,大体的意思就是与主机名相关的错误然后我就觉得可能时Hadoop开启时出了错误,然后我就重启了Hadoop,jps查看了一下,果然出现了错误可见jps命令输入后什么都没有,原本应该如下图所示后来我就在网上百度,发现出现错误的原因时我主机名...

CentOS安装Hadoop

Hadoop的核心由3个部分组成:   HDFS:HadoopDistributedFileSystem,分布式文件系统,hdfs还可以再细分为NameNode、SecondaryNameNode、DataNode。   YARN:YetAnotherReso...
代码星球 ·2021-01-30

hadoop学习第七天-HBase的原理、安装、shell命令

hbase是hadoop的一个重要成员,主要用于存储结构化数据,构建在hdfs之上的分布式存储系统,它主要通过横向扩展,通用不断增加廉价服务器增加计算和存储能力。1.大:一个表可以有数十亿行,上百万列;2.无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列;3....

hadoop学习第四天-Writable和WritableComparable序列化接口的使用&&MapReduce中传递javaBean的简单例子

1.如果一个javaBean想要作为MapReduce的key或者value,就一定要实现序列化,因为在Map到Reduce阶段的时候,只能是传输二进制数据,不可能将字符流直接进行RPC传输,只要一个javabean实现了序列化和反序列化,就可以做为key或者value最简单的序列化和反序列化就是实现Writable接...

hadoop学习第三天-MapReduce介绍&&WordCount示例&&倒排索引示例

(最好以下面的两个示例来理解原理)Map-reduce的思想就是“分而治之”MapMapper负责“分”,即把复杂的任务分解为若干个“简单的任务”执行“简单的任务”有几个含义:1数据或计算规模相对于原任务要大大缩小;2就近计算,即会被分配到存放了所需数据的节点进行计算;3这些小任务可以并行计算,彼此间几乎没有依赖关系一...

hadoop学习第二天-了解HDFS的基本概念&&分布式集群的搭建&&HDFS基本命令的使用

 1.数据块1、在HDFS中,文件诶切分成固定大小的数据块,默认大小为64MB(hadoop2.x以后是128M),也可以自己配置。2、为何数据块如此大,因为数据传输时间超过寻到时间(高吞吐率)。3、文件的存储方式,按大小被切分成若干个block,存储在不同的节点上,默认情况下每个block有三个副本。2.复...

hadoop学习第一天-hadoop初步环境搭建&伪分布式计算配置(详细)

虚拟机:VMWare12+操作系统:CentOS6.5打开VMWare,将CentOS6.5的iso添加进去,一路下一步,但是在新建虚拟机的时候需要注意:处理器最好是2个以上,具体按照自己的电脑能力分配内存分配多一些,这个就看自己机器的情况了网络设置为NAT,我们先本机测试,前期先不桥接出去进入Linux,右击网络-&...

搭建hadoop2.4.1

前期准备: 1.系统基本形况:iphostnameroleserverloginName192.168.1.101h1NameNode,ResourceManagercentos7_64hwd192.168.1.102h2DataNode, NodeManagercentos7_64hwd192.1...
代码星球 ·2021-01-23

hadoop执行hdfs文件到hbase表插入操作(xjl456852原创)

本例中需要将hdfs上的文本文件,解析后插入到hbase的表中.本例用到的hadoop版本2.7.2hbase版本1.2.2hbase的表如下:create'ns2:user','info'hdfs上的文本文件如下[data/hbase_input/hbase.txt]1,xiejl,202,haha,303,liud...

hadoop执行hbase插入表操作,出错:Stack trace: ExitCodeException exitCode=1:(xjl456852原创)

在执行hbase和mapreduce融合时,将hdfs上的文本文件插入到hbase中,我没有使用"胖包"(胖包就是将项目依赖的jar包放入项目打包后的lib目录中),而是直接将hbase的lib加入到了hadoop的classpath中.我是将HBase的jar包加到/opt/modules/hadoop/etc/ha...

Hadoop 2.6.0 HIVE 2.1.1配置

我用的hadoop是2.6.0版本,hive是2.1.1版本进入;/home/zkpk/apache-hive-2.1.1-bin/执行hive后报错:(1)Exceptioninthread"main"java.lang.RuntimeException:org.apache.hadoop.hive.ql.metad...
首页上一页...45678...下一页尾页