#oop

Hadoop_简单操作ZooKeeper

一、概念  1.一个开源的、分布式的,为分布式应用提供协调服务的Apache项目  2.提供一个简单的原语集合,以便于分布式应用可以在它之上构建更高层次的同步服务  3.设计非常易于编程,它使用的是类似于文件系统那样的树形数据结构  4.目的是将分布式服务不再需要由于协作冲突而另外实现协作服务  5.项目由Java语言...

Hadoop.2.x_时间服务器搭建(CentOs6.6)

一、检查linux系统NTP是否被安装[liuwl@hadoop09-linux-01~]$[liuwl@hadoop09-linux-01~]$rpm-qa|grepntpntpdate-4.2.6p5-10.el6.centos.1.x86_64ntp-4.2.6p5-10.el6.centos.1.x86_64 ...

Hadoop.2.x_MR-Shuffle过程

1、map到reduce中间的一个过程  洗牌,打乱(打乱我们传递的所有元素)(流程:input->map->reduce->output)2、map()->shuffle->reduce()map()接收数据,以wc为例,其中数据可是为<key,value>在map()中获取...
代码星球 ·2020-12-07

Hadoop.2.x_无秘钥设置

1、在实际生产环境中为Hadoop配置无秘钥登录非常有必要#在没有配置时:[liuwl@linux-66-64hadoop-2.5.0]$jps26163Jps[liuwl@linux-66-64hadoop-2.5.0]$sbin/start-yarn.shstartingyarndaemonsstartingres...
代码星球 ·2020-12-07

Hadoop.2.x_WordCount本地测试示例

代码如下,后备参考:packagecom.bigdata.hadoop.hdfs;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.h...

Hadoop.2.x_简单的测试文件读取与上传

代码如下,后备参考:packagecom.bigdata.hadoop.hdfs;importjava.io.File;importjava.io.FileInputStream;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;i...

Hadoop.2.x_源码编译

  1.准备hadoop-2.5.0-src.tar.gzapache-maven-3.0.5-bin.tar.gzjdk-7u67-linux-x64.tar.gzprotobuf-2.5.0.tar.gz可联外部网络  2.安装jdk-7u67-linux-x64.tar.gz与 apache-maven...
代码星球 ·2020-12-07

Hadoop_HDFS HA 及解决方案

1.HDFS系统架构HDFS(HadoopDistributedFileSystem),及Hadoop分布式文件系统作用:为Hadoop分布式计算框架提供高性能,高可靠,高可扩展的存储服务架构:典型的主(NameNode)从(DataNode)架构,两者一对多的关系,一个节点对应一个DataNode,NameNode是...
代码星球 ·2020-12-07

Hadoop.2.x_伪分布环境搭建

  1.设置主机名、静态IP/DNS、主机映射、windows主机映射(方便ssh访问与IP修改)等设置主机名:vi/etc/sysconfig/network#重启系统生效(临时修改:hastnamexxx;另起一个终端将会看到效果,需要注意的是:若即将搭建Hadoop,这里起的hostname禁止使用"_")设置静...

Hadoop_初识

  Hadoop是一个由Apache基金会所开发的分布式系统基础架构。  用户可以在不了解分布式底层细节的情况下,开发分布式程序。  充分利用集群的威力进行高速运算和存储。  Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem), 简称HDFS。  HDFS有高容错性...
代码星球 ·2020-12-07

hadoop高可用HA的配置

zk3zk4zk5 配置hadoop的HA大概可以分为以下几步:配置zookpeer(namenode之间的通信要靠zk来实现)配置hadoop的hadoop-env.shhdfs-site.xmlcore-site.xmlslave*hadoop-env.shexportJAVA_HOME=/opt/mod...

hadoop镜像文件和编辑日志文件

1)概念  namenode被格式化之后,将在/opt/module/hadoop-2.7.2/data/tmp/dfs/name/current目录中产生如下文件edits_0000000000000000000fsimage_0000000000000000000.md5seen_txidVERSION(1)Fsi...

hadoop退出安全模式Name node is in safe mode

18/01/1209:04:34INFOfs.TrashPolicyDefault:Namenodetrashconfiguration:Deletioninterval=0minutes,Emptierinterval=0minutes.rm:Cannotdelete/spark/data/netflow/20180...

spark启动后出现“JAVA_HOME not set” 异常和"org.apache.hadoop.security.AccessControlException"异常

 /home/bigdata/hadoop/spark-2.1.1-bin-hadoop2.7/sbin/start-all.sh启动后执行jps命令,主节点上有Master进程,其他子节点上有Work进行,登录Spark管理界面查看集群状态(主节点):http://master01:8080/ 到...

Spark启动报错|java.io.FileNotFoundException: File does not exist: hdfs://hadoop101:9000/directory

atorg.apache.spark.deploy.history.FsHistoryProvider.<init>(FsHistoryProvider.scala:156)atorg.apache.spark.deploy.history.FsHistoryProvider.<init>(Fs...
首页上一页...1112131415...下一页尾页