#hadoop

hadoop高可用HA的配置

zk3zk4zk5 配置hadoop的HA大概可以分为以下几步:配置zookpeer(namenode之间的通信要靠zk来实现)配置hadoop的hadoop-env.shhdfs-site.xmlcore-site.xmlslave*hadoop-env.shexportJAVA_HOME=/opt/mod...

hadoop镜像文件和编辑日志文件

1)概念  namenode被格式化之后,将在/opt/module/hadoop-2.7.2/data/tmp/dfs/name/current目录中产生如下文件edits_0000000000000000000fsimage_0000000000000000000.md5seen_txidVERSION(1)Fsi...

hadoop退出安全模式Name node is in safe mode

18/01/1209:04:34INFOfs.TrashPolicyDefault:Namenodetrashconfiguration:Deletioninterval=0minutes,Emptierinterval=0minutes.rm:Cannotdelete/spark/data/netflow/20180...

spark启动后出现“JAVA_HOME not set” 异常和"org.apache.hadoop.security.AccessControlException"异常

 /home/bigdata/hadoop/spark-2.1.1-bin-hadoop2.7/sbin/start-all.sh启动后执行jps命令,主节点上有Master进程,其他子节点上有Work进行,登录Spark管理界面查看集群状态(主节点):http://master01:8080/ 到...

Spark启动报错|java.io.FileNotFoundException: File does not exist: hdfs://hadoop101:9000/directory

atorg.apache.spark.deploy.history.FsHistoryProvider.<init>(FsHistoryProvider.scala:156)atorg.apache.spark.deploy.history.FsHistoryProvider.<init>(Fs...

hadoop启动问题分析

hadoop的安装和启动很简单直接解压进行安装配置文件就好了,但是启动问题就很多,总结下无非以下两点: 第一点:无论你是群起还是单起;都首要格式化  bin/hdfsnamenode-format;格式化之前首要的任务就是在hadoop2.7.2目录下删除data和logs两个文件不然肯定...
代码星球 ·2020-11-27

查看hadoop压缩方式

bin/hadoopchecknative 来查看我们编译之后的hadoop支持的各种压缩,如果出现openssl为false,那么就在线安装一下依赖包bin/hadoopchecknativeyuminstallopenssl-devel  ...
代码星球 ·2020-11-26

hadoop的基准测试

实际生产环境当中,hadoop的环境搭建完成之后,第一件事情就是进行压力测试,测试我们的集群的读取和写入速度,测试我们的网络带宽是否足够等一些基准测试测试写入速度向HDFS文件系统中写入数据,10个文件,每个文件10MB,文件存放到/benchmarks/TestDFSIO中hadoopjar/export/serve...
代码星球 ·2020-11-26

Hadoop2.6.0伪分布环境搭建

用到的软件:一、安装jdk:1、要安装的jdk,我把它拷在了共享文件夹里面。 (用优盘拷也可以)2、我把jdk拷在了用户文件夹下面。(其他地方也可以,不过路径要相应改变)3、执行复制安装解压命令: 解压完毕: 查看解压的文件夹:4、配置环境变量:写入如下5行代码:使配置生效:5、查看安装的...

hadoop实例---多表关联

多表关联和单表关联类似,它也是通过对原始数据进行一定的处理,从其中挖掘出关心的信息。如下输入的是两个文件,一个代表工厂表,包含工厂名列和地址编号列;另一个代表地址表,包含地址名列和地址编号列。要求从输入数据中找出工厂名和地址名的对应关系,输出工厂名-地址名表样本如下:factory:factorynameaddress...
代码星球 ·2020-10-21

Hadoop Oozie 学习笔记

 Oozie是一个工作流引擎服务器,用于运行HadoopMap/Reduce和Pig任务工作流.同时Oozie还是一个JavaWeb程序,运行在JavaServlet容器中,如Tomcat.    Oozie工作流中拥有多个Action,如HadoopMap/Reuce...
代码星球 ·2020-10-21

Hadoop WritableComparable接口

WritableComparable接口Writable接口大家可能都知道,它是一个实现了序列化协议的序列化对象。在Hadoop中定义一个结构化对象都要实现Writable接口,使得该结构化对象可以序列化为字节流,字节流也可以反序列化为结构化对象。那WritableComparable接口是可序列化并且可比较的接口。M...
代码星球 ·2020-10-21

Hadoop集群运行JNI程序

要在Hadoop集群运行上运行JNI程序,首先要在单机上调试程序直到可以正确运行JNI程序,之后移植到Hadoop集群就是水到渠成的事情。Hadoop运行程序的方式是通过jar包,所以我们需要将所有的class文件打包成jar包。在打包的过程中,无需将动态链接库包含进去。在集群中运行程序之前,Hadoop会首先将jar...

Docker 安装Hadoop HDFS命令行操作

网上拉取Docker模板,使用singlarities/hadoop镜像[root@localhost/]#dockerpullsingularities/hadoop查看:[root@localhost/]#dockerimagelsREPOSITORYTAGIMAGEIDCREATEDSIZEdocker.io/s...

Hadoop和大数据:60款顶级大数据开源工具

 一、Hadoop相关工具  1.Hadoop  Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。  支持的操作系统:Windows、Linux和OSX。  相关链接:http://hadoop.apache.org  2.Amba...
首页上一页...7891011...下一页尾页