#hadoop

HadoopDoctor:来自腾讯数据仓库TDW的MR诊断系统

TDW是基于Hadoop生态圈研发的大数据处理平台,MapReduce计算引擎在TDW平台中承担了所有的离线数据计算,是TDW最重要的底层支撑平台之一。在TDW平台中,除了MR程序会生成MapReduce作业外,被广泛应用的Hive、tPig等计算框架最终也会把查询语言翻译成MapReduce作业来进行计算,因此对Ma...

hadoop spark学习笔记

http://www.csdn.net/article/2015-06-08/2824889hive:是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的M...
代码星球 ·2021-02-11

Hadoop(HA)分布式集群部署

 Hadoop(HA)分布式集群部署和单节点namenode部署其实一样,只是配置文件的不同罢了。这篇就讲解hadoop双namenode的部署,实现高可用.系统环境:OS:CentOS6.8内存:2GCPU:1核Software:jdk-8u151-linux-x64.rpmhadoop-2.7.4.tar...

Hadoop分布式集群部署(单namenode节点)

Hadoop分布式集群部署系统系统环境:OS:CentOS6.8内存:2GCPU:1核Software:jdk-8u151-linux-x64.rpm     hadoop-2.7.4.tar.gzhadoop下载地址:sudowgethttp://mirrors.hust.edu.cn/apache/hadoop/c...

hadoop hdfs 命令

hdfs命令常用操作:hdfs帮助-help[cmd]显示命令的帮助信息[hadoop@hadoop-01~]$hdfsdfs-helpls递归显示当前目录下的所有文件:[hadoop@hadoop-01~]$hdfsdfs-ls-h/Found1itemsdrwxrwx----hadoopsupergroup0201...
代码星球 ·2021-02-10

Hadoop之我见

  最近在学习Hadoop,很想把自己的一些学习遇到的问题以及解决方案分享出来,也碍于最近一堆忙不完的事,就把这事给搁了很久。  那下面我就先来简单说下我为什么要学习Hadoop以及我学习Hadoop的一些感受吧。  大家都知道,最近几年互联网的云计算、大数据、Hadoop等等这些都很炒的很火。我是一名学生,学校也赶上...
代码星球 ·2021-02-08

Hadoop HDFS文件常用操作及注意事项

1.CopyafilefromthelocalfilesystemtoHDFSThesrcFilevariableneedstocontainthefullname(path+filename)ofthefileinthelocalfilesystem. ThedstFilevariableneedstoco...

Hadoop管理员的十个最佳实践

接触Hadoop有两年的时间了,期间遇到很多的问题,既有经典的NameNode和JobTracker内存溢出故障,也有HDFS存储小文件问题,既有任务调度问题,也有MapReduce性能问题.遇到的这些问题有些是Hadoop自身的缺陷(短板),有些则是使用的不当。在解决问题的过程中,有时需要翻源码,有时会向同事、网友请...

在Hadoop1.2.1分布式集群环境下安装hive0.12

在Hadoop1.2.1分布式集群环境下安装hive0.12 ● 前言:1. 大家最好通读一遍过后,在理解的基础上再按照步骤搭建。2. 之前写过两篇<<在VMware下安装Ubuntu并部署Hadoop1.2.1分布式环境>>、《在Hadoop1.2.1分...

apache-hadoop-1.2.1、hbase、hive、mahout、nutch、solr安装教程

VMware8.0Ubuntu-12.10-desktop-i386jdk-7u40-linux-i586.tar.gzhadoop-1.2.1.tar.gzeclipse-dsl-juno-SR1-linux-gtk.tar.gzhadoop-eclipse-plugin-1.2.1.jarapache-maven-...

hadoop中的ssh无密码登录配置

在配置Hadoop集群分布时,要使用SSH免密码登录,假设现在有两台机器hadoop@Master(192.168.1.101),作为Master机,hadoop@Slave(192.168.1.102),作为Slave机。现想hadoop@Master通过ssh免密码登录到hadoop@Slave。1.在Master...

Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集

(一)hadoop相关安装部署1、hadoop在windowscygwin下的部署: http://lib.open-open.com/view/1333428291655http://blog.csdn.net/ruby97/article/details/7423088http://blog.csdn.n...
代码星球 ·2021-02-08

Hadoop 中利用 mapreduce 读写 mysql 数据

有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些pv、uv数据,然后为了实时查询的需求,或者一些OLAP的需求,我们需要mapreduce与mysql进行数据的交互,而这些是hbase或者hive目前亟待改进的地方。好了言归正传,简单的说说背景、原理以及需要注意的地方:1、为了方便MapReduce直...

Hadoop启动后无法启动NodeManager

在配置完Hadoop集群后,使用命令:“start-all.sh”进行启动集群。然后使用命令:“jps”查看进程启动情况,发现没有NodeManager只需要使用命令:cd /usr/local/hadoop/hadoop-2.7.4/etc/hadoop进入该目录后,使用命令“vimyarn-site.xm...

高可用hadoop的hdfs启动的时候namenode启动不了

启动的时候,一直要求输入namenode密码:查看namenode的日志如下:2019-03-2818:38:08,961INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver:datanode1/192.168.197.136:8485.Alreadytrie...
首页上一页...34567...下一页尾页