51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#hadoop
HadoopDoctor:来自腾讯数据仓库TDW的MR诊断系统
TDW是基于Hadoop生态圈研发的大数据处理平台,MapReduce计算引擎在TDW平台中承担了所有的离线数据计算,是TDW最重要的底层支撑平台之一。在TDW平台中,除了MR程序会生成MapReduce作业外,被广泛应用的Hive、tPig等计算框架最终也会把查询语言翻译成MapReduce作业来进行计算,因此对Ma...
代码星球
·
2021-02-11
HadoopDoctor
来自
腾讯
数据
仓库
hadoop spark学习笔记
http://www.csdn.net/article/2015-06-08/2824889hive:是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的M...
代码星球
·
2021-02-11
hadoop
spark
学习
笔记
Hadoop(HA)分布式集群部署
Hadoop(HA)分布式集群部署和单节点namenode部署其实一样,只是配置文件的不同罢了。这篇就讲解hadoop双namenode的部署,实现高可用.系统环境:OS:CentOS6.8内存:2GCPU:1核Software:jdk-8u151-linux-x64.rpmhadoop-2.7.4.tar...
代码星球
·
2021-02-10
Hadoop
HA
分布式
集群
部署
Hadoop分布式集群部署(单namenode节点)
Hadoop分布式集群部署系统系统环境:OS:CentOS6.8内存:2GCPU:1核Software:jdk-8u151-linux-x64.rpm hadoop-2.7.4.tar.gzhadoop下载地址:sudowgethttp://mirrors.hust.edu.cn/apache/hadoop/c...
代码星球
·
2021-02-10
Hadoop
分布式
集群
部署
namenode
hadoop hdfs 命令
hdfs命令常用操作:hdfs帮助-help[cmd]显示命令的帮助信息[hadoop@hadoop-01~]$hdfsdfs-helpls递归显示当前目录下的所有文件:[hadoop@hadoop-01~]$hdfsdfs-ls-h/Found1itemsdrwxrwx----hadoopsupergroup0201...
代码星球
·
2021-02-10
hadoop
hdfs
命令
Hadoop之我见
最近在学习Hadoop,很想把自己的一些学习遇到的问题以及解决方案分享出来,也碍于最近一堆忙不完的事,就把这事给搁了很久。 那下面我就先来简单说下我为什么要学习Hadoop以及我学习Hadoop的一些感受吧。 大家都知道,最近几年互联网的云计算、大数据、Hadoop等等这些都很炒的很火。我是一名学生,学校也赶上...
代码星球
·
2021-02-08
Hadoop
之我
Hadoop HDFS文件常用操作及注意事项
1.CopyafilefromthelocalfilesystemtoHDFSThesrcFilevariableneedstocontainthefullname(path+filename)ofthefileinthelocalfilesystem. ThedstFilevariableneedstoco...
代码星球
·
2021-02-08
Hadoop
HDFS
文件
常用
操作
Hadoop管理员的十个最佳实践
接触Hadoop有两年的时间了,期间遇到很多的问题,既有经典的NameNode和JobTracker内存溢出故障,也有HDFS存储小文件问题,既有任务调度问题,也有MapReduce性能问题.遇到的这些问题有些是Hadoop自身的缺陷(短板),有些则是使用的不当。在解决问题的过程中,有时需要翻源码,有时会向同事、网友请...
代码星球
·
2021-02-08
Hadoop
管理员
十个
最佳
实践
在Hadoop1.2.1分布式集群环境下安装hive0.12
在Hadoop1.2.1分布式集群环境下安装hive0.12 ● 前言:1. 大家最好通读一遍过后,在理解的基础上再按照步骤搭建。2. 之前写过两篇<<在VMware下安装Ubuntu并部署Hadoop1.2.1分布式环境>>、《在Hadoop1.2.1分...
代码星球
·
2021-02-08
Hadoop1.2.1
分布式
集群
环境
安装
apache-hadoop-1.2.1、hbase、hive、mahout、nutch、solr安装教程
VMware8.0Ubuntu-12.10-desktop-i386jdk-7u40-linux-i586.tar.gzhadoop-1.2.1.tar.gzeclipse-dsl-juno-SR1-linux-gtk.tar.gzhadoop-eclipse-plugin-1.2.1.jarapache-maven-...
代码星球
·
2021-02-08
apache-hadoop-1.2.1
hbase
hive
mahout
nutch
hadoop中的ssh无密码登录配置
在配置Hadoop集群分布时,要使用SSH免密码登录,假设现在有两台机器hadoop@Master(192.168.1.101),作为Master机,hadoop@Slave(192.168.1.102),作为Slave机。现想hadoop@Master通过ssh免密码登录到hadoop@Slave。1.在Master...
代码星球
·
2021-02-08
hadoop
中的
ssh
密码
登录
Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集
(一)hadoop相关安装部署1、hadoop在windowscygwin下的部署: http://lib.open-open.com/view/1333428291655http://blog.csdn.net/ruby97/article/details/7423088http://blog.csdn.n...
代码星球
·
2021-02-08
Hadoop
Pig
Hive
Storm
NOSQL
Hadoop 中利用 mapreduce 读写 mysql 数据
有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些pv、uv数据,然后为了实时查询的需求,或者一些OLAP的需求,我们需要mapreduce与mysql进行数据的交互,而这些是hbase或者hive目前亟待改进的地方。好了言归正传,简单的说说背景、原理以及需要注意的地方:1、为了方便MapReduce直...
代码星球
·
2021-02-08
Hadoop
利用
mapreduce
读写
mysql
Hadoop启动后无法启动NodeManager
在配置完Hadoop集群后,使用命令:“start-all.sh”进行启动集群。然后使用命令:“jps”查看进程启动情况,发现没有NodeManager只需要使用命令:cd /usr/local/hadoop/hadoop-2.7.4/etc/hadoop进入该目录后,使用命令“vimyarn-site.xm...
代码星球
·
2021-02-08
启动
Hadoop
无法
NodeManager
高可用hadoop的hdfs启动的时候namenode启动不了
启动的时候,一直要求输入namenode密码:查看namenode的日志如下:2019-03-2818:38:08,961INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver:datanode1/192.168.197.136:8485.Alreadytrie...
代码星球
·
2021-02-03
启动
高可用
可用
hadoop
hdfs
首页
上一页
...
3
4
5
6
7
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他