51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#oop
Linux Hadoop2.7.3 安装(单机模式) 二
LinuxHadoop2.7.3安装(单机模式)一 LinuxHadoop2.7.3安装(单机模式)二 YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceM...
代码星球
·
2020-09-06
Linux
Hadoop2.7.3
安装
单机
模式
Linux Hadoop2.7.3 安装(单机模式) 一
LinuxHadoop2.7.3安装(单机模式)一 LinuxHadoop2.7.3安装(单机模式)二 java环境安装 http://www.cnblogs.com/zeze/p/5902124.html java环境安装配置etc/profile:exportJAVA_HOM...
代码星球
·
2020-09-06
Linux
Hadoop2.7.3
安装
单机
模式
hadoop入门到实战(3)hive数据仓库入门到实战及面试
第一章、hive入门一、hive入门手册1.什么是数据仓库1.1数据仓库概念对历史数据变化的统计,从而支撑企业的决策。比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源。1.2传统数据仓库面临的挑战(1)无法满足快速增长的海量数据存储需求(2)无法有效处理不同类型的数据(3)计算和处理能力不足1....
代码星球
·
2020-09-05
入门
实战
hadoop
hive
数据
hadoop入门到实战(2)hive经典练习题
一.建表和加载数据1.student表createtableifnotexistsstudent(s_idint,s_namestring,s_birthstring,s_sexstring)rowformatdelimitedfieldsterminatedby',';loaddatalocalinpath'/roo...
代码星球
·
2020-09-05
hadoop
入门
实战
hive
经典
hadoop入门到实战(1)hive优化总结
可以通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析;它可以使已经存储的数据结构化;可以直接访问存储在ApacheHDFS或其他数据存储系统(如ApacheHBase)中的文件;Hive除了支持MapReduce计算引擎,还支持Spark和Tez这两种分布式计算引擎;它提...
代码星球
·
2020-09-05
hadoop
入门
实战
hive
优化
hadoop入门到实战(13)Flume从入门到实战
1.1Flume定义 Flume(水槽)是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 在2009年Flume被捐赠了apache软件基金会,为hadoop相关组件之一。尤其近几年随着flume的不断...
代码星球
·
2020-09-05
入门
实战
hadoop
Flume
hadoop入门到实战(16)azkaban从入门到实战
1.1为什么需要工作流调度系统1)一个完整的数据分析系统通常都是由大量任务单元组成: shell脚本程序,java程序,mapreduce程序、hive脚本等。2)各任务单元之间存在时间先后及前后依赖关系。3)为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行。 &em...
代码星球
·
2020-09-05
入门
实战
hadoop
azkaban
hadoop入门到实战(18)优化技巧汇总_通用优化+Linux 优化+HDFS 优化+MapReduce 优化+HBase 优化+内存优化+JVM 优化+Zookeeper 优化
1.1、NameNode的元数据备份使用SSD1.2、定时备份NameNode上的元数据 建议每小时或者每天备份,如果数据极其重要,可以5~10分钟备份一次。备份可以通过定时任务复制元数据目录即可。1.3、为NameNode指定多个元数据目录 使用dfs.name.dir或者...
代码星球
·
2020-09-05
优化
hadoop
入门
实战
技巧
hadoop入门到实战(17)Oozie从入门到实战
Oozie英文翻译为:驯象人。一个基于工作流引擎的开源框架,由Cloudera公司贡献给Apache,提供对HadoopMapReduce、PigJobs的任务调度与协调。Oozie需要部署到JavaServlet容器中运行。主要用于定时调度任务,多任务可以按照执行的逻辑顺序调度。回到顶部2.1...
代码星球
·
2020-09-05
入门
实战
hadoop
Oozie
hadoop入门到实战(14)Kafka从入门到实战
1.1消息队列1)点对点模式(一对一,消费者主动拉取数据,消息收到后消息清除) 点对点模型通常是一个基于拉取或者轮询的消息传送模型,这种模型从队列中请求信息,而不是将消息推送到客户端。这个模型的特点是发送到队列的消息被一个且只有一个接收者接收处理,即使有多个消息监听者也是如此。2)发布/订阅模式(...
代码星球
·
2020-09-05
入门
实战
hadoop
Kafka
hadoop入门到实战(15)Sqoop从入门到实战
Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql,postgresql,...)间进行数据的高校传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据...
代码星球
·
2020-09-05
入门
实战
hadoop
Sqoop
hadoop入门到实战(12)hive从入门到实战六
1.1、背景表结构在讲解中我们需要贯串一个例子,所以需要设计一个情景,对应还要有一个表结构和填充数据。如下:有3个字段,分别为personId标识某一个人,company标识一家公司名称,money标识该公司每年盈利收入(单位:万元人民币)建表并导入数据:create table company_i...
代码星球
·
2020-09-05
入门
实战
hadoop
hive
Exception in thread "main" java.lang.NoClassDefFoundError: io/netty/channel/EventLoopGroup
最近在学习dubbo,跟着教程做,但是运行时报错,需要添加netty依赖<dependency><groupId>io.netty</groupId><artifactId>netty-all</artifactId><version>4.1.32...
代码星球
·
2020-08-31
Exception
in
thread
quotmain
quot
stroop效应matlab实验
1打开matlab,打开test1.m 点击运行,若出现选择更改文件夹 2 引导界面 (在这个界面,只许用户鼠标点击开始,其余的别乱按按键。记得将打字法关掉,切换到小写)3做题界面 根据颜色选择按键,直到做完题。80到题界面出现,鼠标一定要点击下...
代码星球
·
2020-08-29
stroop
效应
matlab
实验
KMeans聚类算法Hadoop实现
Assistance.java 辅助类,功能详见凝视packageKMeans;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.FSDataInputStream;importorg.apache.hadoop.fs....
代码星球
·
2020-08-29
KMeans
聚类
算法
Hadoop
实现
首页
上一页
...
14
15
16
17
18
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他