51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#oop
Hadoop和大数据:60款顶级大数据开源工具
一、Hadoop相关工具 1.Hadoop Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。 支持的操作系统:Windows、Linux和OSX。 相关链接:http://hadoop.apache.org 2.Amba...
代码星球
·
2020-09-30
数据
Hadoop
60款
顶级
开源
Hadoop概念学习系列之Hadoop、Spark学习路线
1Java基础: 视频方面: 推荐《毕向东JAVA基础视频教程》。学习hadoop不需要过度的深入,java学习到javase,在Java虚拟机的内存管理、以及多线程、线程池、设计模式、并行化多多理解实践即可。&nb...
代码星球
·
2020-09-24
Hadoop
学习
概念
系列
Spark
Python 调试工具PySnooper
相信很多小伙伴平时写python的时候都是需要调试程序的,出问题了,需要了解函数内部是怎么跑的,而这个时候很多人都会想到在疑惑的地方使用print函数来打印一下参数来调试。虽然用print也是不失为是一种方法,但是有时如果疑惑的地方多就要每个地方都要加print,这样就显得比较麻烦了。今天发现在Github开源了一个神...
代码星球
·
2020-09-24
Python
调试
工具
PySnooper
大数据集群运维(35)sqoop安装与使用
sqoop是什么:在关系数据库和hadoop之间数据的相互转换的工具。安装:原生安装:appache1.解压安装,2.重命名sqoop-1.4.5-cdh5.4.4/sqoop-env-template.sh为sqoop-env.sh3.修改sqoop-env.sh配置:填写Hadoop,hba...
代码星球
·
2020-09-20
数据
集群
运维
sqoop
安装
hadoop入门到实战(10)hive从入门到实战四
8.1Hadoop源码编译支持Snappy压缩8.1.1资源准备1、CentOS联网 配置CentOS能连接外网。Linux虚拟机pingwww.baidu.com是畅通的。 注意:采用root角色编译,减少文件夹权限出现问题。2、jar包准备(hadoop源码、JDK8、m...
代码星球
·
2020-09-19
入门
实战
hadoop
hive
hadoop入门到实战(9)hive从入门到实战三
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select查询语句语法:[WITH CommonTableExpression (, CommonTableExpression)*]&...
代码星球
·
2020-09-19
入门
实战
hadoop
hive
hadoop入门到实战(7)hive从入门到实战一
1.1什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计(分析数据的框架)。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduc...
代码星球
·
2020-09-19
入门
实战
hadoop
hive
hadoop入门到实战(8)hive从入门到实战二
4.1创建数据库1)创建一个数据库,数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。hive (default)> create database db_hive;2)避免要创建的数据库已经存在错误,增加ifnotexists判断。(标...
代码星球
·
2020-09-19
入门
实战
hadoop
hive
hadoop入门到实战(6)hive常用优化方法总结
问题导读:1、如何理解列裁剪和分区裁剪?2、sortby代替orderby优势在哪里?3、如何调整groupby配置?4、如何优化SQL处理join数据倾斜?Hive作为大数据领域常用的数据仓库组件,在平时设计和查询时要特别注意效率。影响Hive效率的几乎从不是数据量过大,而是数据倾斜、数据冗余、job或I/O过多、M...
代码星球
·
2020-09-19
hadoop
入门
实战
hive
常用
大数据集群运维(1)Hadoop + Hive + HBase + Kylin伪分布式安装
问题导读1. Centos7如何安装配置?2. linux网络配置如何进行?3. linux环境下java 如何安装?4. linux环境下SSH免密码登录如何配置?5. linux环境下Hadoop2.7 如何安装?6. linux环境下...
代码星球
·
2020-09-19
数据
集群
运维
Hadoop
Hive
Hadoop入门到实战(5)sql语句大全(详细)
查看所有数据库showdatabases; 1查看当前使用的数据库selectdatabase(); 1创建数据库createdatabases数据库名charset=utf8; 5.删除数据库dropdatabase数据库名 16.使用数据句库usedatabase数据库名&n...
代码星球
·
2020-09-19
Hadoop
入门
实战
sql
语句
hadoop入门到实战(4)Hive知识思维导图
...
代码星球
·
2020-09-19
hadoop
入门
实战
Hive
知识
Js 运行机制和Event Loop
JavaScript语言的一大特点就是单线程,也就是说,同一个时间只能做一件事。那么,为什么JavaScript不能有多个线程呢?这样能提高效率啊。JavaScript的单线程,与它的用途有关。作为浏览器脚本语言,JavaScript的主要用途是与用户互动,以及操作DOM。这决定了它只能是单线程,否则会带来很复杂的同步...
代码星球
·
2020-09-12
Js
运行机制
Event
Loop
RunLoop
OSX/iOS系统中,提供了两个这样的对象:NSRunLoop和CFRunLoopRef。CFRunLoopRef是在CoreFoundation框架内的,它提供了纯C函数的API,所有这些API都是线程安全的。NSRunLoop是基于CFRunLoopRef的封装,提供了面向对象的API,但是这些API不是线程安全的...
代码星球
·
2020-09-12
RunLoop
Spark报错java.io.IOException: Could not locate executable nullinwinutils.exe in the Hadoop binaries.
Spark读取JSON文件时运行报错java.io.IOException:Couldnotlocateexecutablenullinwinutils.exeintheHadoopbinaries. 需要文件百度网盘链接点击进入提取码:eku1先把winutils.exe文件放入hadoop的bin目录里...
代码星球
·
2020-09-10
Spark
报错
java.io.IOException
Could
not
首页
上一页
...
13
14
15
16
17
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他