51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#Parquet
Hive 的分桶 & Parquet 概念
分区& 分桶都是把数据划分成块。分区是粗粒度的划分,桶是细粒度的划分,这样做为了可以让查询发生在小范围的数据上以提高效率。分区之后,分区列都成了文件目录,从而查询时定位到文件目录,子数据集而提高查询效率。桶创建: createtablezyy_table(idint,namestring)c...
代码星球
·
2020-04-11
Hive
Parquet
概念
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他