#Parquet

Hive 的分桶 & Parquet 概念

分区& 分桶都是把数据划分成块。分区是粗粒度的划分,桶是细粒度的划分,这样做为了可以让查询发生在小范围的数据上以提高效率。分区之后,分区列都成了文件目录,从而查询时定位到文件目录,子数据集而提高查询效率。桶创建: createtablezyy_table(idint,namestring)c...
代码星球 ·2020-04-11