提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
Hive支持的存储数据的格式主要有 :TEXTFILE 、SEQUENCEFILE、ORC、PARQUET。
TEXTFILE , SEQUENCEFILE 的存储格式都是基于行式存储;
ORC , PARQUET 的存储格式都是基于列式存储;
默认格式,行式存储, 数据不做压缩,磁盘开销大,数据解析开销大
行式存储 ,sequenceFile文件是Hadoop用来存储二进制形式的[Key,Value]对而设计的一种平面文件Flat File
列式存储,对整个表进行按行数切分为多段, 每一段进列式存储
列式存储,二进制方式进行存储, spark默认格式
查询速度相近。