Hive 的数据类型可以进行隐式转换,例如某表达式使用 INT 类型,TINYINT 会自动转换为 INT 类型,但是 Hive 不会进行反向转化,例如某表达式使用TINYINT类型,INT 不会自动转换为 TINYINT 类型,会返回错误,除非使用 CAST操作。
CAST:进行显示转换。如果强制类型转换失败,会返回空值 NULL。
①CREATE TABLE:创建一个指定名字的表。为了防止相同名字的表已经存在,可以通过 IF NOT EXISTS 进行判断。
②EXTERNAL::创建一个外部表。在删除表的时候,外部表只删除元数据,不删除数据。
③COMMENT:为表和列添加注释。
④PARTITIONED BY :创建分区表。
⑤CLUSTERED BY:创建分桶表。
⑥SORTED BY:对分桶表中的一个或多个列另外排序。
⑦ROW FORMAT:指定数据连接格式。
⑧STORED AS: 指定存储文件类型。
⑨LOCATION:指定表在 HDFS 上的存储位置。
⑩AS:后跟查询语句,根据查询结果创建表。
⑪LIKE:复制现有的表结构,但是不复制数据。
⑫SKEWED BY ON:倾斜表将倾斜严重的列分开存储为不同的文件,每一个倾斜的值为一个目录,过滤倾斜的数据,定义了倾斜表,查询不过滤 还是进行全表的扫描,ON后面跟倾斜值。