目录
一、DML数据操作
1、数据导入
1.1 向表中装载数据(Load)
1.2 通过查询语句向表中插入数据
1.3 查询语句中创建表并加载数据(As Select)
1.4 创建表时通过 Location 指定加载数据路径
1.5 Import数据到指定Hive表中
2、数据导出
2.1 Insert导出
2.2 Hadoop命令导出到本地
2.3 Hive Shell命令导出
2.4 Export导出到HDFS上
2.5 Sqoop导出(可视化)
2.6 清除表中数据(Truncate)
一、DML数据操作
1、数据导入
1.1 向表中装载数据(Load)
注意:
如果是从本地加载数据到hive表,该数据文件还会存在;而如果是从HDFS加载数据到hive表中是相当于移动到表里,HDFS所创建的数据文件是会被删除的。(因为无论是在哪个路径下都是在HDFS内存储的,因此不需要存储多份)
1.2 通过查询语句向表中插入数据
这种方式很慢,所以一般很少用
1.3 查询语句中创建表并加载数据(As Select)
1.4 创建表时通过 Location 指定加载数据路径
1.5 Import数据到指定Hive表中
和下面的Export一起使用
2、数据导出
2.1 Insert导出
ROW FORMAT xxx是按格式分割字段
2.2 Hadoop命令导出到本地
2.3 Hive Shell命令导出
2.4 Export导出到HDFS上
2.5 Sqoop导出(可视化)
后续再进行说明
2.6 清除表中数据(Truncate)