Spark SQL与Hive整合成功后,可以使用以下几种方式对Hive数据仓库进行操作。
1. Spark SQL终端操作
Spark SQL终端启动后,可以直接使用HiveQL语句对Hive数据仓库进行操作。
例如,列出当前所有数据库,代码如下:
- spark-sql> show databases;
-
- default
-
- Time taken: 3.66 seconds, Fetched 1 row(s)
可以看到,默认有一个名为default的数据库。
创建表student,其中字段id为整型,字段name为字符串,代码如下:
- spark-sql> CREATE TABLE student(id INT,name STRING);
-
- Time taken: 1.351 seconds
向表student中插入一条数据,代码如下:
- spark-sql> INSERT INTO student VALUES(1000,'xiaoming');
-
- Time taken: 10.338 seconds