一面
1、实习的工作内容是什么?
2、有写过UDF吗?如何实现UDF?
3、UDF要成为永久函数怎么做?如果不加temperory,函数下次还能用吗?
4、UDTF了解吗?
5、Hive的窗口函数有了解过吗?
6、开窗函数Over()中有没有orderby有什么区别?
7、汇总数据开发是怎么做的?(实习工作)
8、Flink任务的并行度和内存怎么设置的?
9、Flink的TaskManager内存模型了解吗?
10、Flink最新版本是多少?新旧版本有什么区别?
11、有没有了解过Flink的窗口函数?
12、离线数仓做了什么工作?
13、数仓为什么要分层?
14、实时数仓也要像离线数仓那样分层吗?
15、开发数仓的过程中有哪些注意的点?优化的点?
16、拉链表的分区是怎么设置的?(一级分区、二级分区?)
17、有哪些压缩方式?各有什么优缺点?
18、HDFS的小文件过多会导致什么问题?
19、未来的定位就是大数据开发吗?
20、平时有学习相关的知识吗?
21、主要看哪些技术论坛
22、反问:日常工作是什么?
离线数仓和实时数仓
23、部门规模有多少?数仓组有30多人。
24、反问:还有哪些可以提高的地方?离线或实时数仓可以再深入了解
一面就挂了,个人分析是对Flink不熟悉