写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。
时长:30min
项目怎么做的
这个问题又来了,差不多每次面试都有,这次我也没有客气,直接一口气说了三个,面试官很好,没有打断,我看一直在仔细的听
数据倾斜怎么处理的?怎么产生的?
小文件怎么处理的?
数仓分层怎么做的?
对于公司的分层,有一些自己的想法吗?有哪些你认为不足的地方?
任务是怎么调度的?
存储的数据太大的时候,有什么方法降低存储吗?
副本策略,数据压缩,数据重分布
数据域是怎么划分的?数据域是越多越好吗?
数据域的划分你有自己的想法吗?认为哪些不太合理?
对房产业务有兴趣吗?能接受这类业务的工作吗?
spark和hadoop的区别?spark的shuffle类型?
clickhouse有什么优缺点?
反问
工作内容,工作匹配度
面试官给的反馈还不错,面试官说有这方面工作经历的应届生不多,这是个优势
总结:这次面试感觉面试官有点腼腆,问题并不是特别难,对于技术八股问的不多,对于一些网络、操作系统也是没问,但是对于项目和对数据仓库的理解问的比较多,可能面试官比较注重面试者的独自思考能力,问了我对数据域、开发流程的一些自己的见解和觉得不足的地方。总体感觉面试官没有刻意为难,面试体验良好,问题不难。