• 2023秋招—大数据开发面经—杰创智能科技


    笔试:选择题+填空题+判断题+简答题

    简答题

    1、说说大数据技术的特点

    2、说一下Spark任务执行的流程

    3、1G的文件,每一行是一个词,词大小不超过16字节,内存1M,找出频数最高的100个词。

    技术面

    1、自我介绍

    2、本专业主要学什么?

    3、介绍一下实习的项目

    4、小文件问题怎么处理?(SequenceFile、CombineInputFormat、JVM重用)

    5、Hive支持哪些存储格式?(TextFile、SequenceFile、ORC、Parquet)

    6、ORC和Parquet有什么区别?

    7、哪些压缩格式?(gzip、bzip、snappy、lzo)

    8、Hive的数据倾斜是怎么处理的?

    9、分区和分桶有什么区别?

    10、SQL提交到Hive的过程是怎样的?

    11、Hive方面的调优有什么手段?

    12、大表和大表之间的join怎么避免内存溢出?

    13、介绍一下自学项目

    14、哪些数据需要全量,哪些需要增量?怎么做到全量和增量

    15、Flume挂了怎么处理?

    16、Flume怎么做到精准一致性?

    17、Flume写到HDFS怎么分区?

    18、Hive的数据同步到HBase要怎么做?

    19、JVM内存模型是怎样的?

    20、介绍一下垃圾回收机制?有哪些垃圾回收算法?内存碎片化会导致什么问题?

    21、Java常见的设计模式有哪些?单例模式的实现方式有哪些?(说了两种,问第三种)

    22、Spark程序的执行过程

    23、Stage是怎么划分?

    24、介绍一下Shuffle

    25、Spark和Flink有什么区别?(说了Flink的checkpoint,下面马上问了,给自己挖坑了!)

    26、Flink的checkpoint机制是怎样的?

    27、水位线是怎么更新的?

    28、Flink如何处理迟到很久的数据?(答了侧输出流)

    反问

    1、研发中心有什么组织?大数据科室(平台开发、数仓、算法、前后端,二三十人)

    2、做什么工作?主要做公安,有需要到现场,做的是平台、系统开发

    3、团队氛围怎样?挺融洽,不定时组织学习交流会、团建

    终面

    1、讲讲印象最深刻的事件?遇到什么困难?怎么解决的?

    2、给一个月时间,想做什么方向的研究或开发?细讲

    3、介绍个人对岗位的理解,分析自己的优势和劣势,怎么弥补劣势

    4、选择一个话题谈自己的看法:

    (1)20大

    (2)俄乌战争的启示

    (3)国内外疫情防控的差异,我国防控方法的好处和坏处

    5、谈谈自己对行业、企业的选择

    6、三方什么时候下来?如果发了offer,什么时候能来实习?

    笔试和一面技术面是线下去公司,还包午餐,公司工作环境不错

    技术面问得很多,有些比较细,要做好准备

    终面线上,三个候选人2个面试官

    最终拿到了offer,但因为后面拿到更满意的,所以拒了

    感谢杰创给我第一个offer,让我在秋招中信心大增,祝公司越办越好~

  • 相关阅读:
    java 实现删除单链表中所有指定的结点以及如何清空单链表
    加快访问github的速度解决方案
    R语言ggplot2可视化:可视化折线图、使用labs函数为折线图添加自定义的X轴标签信息
    学习Hadoop(一)了解Haddop及搭建伪分布式Hadoop1.0
    mysqld: File ‘./binlog.index‘ not found (OS errno 13 - Permission denied) 问题解决
    for...in 和 for...of 的区别
    linux下安装openwrt(kvm虚拟机下安装)
    web课程设计网页规划与设计 html+css+javascript+jquery+bootstarp响应式游戏网站Bootstrap模板(24页)
    【短文】vim怎么切换文件
    mysql 的注释 -- 其后要加上空格
  • 原文地址:https://blog.csdn.net/m0_65025800/article/details/127897960