20222 大数据管理与分析 期末考试
SDU 2019 计科
题目与往年差距比较大
- 简述人们对大数据的认识和发展历程,以及大数据技术的发展过程
- HDFS 存储数据有何优势
- 写自然连接的MapReduce 伪代码 以及输入输出
- 简述HBase 数据模型,以及如果高效查询数据
- Hive 与 传统的关系型数据仓库相比的异同点,详细叙述一个HIVE的应用系统
- KNN MapReduce伪代码,输入输出
- Apriori算法的思想 以及Spark伪代码……
- 唯一一道送分题
- 等深均分 + 边界光滑
- 正规化 num-min / max - min
- 微博流数据,说明架构 写 实现方式,
按理说流数据用storm啊,哪写过storm
- 设计新一代健康码,叙述功能、架构设计、所用算法、软件系统
快逃……吧
和往年题目差距太大,实验太多,还有课设,考的也晚,绷不住了