• 大数据中的分布式文件系统MapReduce的选择题


    一 . 选择题

    一. 单选题(共9题,49.5分)

    1. (单选题)下列传统并行计算框架,说法错误的是哪一项?
      A. 刀片服务器、高速网、SAN,价格贵,扩展性差上
      B. 共享式(共享内存/共享存储),容错性好
      C. 编程难度高
      D. 实时、细粒度计算、计算密集型
      正确答案: B:共享式(共享内存/共享存储),容错性好;
      5.5分
    2. (单选题)下列关于MapReduce模型的描述,错误的是哪一项?
      A. MapReduce采用“ 分而治之”策略
      B. MapReduce设计的一个理念就是“ 计算向数据靠拢”
      C. MapReduce框架采用了Master/Slave架构
      D. MapReduce应用程序只能用Java来写
      正确答案: D:MapReduce应用程序只能用Java来写;
      5.5分
    3. (单选题)MapReduce1.0的体系结构中,JobTracker是主要任务是什么?
      A. 负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
      B. 使用“slot”等量划分本节点上的资源量(CPU、内存等)
      C. 会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker
      D. 会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)
      正确答案: A:负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况;
      5.5分
    4. (单选题)下列关于MapReduce工作流程,哪个描述是正确的?
      A. 所有的数据交换都是通过MapReduce框架自身去实现的
      B. 不同的Map任务之间会进行通信
      C. 不同的Reduce任务之间可以发生信息交换
      D. 用户可以显式地从一台机器向另一台机器发送消息
      正确答案: A:所有的数据交换都是通过MapReduce框架自身去实现的;
      5.5分
    5. (单选题)下列关于MapReduce的说法,哪个描述是错误的?
      A. MapReduce具有广泛的应用,比如关系代数运算、分组与聚合运算等
      B. MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数
      C. 编程人员在不会分布式并行编程的情况下,也可以很容易将自己的程序运行在分布式系统上,完成海量数据集的计算
      D. 不同的Map任务之间可以进行通信
      正确答案: D:不同的Map任务之间可以进行通信;
      5.5分
    6. (单选题)下列关于Map和Reduce函数的描述,哪个是错误的?
      A. Map将小数据集进一步解析成一批对,输入Map函数中进行处理
      B. Map每一个输入的会输出一批是计算的中间结果
      C. Reduce输入的中间结果中的List(v 2 )表示是一批属于不同k 2 的value
      D. Reduce输入的中间结果中的List(v 2 )表示是一批属于同一个k 2 的value
      正确答案: C:Reduce输入的中间结果中的List(v 2 )表示是一批属于不同k 2 的value;
      5.5分
    7. (单选题)下面哪一项不是MapReduce体系结构主要部分?
      A. Client
      B. JobTracker
      C. TaskTracker以及Task
      D. Job
      正确答案: A:Client;
    8. (单选题)关于MapReduce1.0的体系结构的描述,下列说法错误的是?
      A. Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动
      B. slot 分为Map slot 和Reduce slot 两种,分别供MapTask 和Reduce Task 使用
      C. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
      D. TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)
      正确答案: A:Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动;
      5.5分
    9. (单选题)下列说法错误的是?
      A. Hadoop MapReduce是MapReduce的开源实现,后者比前者使用门槛低很多
      B. MapReduce采用非共享式架构,容错性好
      C. MapReduce主要用于批处理、实时、计算密集型应用
      D. MapReduce采用“ 分而治之”策略
      正确答案: C:MapReduce主要用于批处理、实时、计算密集型应用;
      二. 多选题(共9题,50.5分)
    10. (多选题)MapReduce相较于传统的并行计算框架有什么优势?
      A. 非共享式,容错性好
      B. 普通PC机,便宜,扩展性好
      C. 编程简单,只要告诉MapReduce做什么即可
      D. 批处理、非实时、数据密集型
      正确答案: ABCD:非共享式,容错性好; 普通PC机,便宜,扩展性好; 编程简单,只要告诉MapReduce做什么即可; 批处理、非实时、数据密集型;
      2.8分
    11. (多选题)MapReduce体系结构主要由以下那几个部分构成?
      A. Client
      B. JobTracker
      C. TaskTracker
      D. Task
      正确答案: ABCD:Client; JobTracker; TaskTracker; Task;
      5.5分
    12. (多选题)下列关于MapReduce的体系结构的描述,说法正确的有?
      A. 用户编写的MapReduce程序通过Client提交到JobTracker端
      B. JobTracker负责资源监控和作业调度
      C. TaskTracker监控所有TaskTracker与Job的健康状况
      D. TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
      正确答案: ABD:用户编写的MapReduce程序通过Client提交到JobTracker端; JobTracker负责资源监控和作业调度; TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等);
      5.5分
    13. (多选题)MapReduce的作业主要包括什么?
      A. 从磁盘或从网络读取数据,即IO密集工作
      B. 计算数据,即CPU密集工作
      C. 针对不同的工作节点选择合适硬件类型
      D. 负责协调集群中的数据存储
      正确答案: AB:从磁盘或从网络读取数据,即IO密集工作; 计算数据,即CPU密集工作;
      5.5分
    14. (多选题)对于MapReduce 而言,其处理单位是split。split 是一个逻辑概念,它包含哪些元数据信息?
      A. 数据起始位置
      B. 数据长度
      C. 数据所在节点
      D. 数据大小
      正确答案: AB:数据起始位置; 数据长度;
    15. (多选题)下列关于Map 端的Shuffle的描述,哪些是正确的?
      A. MapReduce默认为每个Map任务分配1000MB缓存
      B. 多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
      C. 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
      D. 每个Map任务分配多个缓存,使得任务运行更有效率
      正确答案: BC:多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的; 当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce;
      5.5分
    16. (多选题)MapReduce的具体应用包括哪些?
      A. 关系代数运算(选择、投影、并、交、差、连接)
      B. 分组与聚合运算
      C. 矩阵-向量乘法
      D. 矩阵乘法
      正确答案: ABCD:关系代数运算(选择、投影、并、交、差、连接); 分组与聚合运算; 矩阵-向量乘法; 矩阵乘法;
      5.5分
    17. (多选题)MapReduce执行的全过程包括以下哪几个主要阶段?
      A. 从分布式文件系统读入数据
      B. 执行Map任务输出中间结果
      C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
      D. 执行Reduce任务得到最终结果并写入分布式文件系统
      正确答案: ABCD:从分布式文件系统读入数据; 执行Map任务输出中间结果; 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务; 执行Reduce任务得到最终结果并写入分布式文件系统;
      5.5分
    18. (多选题)下列说法正确的是?
      A. MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
      B. Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
      C. 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
      D. 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息
      正确答案: ABCD:MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task; Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动; 在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的; 在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息;
  • 相关阅读:
    差分数组(定义+性质+证明+代码实现+巩固练习)
    量产技术与成本比拼“升级”,谁能打赢4D成像雷达的规模化之战?
    Node.js(3)-Buffer对象
    GBase 8s ALTER FRAGMENT 语句 MODIFY子句(三)
    docker部署安装Nginx
    剑指 Offer 03. 数组中重复的数字
    C# WPF 开发一个 Emoji 表情查看软件
    【ML】机器学习分类算法大总结(最全分类算法从LR、SVM、RF到XGBoost、lightgbm、deepforest等)
    docker入门介绍
    【C语言】数据类型之结构体
  • 原文地址:https://blog.csdn.net/m0_74459049/article/details/134223901