码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • hadoop 4.0 知识整理


    hadoop

    hadoop 是什么

    hadoop是一个分布式系统基础架构,主要解决海量数据存储和计算问题。

    hadoop 优势

    多副本机制保证系统可靠性,处理节点可以动态添加/删除保证系统的可扩展性,MapReduce并行工作保证系统的高效性,失败任务默认重新分配4次执行保证系统的容错性。

    hadoop 组成部分

    HDFS存储数据,MapReduce分析计算数据,Yarn根据计算任务分发资源。

    HDFS 组成部分

    NameNode:管理文件块名称列表和对应文件块所在的DataNode,副本数量,权限信息。
    DataNode:文件块数据存储的节点,NameNode上维护的信息是DataNode主动发给NameNode的,默认6个小时和hadoop重启会发送。还会主动发送心跳机制,NameNode默认在10分钟+30秒没有收到心跳则判断该DataNode节点不可用。
    SecondaryNameNode:NameNode节点的辅助管理节点,辅助追加日志和元数据的合并。

    MapReduce 组成部分

    Map阶段:并行处理传入数据
    Reduce阶段:并行根据分区拉起Map输出结果进行汇总等处理,输出结果。
    Shuffle阶段:Map阶段到Reduce阶段的中间部分,主要设置分区或根据key值进行排序/合并或中间文件压缩传输等操作。

    Yarn

  • 相关阅读:
    基于Java毕业设计在线培训课程网站管理系统源码+系统+mysql+lw文档+部署软件
    el-select应用虚拟列表,避免过多数据导致浏览器卡死
    如何去掉照片中多余路人?一分钟帮你搞定
    udev日志调试
    Nginx参数配置详细说明【全局、http块、server块、events块】【已亲测】
    Android 如何在Service中使用ViewModel
    后端中间件安装与启动(Redis、Nginx、Nacos、Kafka)
    linux系统如何定时关机
    闭包(函数)
    如何利用Socks5代理IP提升网络安全与跨境电商业务
  • 原文地址:https://blog.csdn.net/fenggfa/article/details/127933499
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号