码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【大数据】hadoop概述(学习笔记)


    一、介绍

    Hadoop是Apache软件基金会的开源软件

    hadoop核心组件:

    • Hadoop HDFS(分布式文件存储系统):解决海量数据存储
    • Hadoop YARN (集群资源管理和任务调度框架):解决资源任务调度
    • Hadoop MapReduce(分布式计算框架):解决海量数据计算

    广义上Hadoop指的是围绕Hadoop打造的大数据生态圈

    二、简史

    Hadoop之父:Doug Cutting

    Hadoop起源于Apache Lucene子项目:Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎

    三、现状

    HDFS作为为分布式文件存储系统,处在生态圈的底层与核心地位

    YARN作为分布式通用的集群资源管理系统和任务调度平台 ,支撑各种计算引擎运行,保证了Hadoop地位

    MapReduce作为大数据生态圈第一代分布式计算引擎,由于自身设计的模型所产生的弊端 ,导致企业一线几乎不再直接使用MapReduce进行编程处理,但是很多软件的底层依然在使用MapReduce引擎来处理数据

    四、优点

    扩容能力:可以分布在各个节点

    成本低:部署普通廉价的机器组成集群来处理大数据

    效率高:通过并发数据,可以在节点之间动态并行的移动数据

    可靠性:能自动维护数据的多份复制,并且在任务失败后能自动地重新部署计算任务

    通用性(与业务脱钩)、简单性

    五、版本

    开源社区版:官方发行版本,兼容性稳定性一般

    http://hadoop.apache.org/

    商业发行版:稳定性好、得加钱…

    Cloudera、Hortonworks

    六、架构变迁

    Hadoop 1.0

    HDFS(分布式文件存储)

    MapReduce(资源管理和分布式数据处理)

    Hadoop 2.0

    HDFS(分布式文件存储)

    MapReduce (分布式数据处理)

    YARN(集群资源管理、任务调度)

    Hadoop 3.0

    精简内核、类路径隔离、she11脚本重构

    Hadoop HDFS:EC纠删码、多NameNode支持

    Hadoop MapReduce:任务本地化优化、 内存参数自动推断

    Hadoop YARN:Timeline Service v2、队列配置

  • 相关阅读:
    Linux:Ubuntu20,22,Debian10,Fedora36,CentOS9 将硬件时钟设为本地 笔记221111
    源码分析:ThreadLocal如何实现线程本地化存储的?
    TwinCAT3安装教程
    NoSQL —— NoSQL 三大理论基石 —— CAP —— BASE—— 最终一致性
    Gerrit 使用教程
    Go 语言控制台输入&生成随机数
    【web前端】<meta>标签
    《Brave New Words 》9.1 AI 世界中的就业
    2022年认证杯SPSSPRO杯数学建模C题(第二阶段)污水流行病学原理在新冠疫情防控方面的作用求解全过程文档及程序
    自动拉取和推送docker镜像到私有仓库(skopeo)
  • 原文地址:https://blog.csdn.net/wmh1024/article/details/133623315
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号