码农知识堂 - 1000bd
Python
PHP
JS/TS
JAVA
C/C++
C#
GO
Kotlin
Swift
【Hadoop---02】Hadoop简介
文章目录
1. Hadoop是什么?
2. Hadoop组成
3. Hadoop的生态圈
1. Hadoop是什么?
什么是Hadoop:是
分布式系统
基础架构
。
作用:解决大数据的
存储
与
分析计算
。 【大数据有三个问题待解决:
采集、存储和分析计算
。Hadoop解决了后两个问题,采集由Flume、kafka等解决。】
特点:
高可靠性
:因为每个服务器都有副本,当某个存储出现故障,能从副本中拿。
高扩展性
:扩展服务器时,并不需要关闭已有的服务器,即可以动态扩展服务器。
高效性
:一个任务分成多个部分,分别交给服务器,并行的处理,提高效率。
高容错性
:能够自动将失败的任务重新分配。
2. Hadoop组成
HDFS:hadoop的分布式文件系统。
用于
数据存储
。由3部分组成:
1. NameNode:简称nn。用于存储文件的
元数据
,如
文件名、文件目录、文件属性、文件的块列表及块所在的DataNode
等。
2. DataNode:简称dn。用于存放文件的
块数据
和
块数据的校验和
。
3. Secondary NameNode:用于每隔一段时间对NameNode进行备份。
yarn:hadoop的资源管理器。
用于
资源调度
。由4部分组成:
ResourceManager:简称RM。对所有资源(主要是内存和CPU)进行管理。
NodeManager:简称NM。对单节点资源(主要是内存和CPU)进行管理。
Container:容器。相当于一台服务器。
ApplicationMaster:简称AM。单个运行任务。
MapReduce:用于hadoop数据的分析计算。
由2部分组成:
Map:并行处理数据输入。
Reduce:对Map结果进行汇总。
4. 查找一个文件的工作流程:
3. Hadoop的生态圈
当前主流的架构图:
相关阅读:
华为机试真题 C++ 实现【猴子爬山】
微信小程序如何分包
Lesson4-1:OpenCV图像特征提取与描述---角点特征
Ipad电容笔买原装还是平替?高性价比的ipad平替电容笔推荐
这么久了适配器模式还不会?
三成青少年“不能忍受没有手机”?数字时代家庭教育新责任考验家长
utf8和utf8mb4字符集
基于Spring的发布订阅模式 EventListener
[H5动画制作系列] Sprite及Text Demo
java计算机毕业设计高校科研信息管理系统源码+mysql数据库+系统+lw文档+部署
原文地址:https://blog.csdn.net/qq_43546676/article/details/126910448
最新文章
攻防演习之三天拿下官网站群
数据安全治理学习——前期安全规划和安全管理体系建设
企业安全 | 企业内一次钓鱼演练准备过程
内网渗透测试 | Kerberos协议及其部分攻击手法
0day的产生 | 不懂代码的"代码审计"
安装scrcpy-client模块av模块异常,环境问题解决方案
leetcode hot100【LeetCode 279. 完全平方数】java实现
OpenWrt下安装Mosquitto
AnatoMask论文汇总
【AI日记】24.11.01 LangChain、openai api和github copilot
热门文章
十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
奉劝各位学弟学妹们,该打造你的技术影响力了!
五年了,我在 CSDN 的两个一百万。
Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
面试官都震惊,你这网络基础可以啊!
你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
心情不好的时候,用 Python 画棵樱花树送给自己吧
通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
13 万字 C 语言从入门到精通保姆级教程2021 年版
10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系
2656653265@qq.com
京ICP备2022015340号-1
正则表达式工具
cron表达式工具
密码生成工具
京公网安备 11010502049817号