• (二十四)大数据实战——Flume数据流监控之Ganglia的安装与部署


    前言

    本节内容我们主要介绍一下Flume数据流的监控工具Ganglia。Ganglia是一个开源的分布式系统性能监控工具。它被设计用于监视大规模的计算机群集(包括集群、网格和云环境),以便收集和展示系统和应用程序的性能数据。Ganglia 可以轻松地扩展到数千台计算机节点,并支持跨多个数据中心进行分布式监控。Ganglia 使用高效的多播通信协议和紧凑的数据格式,以最小化对网络和系统资源的影响。Ganglia 提供实时监控和报告功能,可以显示关键指标(如 CPU 使用率、内存使用率、网络流量等)的实时数据和历史趋势。Ganglia 提供直观的 Web 界面,可以通过图表和图形方式展示系统性能数据,方便用户进行可视化分析。Ganglia 支持插件机制,可以扩展其功能并与其他工具和服务集成。

    正文

    • 服务规划

    Ganglia
    hadoop101hadoop102hadoop103
    gweb
    gmetad
    gmodgmodgmod
    • Ganglia组件说明

    gmond(Ganglia Monitoring Daemon):是一种轻量级服务,安装在每台需要收集指标数据的节点主机上。使用 gmond,你可以很容易收集很多系统指标数据,如 CPU、内存、磁盘、 网络和活跃进程的数据等。

    gmetad(Ganglia Meta Daemon):整合所有信息,并将其以 RRD 格式存储至磁盘的服务。

    gweb(Ganglia Web)Ganglia :可视化工具,gweb 是一种利用浏览器显示 gmetad 所存储数据的 PHP前端。在Web界面中以图表方式展现集群的运行状态下收集的多种不同指标数 据。

    • 在hadoop101、hadoop102、hadoop103分别安装epel-release

    - 命令:sudo yum -y install epel-release 

    •  在hadoop101上安装ganglia-gmetad、ganglia-web、ganglia-gmond

    - 命令:

    sudo yum -y install ganglia-gmetad

    sudo yum -y install ganglia-gmond

    sudo yum -y install ganglia-web

    • 在hadoop102和hadoop103上安装ganglia-gmond 

    - 命令:

    sudo yum -y install ganglia-gmond

    •  在hadoop101服务器修改/etc/httpd/conf.d/ganglia.conf配置文件

    - 使得该网段地址192.168.10.0/24都能访问ganglia-web

    •  在hadoop101服务器修改/etc/ganglia/gmetad.conf配置文件

    - 修改元数据的存储位置

    • 在hadoop101、hadoop102、hadoop 103 修改配置文件/etc/ganglia/gmond.conf 

    - 修改hadoop101的gmond.conf 配置

    - 同步配置到hadoop102和hadoop103

    • 将hadoop101配置文件/etc/selinux/config中的SELINUX修改为disabled

    • 启动ganglia的监控服务

    - 在hadoop101、hadoop02、hadoop103启动gmond服务:sudo systemctl start gmond

    - 在hadoop101启动httpd和gmetad服务

    • 访问ganglia的web端页面

     

    •  开启一个flume监控任务,查看ganglia的web端页面查看监控指标

    - 在hadoop101服务器上启动一个flume监控任务

    1. bin/flume-ng agent \
    2. -c conf/ \
    3. -n a1 \
    4. -f job/job-netcat-flume-console.conf \
    5. -Dflume.root.logger=INFO,console \
    6. -Dflume.monitoring.type=ganglia \
    7. -Dflume.monitoring.hosts=hadoop101:8649

    • 图例说明
    图例说明
    EventPutAttemptCountsource 尝试写入 channel 的事件总数量
    EventPutSuccessCount成功写入 channel 且提交的事件总数量
    EventTakeAttemptCount sink 尝试从 channel 拉取事件的总数量。
    EventTakeSuccessCountsink 成功读取的事件的总数量
    StartTimechannel 启动的时间(毫秒)
    StopTimechannel 停止的时间(毫秒)
    ChannelSize目前 channel 中事件的总数量
    ChannelFillPercentagechannel 占用百分比
    ChannelCapacitychannel 的容量

    结语

    关于Flume数据流监控之Ganglia的安装与部署内容到这里就结束了,我们下期见。。。。。。

  • 相关阅读:
    概率统计·随机变量的数字特征【数学期望、方差】
    深度学习实战60-基于深度学习模型搭建人脸识别系统,用最简单的方式实现人脸识别。
    【操作系统】调度算法的评价指标和三种调度算法
    MySQL SQL100道基础练习题
    java8 Lambda表达式以及Stream 流
    C++23:多维视图(std::mdspan)
    C#循环定时上传数据,失败重传解决方案,数据库标识
    R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用anova函数进行方差分析通过p值确认指定连续变量和风险值HR之间是否存在非线性关系
    力扣经典150题第四十题:同构字符串
    淘女郎买家秀API接口
  • 原文地址:https://blog.csdn.net/yprufeng/article/details/132724759