当我们需要获取某台主机上的数据时,直接利用 zabbix 提供的模板可以很方便的获得需要的数据,但是有些特别的数据,利用这些现有的模板或监控项是无法实现的,例如网站状态信息的监控、mysql数据库主从状态等信息。这是就需要自己定义键值和监控项,以满足企业对检测数据的需要。
Zabbix 中内置了很多监控参数(Key),我们可以通过在客户端配置文件中定义 key,获取监控对象中的系统、CPU、网络、内存、文件系统等信息。
Key(键)是 zabbix 标记 item 的键,是一种标识符。利用 key 可以定义一个监控对象,那么这个监控对象肯定是采集数据的,但是采集数据的时候可能存在很多节点与 server 交互,那么需要具体采集哪个节点,就可以用 key 进行采集。
监控项(Itens)就是监控指标获取数据的方式、数据类型、更新数据的时间间隔、历史数据保留时间、趋势数据保留时间、监控项的分组等指标。另外一个概念是监控指标,用 key 表示,它是构成监控项的一个元素,在一个主机/模板中必须是唯一的。
zabbix agent 是利用 key 值获取主机监控数据的,在每个 agent 端的监控项上,都可以找到 zabbix客户端对应的许多 key 值。
“数据采集”-->“主机”-->“监控项”,可以看到每台主机的监控项中,为了采集对应的主机信息,都有一个键值,利用这个键值,Zabbix就可以获取对应的数据。
- [root@ZBX ~]# zabbix get -s 192.168.10.101 -k system.cpu.num
- 1
[root@ZBX ~]# zabbix get -s 192.168.10.101 -k system.unameLinux localhost,localdomain 3,10,0-1160.e17.x86 64 #1 SMP Mon Oct 19 16:18:59 UTC 2020x86 64
- [root@zBX ~]# zabbix_get -s 192.168.10.101 -k net.tcp.port[,22]
- 1
备注:
1 为开启,0 为关闭
- [root@ZBX ~]# zabbix get -s 192.168.10.101 -k proc.num[sshd]
- 9
备注:
如果开启,显示对应的进程数
- [root@ZBX ~]# zabbix get -s 192.168.10.101 -k proc.num[sshd]
- 9
备注:
如果开启,显示对应的进程数
- [root@ZBX ~]# zabbix get -s 192.168.10.101 -p 10050 -k vfs.fs.size[/,pfree]
- 97.051317
- [root@ZBX ~]# zabbix_get -s 192.168.10.101 -k net.if.out[ens33,bytes]
- 796888
备注:
在不同时间执行两次这个命令,用后面的减去前面的,除以两者之间的时间,得到速率
- [root@ZBX ~]# zabbix get -s 192.168.10.101 -p 10050 -k vm.memory.size[total]
- 3953934336
备注:
获取目标主机内存值
使用 zabbix agent 自带的 key 值,我们已经可以监控到很多数据了,但是仍然有一些数据,是 agent的 key 值没有的。对于这些特殊的需求,就要求我们自己定义 key 值。
- [root@server01 ~]# yum -y install nginx
- root@server01 ~l# cd /etc/nginx/
- root@server01 ~]# cp nginx.conf.default nginx.conf
[root@server01 ~l# vim /etc/nginx/nginx.conf
- [root@server01 ~]# echo "test"> /usr/share/nginx/html/index.html
- [root@server01 ~l# systemctl start nginx
- [root@server01 ~]# curl 127.0.0.1/nginx status
- Active connections:1
- server accepts handled requests
- 1 1 1
- Reading:0 Writing:1 Waiting:0
备注:
Active connections :Nginx正处理的活动链接数1个。
server :
accepts:Nginx 启动到现在共处理了16449个连接。
handled:Nginx启动到现在共成功创建16449次握手。
requests:Nginx 总共处理了15422 次请求。
Reading :Nginx 读取到客户端的 Header 信息数
Writing :Nginx 返回给客户端的 Header 信息数
Waiting :Nginx 已经处理完正在等候下一次请求指令的驻留链接,开启。
- [root@server01 ~]# vim /etc/zabbix/nginx-status.sh
- #/bin/bash
- NGINX_PORT=80
- NGINX_COMMAND=$1
- nginx_active(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Active/ {print $NF}'
- }
- nginx_reading(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Reading/ {print $2}'
- }
- nginx_writing(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Writing/ {print $4}'
- }
- nginx_waiting(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk '/Waiting/ {print $6}'
- }
- nginx_accepts(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk 'NR==3 {print $1}'
- }
- nginx_handled(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk 'NR==3 {print $2}'
- }
- nginx_requests(){
- /usr/bin/curl -s "http://127.0.0.1:"$NGINX_PORT"/nginx_status/" |awk 'NR==3 {print $3}'
- }
- case $NGINX_COMMAND in
- active)
- nginx_active;
- ;;
- reading)
- nginx_reading;
- ;;
- writing)
- nginx_writing;
- ;;
- waiting)
- nginx_waiting;
- ;;
- accepts)
- nginx_accepts;
- ;;
- handled)
- nginx_handled;
- ;;
- requests)
- nginx_requests;
- ;;
- *)
- echo $"USAGE:$0 {active|reading|writing|waiting|accepts|handled|requests}"
- esac
-
[root@server01 ~]# chmod+x /etc/zabbix/nginx-status.sh
- [root@server01 ~]# vim /etc/zabbix/zabbix agentd.confUnsafe
- UserParameters=1
- UserParameter=nginx status[*],/etc/zabbix/nginx-status.sh $1
备注:
UnsafeUserParameters=1:启用自定义key功能
UserParameter:指定脚本
nginx_status 为 key 值名称。[*]里写脚本参数,没有可以不写。/etc/zabbix/nginx-status.sh $1 路径为脚本所在路径。
[root@server01 ~l# systemctl restart zabbix-agent
[root@zabbix ~]# zabbix get -s 192.168.10.101 -k nginx status[accepts]
“数据采集”-->“模板”-->“创建模板”,创建一个名为 Nginx 状态的模板
点击“数据采集”,再点击“模板”选项后,找到刚刚创建名为 Nginx 状态的模板,点击“监控项后,再点击“创建监控项”按钮,创建出如下监控项。
添加监控项
监控项 nginx active 键值为 nginx status[active]
监控项 nginx reading 键值为 nginx status[reading]
监控项 nginx writing 键值为 nginx status[writing]
监控项 nginx waiting 键值为 nginx status[waiting]
监控项 nginx accepts 键值为 nginx status[accepts]
监控项 nginx handled 键值为 nginx status[handled]
监控项 nginx requests 键值为 nginx status[requests]
“数据采集”-->“主机”,为该主机关联刚才创建的模板。
“数据采集”-->“主机”-->“图形”,创建 nginx active 图形
备注:
其他监控项的图形创建方法一样,此处不在一一列举。
“检测”-->“主机”,査看 server01 的检测数据,以及新添加的图形。
点击“数据采集”按钮,再点击“模板”选项,然后点击“nginx-status”模板,选择“触发器选项,点击“创建触发器”按钮
添加表达式,点击“添加”按钮,在弹出界面里监控项选择 nginx 主机 的“nginx active监控项,功能选择“last-最后(最近)的 T 值,结果大于 N”,N 填写“5”,再点击“插入”按钮。这里的意思是当 Nginx 的活动连接大于 5 时,触发报警。
注意:由于是实验环境,这里 N可以设置的小一些,便于验证结果,在生产环境中可以根据需求更改。
“告警”-->“动作”-->“触发器动作”,点击创建动作按钮。
添加触发条件,条件选项触发器,并指定上一步中创建的触发器。
设置触发器的操作,指定触发后发送报警信息的接收用户。
模拟多个用户访问网站,使得连接数大于前面设定的报警阈值,并观察邮箱的报警邮件
备注:
小技巧:写个无限访问小脚本,在多台主机上执行此脚本,即可模拟出多个用户的连接。
- cat <<EOF>fangwenjiaoben.sh
- while true
- do
- curl 192.168.10.101
- done
- EOF
-
[root@server01 ~]# yum -y install mariadb-server mysql
- [root@server01 ~]# vim /etc/my.cnf
- [mysqld]
- datadir=/var/lib/mysql
- socket=/var/lib/mysql/mysql.sock
- server-id=11
- log-bin=master-bin
- [root@server01 ~]# systemctl start mariadb
- [root@server01 ~]# mysqladmin -uroot password 'pwd123'
- [root@server01 ~]# mysql:-uroot -ppwd123
- MariaDB [(none)>grant replication slave on *.*to root@'%'identified by'pwd123';
- MariaDB [(none)>show master status;
- [root@server02 ~]# vim /etc/my.cnf
- [mysqld]
- datadir=/var/lib/mysql
- socket=/var/lib/mysql/mysql.sock
- server-id=22
- [root@server02 ~]# systemctl start mariadb
- [root@server02 ~]# mysqladmin -uroot password'pwd123
- [root@server02 ~]# mysql -uroot -ppwd123
- MariaDB [(none)]> change master to
- master host='192.168.10.101',master user='root',master password='pwd123',master logfile='master-bin.000001',master log pos=385;
- MariaDB [(none)]> start slave;
- MariaDB [(none)]> show slave status\G
- *************************** 1. row ***************************
- Slave_IO_State: Waiting for master to send event
- Master_Host: 192.168.10.101
- Master_User: root
- Master_Port: 3306
- Connect_Retry: 60
- Master_Log_File: master-bin.000003
- Read_Master_Log_Pos: 522
- Relay_Log_File: mariadb-relay-bin.000003
- Relay_Log_Pos: 530
- Relay_Master_Log_File: master-bin.000003
- Slave_IO_Running: Yes
- Slave_SQL_Running: Yes
- Replicate_Do_DB:
- Replicate_Ignore_DB:
- Replicate_Do_Table:
- Replicate_Ignore_Table:
- Replicate_Wild_Do_Table:
- Replicate_Wild_Ignore_Table:
- Last_Errno: 0
- Last_Error:
- Skip_Counter: 0
- Exec_Master_Log_Pos: 522
- Relay_Log_Space: 1111
- Until_Condition: None
- Until_Log_File:
- Until_Log_Pos: 0
- Master_SSL_Allowed: No
- Master_SSL_CA_File:
- Master_SSL_CA_Path:
- Master_SSL_Cert:
- Master_SSL_Cipher:
- Master_SSL_Key:
- Seconds_Behind_Master: 0
- Master_SSL_Verify_Server_Cert: No
- Last_IO_Errno: 0
- Last_IO_Error:
- Last_SQL_Errno: 0
- Last_SQL_Error:
- Replicate_Ignore_Server_Ids:
- Master_Server_Id: 11
- 1 row in set (0.00 sec)
- [root@server02 ~]# vim /etc/zabbix/zabbix agentd.conf
- UnsafeUserParameters=1
- UserParameter=mysql.slave[*],/etc/zabbix/mysql-slave.sh
- [root@server02 ~]# vim /etc/zabbix/mysql-slave.sh
- #!/bin/bash
- /usr/bin/mysql-ppwd123-uroot"showslavestatus\G'grep-E-e"slave Io Runninglslave SoL Running" awk '{print $2}'grep -c Yes
- [root@server02 ~]# chmod +x /etc/zabbix/mysql-slave.sh
- [root@server02 ~]# systemctl restart zabbix-agent
- [root@zabbix ~]# zabbix get -s 192.168.10.102 -k mysql.slave[*]
- 2
备注:
Slave_IO_ Runningt 和Slave_SoL_Running 返回的yes 值为2
“数据采集”-->“模板”,再点击“创建模板”按钮,进行创建模板操作。
“数据采集”-->“模板”,点击刚才创建的模板,为此模板添加“监控项”信息,名称输入“mysql-slave”键值输入“mysql.slave[*]”,然后点击“添加”按钮。
为 server02 主机关联刚才创建的监控模板
"数据采集”-->“模板”,找到刚才创建的模板 mysql-slave,点击“触发器”,再点击“创建触发器”。
在监控项中点击“选择”按钮,选择前面创建的 mysql-slave 监控项,在功能处点击下拉菜单,选择“last-最后(最近)的 T 值”,结果为 “告警”-->“动作”-->“触发器动作” 条件选项触发器,并指定上一步中创建的触发器 关闭 mysq1 从节点的 slave 进程 观察报警信息 监控网站关键词与监控 Nginx 大致相同,都是编写检索字段的脚本,然后 web 端添加监控。 “数据采集”-->“模板”,点击创建模板,在此界面配置“关键词检索模板”,添加模板相关信息。 “数据采集”-->“模板”,找到刚才创建的模板,点击它的监控项,并创建监控项,键值为 nginx_gjc。 “数据采集”-->“主机”,找到 nginx 的服务器,为此主机关联刚才创建的模板。 “数据采集”-->“模板”,找到此模板,点击它的触发器,为此模板创建触发器。 告警-->动作-->触发器动作,创建 server01 的告警动作和操作。 注意:(1)添加告警动作和操作
9.测试
五、监控网站关键词
1.创建测试页面
2.编写检索脚本
[root@server01 ~]# chmod +x /etc/zabbix/gjc.sh
3.开启 Agent 的自定义 key 值
[root@server01 ~]# systemctl restart zabbix-agent
4.在管理界面添加模板
5.为模板添加监控项
6.将模板关联到主机
7.为模板添加触发器
8.Zabbix_get 测试
9.添加告警动作和操作
10.查看触发的告警信息
如果有告警信息,但是不发送邮件,可以先把nginx 关掉,再打开,重新触发一。