• 踩坑指南:入门OpenTenBase之监控篇


    本次监控将采用Prometheus、Grafana可视化工具以及postgres_exporter对OpenTenBase进行全面监控和优化。

    安装监控

    Docker安装

    1、Docker要求 CentOs 系统的内核版本高于 3.10

    通过 uname-r命令查看你当前的内核版本

    uname -r

    2、使用 root 权限登录 Centos。确保 yum 包更新到最新。

    yum -y update

    3、卸载旧版本(如果安装过旧版本的话)

    sudo yum remove -y docker*

    4、安装需要的软件包,yum-utl 提供yum-config-manager功能,另外两个是devicemapper驱动依赖的

    yum install -y yum-utils

    5、设置yum源,并更新yum 的包索引

    yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
    yum makecache
    

    6、安装docker

    yum install -y docker-ce

    8、启动并加入开机启动

    systemctl start docker && systemctl enable docker

    9、验证安装是否成功(有client和service两部分表示docker安装启动都成功了)

    docker version

    10、配置docker镜像

    cd /etc/docker然后编辑vim daemon.json

    {
      "registry-mirrors": ["https://jbw52uwf.mirror.aliyuncs.com"]
    }
    

    保存退出。

    重启docker服务

    systemctl daemon-reload
    systemctl restart docker
    

    下载Prometheus

    在进行监控优化时,您可以从Prometheus官方网站下载最新版:https://prometheus.io/download/

    您可以选择下载源代码并解压使用,也可以通过Docker直接启动。本教程将重点介绍使用Docker进行快速部署。

    执行命令:

    docker run -d -p 9090:9090 -v /etc/prometheus:/etc/prometheus prom/prometheus

    完成挂载后,请对配置文件进行必要的修改以确保系统正常监控。

    vim prometheus.yml

    # my global config
    global:
      scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
      evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
      # scrape_timeout is set to the global default (10s).
    
    # Alertmanager configuration
    alerting:
      alertmanagers:
        - static_configs:
            - targets:
              # - alertmanager:9093
    
    # Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
    rule_files:
      # - "first_rules.yml"
      # - "second_rules.yml"
    
    # A scrape configuration containing exactly one endpoint to scrape:
    # Here it's Prometheus itself.
    scrape_configs:
      # The job name is added as a label `job=` to any timeseries scraped from this config.
      - job_name: "prometheus"
    
        # metrics_path defaults to '/metrics'
        # scheme defaults to 'http'.
    
        static_configs:
          - targets: ["192.168.56.10:9090"]
      # 主要修改这里,添加文件形式的扫描
      - job_name: "node"
        file_sd_configs:
        - refresh_interval: 10s
          files:
          - "/etc/prometheus/conf/node*.yaml"
    

    当前Prometheus的配置采用文件形式进行服务发现。在修改配置时,无需重新启动,系统将自动更新并生效,更新间隔为10秒。

    为了修改相关配置文件,首先创建一个名为conf的目录(mkdir conf)然后通过cd命令进入目录(cd /etc/prometheus/conf)接着使用vim编辑器来修改文件(vim node-ms.yaml

    - targets:
      - "ip:port"
      labels:
        hostname: pg
    

    为了自定义配置信息,请将相应的IP地址和主机名修改为您自己的信息。完成修改后,启动Prometheus服务,然后您可以通过访问http://您的IP地址:9090/ 来查看Prometheus的监控数据。

    下载Grafana

    为了确保配置的持久性,我们可以通过Docker容器以持久化形式启动Grafana。您可以使用以下命令来启动Grafana容器,并在容器重启后保留配置信息:

    docker run -d -p 3000:3000 --name=grafana --volume grafana-storage:/var/lib/grafana grafana/grafana-enterprise

    启动后,您可以在浏览器中输入http://您的IP地址:3000/

    使用默认的用户名和密码admin/admin登录,以查看Grafana监控界面。

    配置数据源

    image

    在这里,您只需填写URL(http://ip:9090/ )即可保存配置。这个URL指向Prometheus的地址,Grafana将通过该地址与Prometheus建立连接,从而获取数据用于展示监控面板。

    image

    下载Exporter

    Prometheus官方提供了丰富的Exporter,您可以在https://prometheus.io/docs/instrumenting/exporters/ 找到相关信息。

    我们可以安装postgres_exporter来监控数据库,官方地址为https://github.com/prometheus-community/postgres_exporter。

    同样可以以Docker启动:

    docker run --net=host -e DATA_SOURCE_NAME="postgresql://opentenbase:@ip:port/postgres?sslmode=disable" quay.io/prometheuscommunity/postgres-exporter

    ip和host修改为自己的信息即可,官方示例中对opentenbase用户并没有设置登录密码,我们也不设置密码进行登录。

    启动后,我们首先登录到数据库中,然后进行数据库用户的相关设置。

    CREATE OR REPLACE FUNCTION __tmp_create_user() returns void as $$
    BEGIN
      IF NOT EXISTS (
              SELECT                       -- SELECT list can stay empty for this
              FROM   pg_catalog.pg_user
              WHERE  usename = 'postgres_exporter') THEN
        CREATE USER postgres_exporter;
      END IF;
    END;
    $$ language plpgsql;
    
    SELECT __tmp_create_user();
    
    DROP FUNCTION __tmp_create_user();
    
    ALTER USER postgres_exporter WITH PASSWORD 'password';
    
    ALTER USER postgres_exporter SET SEARCH_PATH TO postgres_exporter,pg_catalog;
    
    GRANT CONNECT ON DATABASE postgres TO postgres_exporter;
    
    -- OpenTenBase中集成的PostgreSQL版本是10,所以可以执行以下语句,历史版本可前往开源地址进行查看。
    GRANT pg_monitor to postgres_exporter;
    

    postgres_exporter启动报错修复

    panic: Error converting setting "session_memory_size" value "3M" to float: strconv.ParseFloat: parsing "3M": invalid syntax
    
    goroutine 42 [running]:
    main.(*pgSetting).metric(0xc000081720, 0xc0000d5c50?)
            /app/cmd/postgres_exporter/pg_setting.go:87 +0x325
    main.querySettings(0x0?, 0xc00010d290)
            /app/cmd/postgres_exporter/pg_setting.go:56 +0x287
    main.(*Server).Scrape(0xc00010d290, 0xc000028011?, 0x90?)
            /app/cmd/postgres_exporter/server.go:121 +0xcb
    main.(*Exporter).scrapeDSN(0xc0000000c0, 0x44d406?, {0xc000028011, 0x46})
            /app/cmd/postgres_exporter/datasource.go:115 +0x1c5
    main.(*Exporter).scrape(0xc0000000c0, 0x0?)
            /app/cmd/postgres_exporter/postgres_exporter.go:679 +0x16c
    main.(*Exporter).Collect(0xc0000000c0, 0xc00003ff60?)
            /app/cmd/postgres_exporter/postgres_exporter.go:568 +0x25
    github.com/prometheus/client_golang/prometheus.(*Registry).Gather.func1()
            /go/pkg/mod/github.com/prometheus/client_golang@v1.17.0/prometheus/registry.go:457 +0xe7
    created by github.com/prometheus/client_golang/prometheus.(*Registry).Gather in goroutine 18
            /go/pkg/mod/github.com/prometheus/client_golang@v1.17.0/prometheus/registry.go:547 +0xbab
    

    查看postgres_exporter其源码发现端倪:

    SELECT name, setting, COALESCE(unit, ''), short_desc, vartype FROM pg_settings WHERE vartype IN ('bool', 'integer', 'real') AND name != 'sync_commit_cancel_wait';
    

    image

    确实是因为session_memory_size的显示问题,不过我已经提交了PR修复,官方修复后即可成功。

    image

    配置监控面板

    一旦所有组件都成功启动,接下来我们需要前往市场寻找我们想要的监控面板。你可以访问Grafana的官方仪表板市场:https://grafana.com/grafana/dashboards/?search=postgresql

    image

    一旦找到您喜欢的面板,请点击此处进行导入。以下以ID:9628为示例进行导入操作。

    这里选择我们的数据源。

    image

    让我们来看一下效果如何:

    image

    总结

    本次监控将采用Prometheus、Grafana可视化工具以及postgres_exporter对OpenTenBase进行全面监控和优化。首先,通过Docker安装了Prometheus,配置了必要的文件形式进行服务发现,实现了系统正常监控。接着,使用Docker启动Grafana,并配置数据源连接到Prometheus,展示监控面板。最后,安装了postgres_exporter以监控数据库,并解决了启动报错问题。在配置监控面板时,通过Grafana的仪表板市场找到了适合的监控面板,并成功导入使用。

  • 相关阅读:
    Python机器学习从0到1:从十余行代码看机器学习的套路(附零基础学习资料)
    重金属行业经销商渠道管理系统:完善客户管理体系,规范渠道销售管理
    Linux Ubuntu 22.04常用系统快捷键
    Sora 使用教程,新手小白可用
    ThingsBoard如何自定义tcp-transport
    【C++天梯计划】1.11 图论(graph theory)
    高通 mtk 展讯等芯片机型读取 备份手机全字库分区 的一些操作解析
    Orleans的成员管理和故障检测故障检测
    雾天行人车辆检测
    选座位吧(10)
  • 原文地址:https://www.cnblogs.com/guoxiaoyu/p/18117472