• 腾讯mini项目-【指标监控服务重构】2023-08-20


    今日已办

    PPT制作

    答辩流程

    1. 概述:对项目背景、架构进行介绍(体现我们分组的区别和需求)
    2. 人员:小组成员进行简短的自我介绍和在项目中的定位,分工
    3. 进展:对项目进展介绍,其中a、b两组的区别和工作中遇到的重难点由相应组员进行展开分析
    4. 展示:分组用视频或者图片进行短期成果展示
    5. 展望:项目后续的规划和期望的最终成果

    分工及负责任务

    1. 作为b组小组的组长
      1. 负责整体项目进度的把控
      2. 项目需求的落地和小组成员的分工安排
      3. 定期与导师开展线上会议汇报项目进度和问题,同样也与另一个小组的组长协作沟通交流问题
    2. 同样在组内负责部分开发的任务
      1. 【SLI】包括 SLI 的设计和修改
      2. 【接入otel-sdk】部署 SigNoz-Collector 集成到项目的 compose 中
      3. 【接入otel-sdk】在 profile 模块中接入 otel-sdk 完成 trace 和 metric 的上报
      4. 使用 watermill-pubsub 框架替换为原有框架 baserunner

    重难点

    • SLI

      • SRE(Site Reliability Engineering),边缘可靠性工程,监控性能、高可用性、可扩展性和安全性

      • SLI标准-百分比(cpu利用率)、SLO目标(延时200ms)、SLA协议

    • otel-trace

      • 【已完成】分布式跨进程跨服务的调用的 span 的上下文传播
      • span references
    • otel-metric

      • cpu、memory的方案
        • 程序主动上报 - 程序性能瓶颈无法去主动上报就无法收集到目标指标
        • docker stats receiver 来收集 docker container 的指标
        • hostmetric receiver 可指定进程
        • 云原生,后续整个服务以 k8s 的形式部署故放弃 docker stats 的方案,SigNoz有提供k8s下收集pod指标的官方方式【仍需后续调研】
    • watermill-pubsub

      1. 【已完成】publisher没有提供回调函数-修改源码嵌入 otel-trace&log 的逻辑
      2. 【尚未完成】watermill-kafka 底层依赖 sarama,需要自定义实现pub/sub替换为底层依赖 kafka-go

    效果展示

    Trace

    image-20230820193902266

    image-20230820194048316

    image-20230820193250076

    image-20230820194158875

    Metric

    image-20230820193747776

    image-20230820193649219

    Log

    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

    image-20230820193429533

    明日待办

    1. PPT 汇报
    2. 与导师开会
  • 相关阅读:
    图神经网络通用框架 —— NLNN非局部神经网络
    不知道 MySQL 咋学?刷完牛客这 50 道题就够了!(第九篇)
    Ubuntu22.04.1 LTS系统上实现KVM虚拟机显卡直通(AMD/NVIDIA+板载显卡)
    全国大学生数学建模竞赛b题
    学生信息管理系统(教务选课系统)
    【Linux-day11-线程的创建与同步】
    JVM面试题(三)
    leetcode动态规划之买卖股票+打家劫舍
    qml入门教程:qml的初步使用
    苹果开发者防关联开新号自查清单
  • 原文地址:https://blog.csdn.net/xzx18822942899/article/details/132913929