• 阿里云刘洋:基于eBPF的Kubernetes可观测最佳实践


    嘉宾 | 刘洋

    出品 | CSDN云原生

    2022年8月9日,CSDN云原生系列在线峰会第15期“Prometheus峰会”上,阿里云技术专家刘洋为我们分享了基于eBPF的Kubernetes可观测最佳实践。

    背景介绍

    可观测是为了解决问题,在聊可观测之前应对问题排查的普适原则进行了解。

    问题排查的原则

    1、理解

    以排查系统问题为例,首先需要理解系统以及基本的计算机科学知识,关注系统大图与运行细节,要对核心功能的算法和数据结构了然于心。

    2、复现

    在理解的基础上,还要能够复现问题,关注问题发生的触发条件并关注问题发生时数据现场的保留,包含指标、链路、日志、事件等。

    3、定位

    在保留现场信息以及理解系统的前提下,才可以定位问题。通过现场保留的数据可以进行关联分析,基于对系统的理解可以使用二分查找快速地定位根因。在定位的过程中,尤其要关注变更,大量系统问题都是由变更导致的。

    4、修复

    确定根因后再进行修复,既要治标也要治本,并且要充分验证,确保不引入新的问题。

    以上为问题排查的普适原则,它不仅适用于系统问题的排查,也可以应用到生活的方方面面。

    而可观测使得问题排查过程更加高效、稳定、低成本。可观测能够帮助我们理解系统,出现问题时保留更多的现场信息,使数据之间更加方便地关联,同时能够帮助我们做关联分析,最后验证修复是否正确。

    Kubernetes可观测挑战

    复杂度不断下沉的趋势使得可观测面临了很大的压力,Kubernetes的流行带来微服务架构的普及,多语言、多通信协议成为常态,这也在另一方面带来了挑战。

    挑战 1:端到端观测复杂度上升,埋点成本居高不下,当前大量能力下沉到Kubernetes管控层、容器运行层、网络和操作系统层面,这些基础设施能力的下沉带来了很大挑战。

  • 相关阅读:
    @Autowired注解推荐使用方法:用在构造方法上
    深度学习_1_基本语法
    Java 21 新特性:Record Patterns
    nginx 日志,压缩,https功能介绍
    鲁大师电动车智能化测评报告第二十三期:实测续航95km,九号Q90兼顾个性与实用
    前端性能优化:预加载
    程序编译过程(扫盲贴)
    【Computer Vision Foundation】全球计算机视觉基金会论文网
    JS-运算符和表达式\函数、程序的流程结构
    系统架构设计高级技能 · 安全架构设计理论与实践
  • 原文地址:https://blog.csdn.net/m0_46700908/article/details/126831905