• 阿里云刘洋:基于eBPF的Kubernetes可观测最佳实践


    嘉宾 | 刘洋

    出品 | CSDN云原生

    2022年8月9日,CSDN云原生系列在线峰会第15期“Prometheus峰会”上,阿里云技术专家刘洋为我们分享了基于eBPF的Kubernetes可观测最佳实践。

    背景介绍

    可观测是为了解决问题,在聊可观测之前应对问题排查的普适原则进行了解。

    问题排查的原则

    1、理解

    以排查系统问题为例,首先需要理解系统以及基本的计算机科学知识,关注系统大图与运行细节,要对核心功能的算法和数据结构了然于心。

    2、复现

    在理解的基础上,还要能够复现问题,关注问题发生的触发条件并关注问题发生时数据现场的保留,包含指标、链路、日志、事件等。

    3、定位

    在保留现场信息以及理解系统的前提下,才可以定位问题。通过现场保留的数据可以进行关联分析,基于对系统的理解可以使用二分查找快速地定位根因。在定位的过程中,尤其要关注变更,大量系统问题都是由变更导致的。

    4、修复

    确定根因后再进行修复,既要治标也要治本,并且要充分验证,确保不引入新的问题。

    以上为问题排查的普适原则,它不仅适用于系统问题的排查,也可以应用到生活的方方面面。

    而可观测使得问题排查过程更加高效、稳定、低成本。可观测能够帮助我们理解系统,出现问题时保留更多的现场信息,使数据之间更加方便地关联,同时能够帮助我们做关联分析,最后验证修复是否正确。

    Kubernetes可观测挑战

    复杂度不断下沉的趋势使得可观测面临了很大的压力,Kubernetes的流行带来微服务架构的普及,多语言、多通信协议成为常态,这也在另一方面带来了挑战。

    挑战 1:端到端观测复杂度上升,埋点成本居高不下,当前大量能力下沉到Kubernetes管控层、容器运行层、网络和操作系统层面,这些基础设施能力的下沉带来了很大挑战。

  • 相关阅读:
    嵌入式系统中偶发性问题
    解决Vue前后端跨域问题的多种方式
    【web应用系统实践】第四章作业
    立方体贴图shade计算
    腾讯事务处理技术验证系统3TS-Coo模板安装文档&&说明文档(小白向,简单轻松就能上手)
    从源码上解决rosdep update失败问题
    每天5分钟复习OpenStack(十三)存储缓存技术Bcache
    测试开发人均年薪30w+?软件测试工程师如何进阶拿到高薪?
    5.1.5 配置root用户SSH免密码登录
    Mysql Json 数据类型&函数
  • 原文地址:https://blog.csdn.net/m0_46700908/article/details/126831905