• 老杨说运维 | 证券行业运维数字化和智能化转型实践探索


    本文源自中国计算机协会云应用分会

    2022年度大会中老杨的演讲回顾

    随着金融技术的创新发展,证券行业的生态竞争加剧。据了解,28家上市券商在科技投入的规模正以大于15%的增速持续增长,仅2020年总投入就高达239亿,数字化转型已经成为券商未来发展的全新战略高地。

    老杨认为,证券行业的转型可以分为四化:业务线上化、数据业务化、业务智能化以及业务创新化。这四个部分多依赖于在基础架构上的调整,比如分布式架构的调整、容器化的转变、多批次的敏捷应用发布等,这些变化无论是在应用侧还是基础架构侧,都为运维带来了巨大的挑战。

    加之监管政策的加强,如证监会发布的《证券公司分类监管规定(2017修订)》中提到,一次较大的业务事件就有可能影响公司的分类级别,甚至影响现有业务及新业务的开展。这对于券商来说是很关键的任务项,在这样的背景下,更进一步推动证券行业的数字化业务需要有数字化运维的转型提供相应的保障。

    解决之道:统一可观测的智能运维

    老杨认为当前阶段运维转型的最终目标是实现统一可观测的智能运维,这种运维不仅是简单的可视化,更要具备一套完整统一的数据治理能力,能够提供标准化、高质量的运维数据,在算法赋能和分析技术的加持下,场景化的体现运维价值,反哺业务运营。这是实现最终目标的第一要素,也是最关键的底座基础。

    有了坚实的数据基础,才能够去构建统一监控平台,把自研的、第三方的以及一些开源的监控手段统一在一个采控体系和监控视角下,进而集中输出相关的告警并统一进行治理,包括告警的抑制、告警的相关性、故障场景的洞见等。以上的底层逻辑架构完善后,才能够以业务为视角进行场景输出,包括预测性的场景、根因定位类的场景以及提高数据处理效率类的智能场景等。

    在这些场景的加持下,才能实现以用户为中心的场景化观测,清晰的了解业务状态,掌握用户行为在完整业务链条中的状态和数据,实现“知其然,亦知其所以然”(即不仅知道业务运行的健康状态,也能在出现问题或问题出现端倪的时候,及时准确的做到根因定位并解决问题及预防下一次问题的出现)

    可观测智能运维解决方案

    擎创通过六年近百个案例总结的解决方案以一言以蔽之,即在做好数据治理的前提下,结合统一运维场景实现运维的统一可观测。老杨特别强调的是在智能运维建设的过程中,要以场景的效用为目标,而非过度以技术的实现为终点。

    实践探索——某华东券商

    客户痛点

    移动APP端目前很难形成以用户为中心、以业务为视角端到端的全链路管理体系,难以进行实时的链路可观测和运维的故障排查等。

    解决办法及成果

    把该客户的日志数据源、监控数据源通过运维中台进行统一的纳管及治理,进一步应用到完整链路的观测使用中。

    在业务健康方面,首先基于业务视角,整合了各个监控源的事件,经过智能算法的压缩和去重后,得到需要高优先级处置的告警,有效提升一线告警的质量;进一步通过场景展示各地IDC中POP点的当前请求量、请求成功率、TCP建连延迟、HTTP请求响应延迟等,加上业务下沉后客户端的访问数据去了解经互联网线路至核心专线的整体拓补运行情况,最终实现各个节点关键KPI的实时计算,对耗时长或成功率下降的节点下钻至指标及原始日志处进行故障判断。

    在交易链路健康方面,通过APM将交易流水号串联形成Trace数据,由数据平台统一进行采集和处理,以系统组件为单元展示服务链路的整体健康分类查询(可以按照关键字进行单笔交易查询),实现对交易链路中实时的指标分析、故障排查。

    在数字化浪潮下,智能运维可以帮助证券服务提供有效的后备支撑力量,保障新业务的组合创新,构建数字化的风险识别能力,打造以业务场景为中心的健康体系,助力业务运营平稳高效发展。擎创科技将持续不断的实现技术创新及产品革新,秉持以客户成功为本的理念,在客户的数字化转型中提供强有力的帮助。

  • 相关阅读:
    简单SQL与单行函数
    live555交叉编译(ubuntu+arm平台)
    计算机网络(01)
    kafka中AR、ISR、OSR以及HW、LEO的区别
    【模型渲染】前端如何让glb模型转3dtiles
    Spring学习第6篇: 基于注解使用IOC
    【浙政钉】第一篇:企业内应用免登
    vue:基础:原理知识点
    redux-thunk 简单案例,优缺点和思考
    大数据课程K21——Spark的SparkSQL基础语法
  • 原文地址:https://blog.csdn.net/qq_37641528/article/details/126138808