• 老杨说运维 | 双态运维转型中的“数智”一体化管理(文末附现场视频)


    伴随2023第六届双态IT乌镇用户大会的圆满完成,擎创科技“一体化数智管理和大模型应用”主题研讨会也正式落下了帷幕。

    云原生转型正成为很多行业未来发展战略,伴随国家对信创数字化要求的深入推进,面对敏稳共存这一近年出现的新难题,企业IT运维的建设升级迎来了更为综合性的挑战。如何在双态转型中进行更优质地“数智”一体化建设,成为了业内关注的焦点。

    一、新一轮数智转型痛点

    1.业务感知笼统

    数据中心本质上来讲,它真实的使命应该是保障业务系统平稳。但实际上,受传统运维的影响,各级运维人员对于业务的感知十分笼统,其原因包括监控工具众多、数据竖井化严重、缺少关键系统画像、交易变化感知不直观等。因此导致运维人员很难通过一个专业工具,去全貌的判断业务发生了什么变化,犹如盲人摸象一样。

    2、事前-事中-事后难题

    这一难题涵盖的三点是老生常谈了,由于数据没有拉通且很难从历史数据中发现规律,以至于难以做到事前预测;事中定位的低效是现在普遍的现状,金融行业仍在向实现1-5-10的监管要求努力,但实际能达到30分钟定位解决问题的企业也不胜几多;至于事后,没有有效完整的数据留存,便无法进行历史回溯、向历史学习。

    3、数据治理不成体系

    上述的问题,综合来看与数据治理不佳有莫大的关系。现阶段的体系中,不能以业务为对象、以故障为核心去回收数据,那么想从运维数据中提取相关业务运营、成本运营的数据,就无从下手,因此没有办法为业务运营的优化提出真知灼见。在新一代业务数字化转型的倒逼下,运维工作显得有些捉襟见肘了。

    二、数智转型未来发展趋势预测

    1、实现全景可观测

    无论是在敏态还是稳态环境下,能够以上帝视角俯瞰总览到业务系统的全方位状况,可以以业务应用为对象观测多样化的监控数据、日志数据、调用链数据等。实现所见即所得,可以透过现象看到本质成因,从而提升从交易、应用系统到基础资源的全面感知力。

    2、能够先知先觉、即知即决、已知明决

    这里对应此前的事前-事中-事后。

    • 先知先觉:我们希望未来能够从智能健康风险语境中消弭80%的故障隐患,以业务为导向提前判断风险程度,分析可能会收到的业务影响,提前做出应急预案,尽量避免灾难性的故障事件;

    • 即知即决:在应急排障的工作中,能够迅速做到知其然亦知其所以然,快速完成排障定位并恢复业务,逐步实现1-5-10的要求;

    • 已知明决:最后则是数据可复盘、经验可复用。复盘不仅仅是故障复盘,也要复盘数据中心整体的运营质量和运营水平,更要复盘在业务交易中客户的体验受到了哪些相关因素的干扰和影响,从而优化运营策略,降低运营成本。

    3、拥有坚实的数据底座

    坚实的数据底座能够做到把日复一日、时复一时的数据进行有效纳管和治理,并能够将其转变为一种数据服务,方便查询、方便分析、方便消费,以业务为视角使各类消费场景输出有价值的结果,为业务运营提供支持。

    三、擎创的解决之道

    技管共施、治用并举、场景驱动、以终为始,这是擎创经过7年与上百家客户共同实践总结而来的观点和建设思路。

    1、技管共施

    这里主要是明确一个意识,即数据中心的运维转型并非一次性的数字化转型,也不是一两个工具就能完成的,这需要技术与管理两条腿一起走路,并且循序渐进的完成。

    2、治用并举、场景驱动

    治是数据治理,用则是场景消费,这两点在天秤上需要保持平衡,不能偏重任何一方。其原因是,数据的有效治理是需要围绕使用方,在不断地使用消费中发现数据价值,进而反推去指导优化治理的方式方法,实现互补升级。

    3、以终为始

    运维的转型最终目标一定都是实现智慧化运营,有了目标就必须有规划,每一个阶段要有相应的建设方案,不能一蹴而就,要根据实际业务运营情况,不断的调整规划方针和建设路径。

    四、一体化数智运维解决方案

    首先需要的也是最重要的,一定是数据运维能力层,这里能够把来自稳敏两态中多样化、多模态的运维数据采集入运维数据中台,在保证时效性的前提下,有效完成相应的数据清洗、分类、提取、储存等等操作。

    同时,我们在这一层内嵌了一个运维对象模型,可以把多模态的数据(指标、日志、告警、调用链等)拉通并建立关系,再通过数据服务、算法服务使之在场景应用层得到价值体现,由此能够帮助运维人员清晰的观测业务运营的全链路状况,为实现真正的全景可观测打好基础。

    其次,重要的是消费场景层,包括了风险预警、告警管理、应急定界(全息监控、应急分析、排障定界)、运营分析、FinOps。多样化的消费场景,面向不同的需求,从运维维稳到业务运营策略优化,实现对业务的全面复盘,进一步实现运营的降本增效。

    五、“擎智”运维大模型发布

    AIGC的大火,让我们看到了AIOps未来的一些模样。近年,我们创新研发了“擎智”运维大模型,在初期,通过网络、擎创实验室以及案例经验,对其进行了大量的模型训练。并在AI较为成熟的当下,创新采用了Prompt tuning的方式(简单来讲这是一种通过通用大模型训练产业模型的方式,即用广域AI训练私域AI)对其继续进行深度训练。我们发现这样的实验下,系统的更迭速度变快,能力也愈发完整。

    由于现场内容丰富,在这里仅做简要总结,更多的精彩内容可点击主页,一键回看现场视频精彩观点。

    1.双态运维转型中的“数智”一体化管理

    关于数据治理、消费场景、平台建设、大模型应用等,后续将通过其他文章进行阐述,欢迎持续关注~


    擎创科技,Gartner连续推荐的AIOps领域标杆供应商。公司专注于通过提升企业客户对运维数据的洞见能力,为运维降本增效,充分体现科技运维对业务运营的影响力。

    行业龙头客户的共同选择

    了解更多运维干货与行业前沿动态

    可以右上角一键关注

    我们是深耕智能运维领域近十年的

    连续多年获Gartner推荐的AIOps标杆供应商

    下期我们不见不散~

  • 相关阅读:
    2023计算机毕业设计选题推荐——Java项目
    Flutter 中的 Crypto 库介绍及使用
    暑期第一周总结
    React之Github搜索实例
    嵌入式经验分享:面试薪资直接翻番,我才明白TA的重要性!
    蚂蚁链发布全新Web3品牌ZAN,涉及RWA、合规等服务
    正点原子lwIP学习笔记——Socket接口TCP实验
    软考重点10 知识产权
    前端:鼠标点击实现高亮特效
    Git Gui的使用+关于SSH协议和克隆对应文件代码+IDEA集成Git等
  • 原文地址:https://blog.csdn.net/qq_37641528/article/details/133942985