随着信息技术的发展以及产业数字化的发展,在产业端,信息系统的建设和应用场景的搭建日渐完善,如何从完备的业务系统中挖掘数据价值以及如何从业务互联走向数据驱动决策成为产业数字化的新发展阶段。目前主要由数据中台承担数据汇聚、数据分析、数据价值挖掘的探索以及融合互联各业务系统。但是以数据中台解决产业业务系统协同及数据价值挖掘难题,存在以下三点问题:1、工作量大,产业各环节产生的数据海量,信息的处理要靠工程师经验构建大量的数据分析模型,数据的获取、清洗、特征处理、建模等耗费大量时间;2、数据中台定位往往侧重于对数据的处理,工作量和业务的调整无法有效协同,例如OA系统往往制定了生产报表的更改样式、权限等审批流,但是生产报表的生成是在ERP系统完成,数据中台无法协同业务流和数据流;3、产业链上下游的协同依赖工程师对数据、信息的处理能力,无法主动挖掘数据价值。
这是一个典型的数据分析驱动业务优化的案例,如果我们把各个业务流程当作一个个智能体,如何实现各个智能体的协同、协作将是驱动这个数据决策流程效率、质量的重点。
如示例所示,要完成上述流程中的数据分析、市场监测与预测,我们构建的数据操作平台将数据聚合一处、通过写python代码形式建立模型,但是目前数据分析师的大量工作是在做数据收集、数据清洗、数据格式转换以适配数据分析模型的需要,而非专注建立数据分析模型,数据分析结果往往需要自行与其他流程关联或者下发。工作量比较大,而且数据的价值往往是极其依赖数据分析师的经验。
多智能体的发展以往主要应用在机器人集群各机器人的协作上,比如无人机机群的伴飞、动作协同等。在智能工厂中,将产线及产业链中各业务模块当作一个个智能体,通过协调智能工厂中的多个人工智能调度器,提出了一种新的网络物理集成体系结构,以实现数据驱动的在线调度。我们为智能工厂中的每个物理单元设计了一个人工智能调度器,根据工序和机器的实时状态来调度订单。
在多模态信息处理和生成上,HuggingGPT+微软的Jarvis:主要思想是使用 LLM 作为控制器来管理 AI 模型,并利用来自 Hugging Face 等社区的模型来解决不同的用户请求。它首先应用LLM来理解用户请求并将其分解成小任务,然后将这些任务分配给不同的功能模型来完成,最后再次使用LLM将结果汇总为最终输出。
**多智能体:**总结而言多智能体的理解主要是讲数字化应用集群通过某种机制联合协作起来,使用人员根据目标描述、任务描述、流程制定等就能快速将数字化应用联动起来,实现内部自我联合实现目标任务。随着大模型技术的成熟,行业内开始将大模型与多智能体进行结合,大模型作为智能体的指挥官,负责协调各个智能体的数据流、模型流、指令流。
大模型具备多种能力,在产业数字化方向,我们看重的是以下能力与数字化应用的结合:理解人类语言、语言解析+搜索结合实现信息的实时更新、代码生成、理解文本重点内容、理解图表。
针对产业数字化、大模型和多智能体的发展以及结合的思考,我们提出了一个产业数字化的多智能体框架,这个框架以大模型系统为核心,主要包括任务执行、任务规划、工具库、微调、记忆、反馈模块。其运行的机制是,将任务及目标描述输入到大模型系统内,由大模型系统将任务和目标进行拆解,通过大模型系统将调度每个子任务与相应的工具,如链接任务涉及的业务系统、搜索引擎、API、计算等,同时根据任务描述调度外部模型,最终自动完成数据、模型的组合计算或决策,其中的领域知识库是为了将通用大模型更好地理解领域知识,更精准的做任务的规划和执行;记忆模块是为了将大模型系统理解上下文以及各个子任务,从而做好任务的规划和联动。另一方面,我们知道大模型往往依靠提示词开展工作,提示词的优劣直接导致大模型系统生成结果的精准性,因此设置一个人工反馈模块极有必要,可以迭代优化整个体系做任务的流程。
面对产业问题和需求如何打造超级个体提升经营效率
例如,针对能源管理流程来说,我们的任务是:根据能源政策提供节能减排建议、分析能源消耗情况以及优化调整园区能源供给。将这个任务描述提交给多智能体系统,他将任务拆解为四个子任务:
step1:全网搜索最新能源政策以及园区能源管理制度,生成能源政策报告。
step2:链接能源管理系统,分析近五年园区能源消耗趋势,链接物业关系系统,关联物业、园区办公企业情况等分析能源消耗情况,生成报告;
step3:链接园区能源管理专家模型、行业节能减排模型等,关联能源形势,生成能源供给优化建议;
step4:关联园区设备管理系统、企业管理系统,下发能源供给优化指令。
并给出一个能源分析的示例:
示例:
Q:生成某园区能耗分析汇总表单;
A:select c.* from (select b.Dwmc as 名称,a.djrq as 单据日期,a.sNh as 年份,a.sQh as 月份,a.clmz as 能源…)
任务的拆解和规划将根据每个步骤调度或者生成相应的工具完成相应的任务。最终生成输出结果:能源政策解析报告,能源消耗分析报告,能源供应优化报告,能源供给调节(执行/不执行/论证)
任务分解与规划:我们设计的任务分解和规划模块包含两个模块,一个是微调学习,以让大模型系统适配领域知识,微调学习的知识来源是行业SOP、数据分析指标体系、国家标准规范等,同时为了任务采集和规划的精准性,引入专家优化辅助。
工具的生成直接决定了规划好任务的执行,当前受益与大模型的代码生成能力,其可以为给定的任务创建相应的工具如爬虫、分类、聚类、SQL语句等。行业内也在扩展整个生态,如Langchain、HunggingGPT、ModelScopeGPT、AutoGPT等可扩展外延工具。