“大模型”不是新东西。
在这波大模型热潮之前,工业界便已存在各种规模的模型。但由于工业领域大多涉及关键决策,实际应用时较为慎重。
有了大模型的加持,工业界的人工智能应用,迎来了全新的契机。但在这个群“模”乱舞的时代,大模型离工业界大规模应用还有多远?有哪些亟待突破的真正的核心技术?
带着这些问题,我们希望借WAIC 2023 全球人工智能大会举办的机会,找到一家一线的工业界实践者,探寻其中的答案。马上消费金融进入了我们的视线。
据马上消费金融副总经理兼首席信息官(CIO)蒋宁介绍,马上消费金融成立于2015年,目前约有3000名员工,其中2000+人是研发,而且大部分都是人工智能和大数据方向,坚持自主研发不外包,截至2023年6月底,1315件发明专利申请,已公开983件,消金行业占比52.9%,位居行业第一,妥妥的一家科技驱动的金融机构。公司目前有10万+个风险特征变量,100+个细分迭代模型,2000+个风险策略、决策及数据模型算法,实现了92.4%的智能客服分流率、100%的智能质检覆盖率、98.6%的客户综合满意度。
马上消费金融副总经理兼首席信息官 蒋宁
作为科技赋能业务的先行者,金融行业历来是新技术应用实践的风向标。新技术在金融行业用得如何,一直备受关注。大模型当然也不例外。
在蒋宁看来,当前,金融行业大模型应用面临四个挑战。
一是关键任务和动态适应性。关键任务往往关系到生命或重大资产,比如自动驾驶、银行存款,人工智能要做到100%的准确,并不容易。而生成式模型,目前与工业界的判别式模型相结合的化学反应尚无明显效果。同时,与AlphaGo的封闭系统不同,大模型要想做到越来越聪明,就要想办法在开放的体系里让群体力量贡献给模型,让尽量多的用户参与反馈,形成生态。
二是个性化要求和隐私保护。摒弃千篇一律的教条式服务,做到千人千面,大模型在为用户提供个性化体验的同时,又能确保用户隐私,这也是一个需要解决的问题。
三是群体智能与安全可控。一方面,中国的移动互联网与PC互联网是割裂的,导致可用数据有限;另一方面,行业领域的数据往往是封闭的,很难共享。如何设计一个跨行业、组织的数据共享、权益共享且安全可控的机制,同样面临巨大挑战。
四是基础设施能力。GPU、网络、机房等基础环境要针对大模型训练、推理等方面的需求,做出相应的改造,才能发挥最大的效能。这个挑战有望最先得到解决。
针对上面的前三个挑战,蒋宁给出了他所理解的大模型的三个真正核心的技术。
一是持续学习。这是大模型带来的最大变革,是大模型成功与否的关键。不管是千模还是万模,最核心的不是模型参数,而是大模型是否具备了生态能力,让尽量多的人使用,变得越用越聪明,具备持续学习能力,并进行正向反馈。
二是鲁棒性决策。在工业界,包括自动驾驶、医疗、金融等,虽然人工智能有99%是正确的,但只要有1%是错误的,在工业界就无法使用,因为它涉及到人命关天的重大决策。因此,要帮助大模型排除噪音、干扰,在突发、不可预期的情况下,保持决策的稳定、安全合规。
三是组合式AI。工业界之前有很多模型,大模型出现后,利用大模型的泛化能力把工作拆解,使得生成式模型可以与原先工业界的判别式模型有效结合,让两种模型的优势各自能发挥更好的价值,实现自动化GPT。
“形成真正的工业界可落地的持续学习的、解决鲁棒性的、组合式的新型AI系统,这是我们未来构建可在工业界有效使用的大模型的方向。”蒋宁如是说。
在蒋宁看来,马上消费金融作为AI驱动的金融科技公司,要帮助解决金融行业的三个通用问题。
一是个性化的服务和极致用户体验。金融业务有高价值、低频的特点,很难提供个性化的体验。传统的做法是分层打标签,提供不同的产品,但标签是动态变化的,因此如何自动化地决策为客户提供自动化的体验,就需要产品与众不同。
二是高效的价值传递效率。虽然金融是技术密集型、数据密集型行业,但目前线下网点还是为数不少,因为人工智能尚不能做到不出错,很多工作还要高度依赖人工操作。
三是合规安全的决策智能,这与鲁棒性相关。
基于这三方面考虑,以及上万台的服务器,近千张的GPU卡,40PB的文字、声音、图片、视频等形式的数据,马上消费金融实现了算力、算法、数据以及场景的闭环,并由此打造了“三纵三横”的AI战略。
马上消费金融的“三纵三横”战略
三纵
三横
目前,马上消费金融的AI主要应用在三大场景:一是金融智能对话,实现实时人机协作、持续学习、可信安全合规;二是金融数字人,通过大模型+组合式AI多模态能力,实现有温度的数字人;三是金融服务的AI心里引擎,通过大模型的大脑与心理学的有机结合,实现有情感的人机体验。
“垂直领域的判别式模型与生成式模型等多种模型组合,构筑一个开放的持续学习、具备鲁棒性、合规安全的体系,才是大模型的真正落地,而不是一个模型靠几千亿参数去落地。我们将为之而努力。”蒋宁总结道。