零售金融业变革:从长期尺度看「大模型崛起」

  • 来源:中国消费金融网
  • 发表于: 2023-09-01 21:15:31
  • 责任编辑: lixuezhen

来源 |消费金融作者 | 橙子同学从OpenAI发布ChatGPT,率先在全球范围内掀起了AI热潮,以及GPT-4的问世,到腾讯、阿里、百度、华为和京东...

来源 | 消费金融

作者 | 橙子同学
从OpenAI发布ChatGPT,率先在全球范围内掀起了AI热潮,以及GPT-4的问世,到腾讯、阿里、百度、华为和京东发布大模型,再到金融行业的“百模大战”……
可见,金融业正迅速拥抱技术,并以此为基石加速变革。其中,大模型深入产业进程的实际价值,已成为金融机构不可或缺的核心竞争力。
“群模狂舞”的竞赛,将不再局限于追逐大模型技术本身,而在于AI深入产业的进程。因此,必然会有很多「垂直应用」生长出来。
8月28日,马上消费重磅推出零售金融领域首个大模型——天镜大模型,并提出形成“三纵三横”的大模型发展技术布局。其科技的敏锐“嗅觉”使其成为消费金融行业技术的领先者。科技的迅速布局,也彰显出马上消费的战略远见与战略定力。
金融业的技术「敏感性」
科技衍生出大模型为金融业提供了一种新的思维方式,也印证着「技术敏感性」是金融行业中不可或缺的一项能力
“它的落地绝不是一劳永逸的事情,需要经过艰苦的智力努力才能取得效果。”欧洲科学院外籍院士清华大学人工智能研究院常务副会长孙茂松表述,目前“马上消费”提供了一个很好的示范,这是一个良好的开端,但未来还需要不断迭代和改进。
透视消费金融领域,传统的用户洞察方式存在一定的局限性。它依赖于人工盘点用户进线人工渠道的案例数据,而不同工作人员主观判断的差异可能导致数据标注结果不一致,缺乏客观性。此外,传统方式也受到数据量的限制,无法进行全面的数据分析。
在全球大模型技术竞争格局下,大模型研发犹如攀爬「技术珠峰」,背后需要“巨量”数据、算法、算力支撑。同时,还需要“巨量”的人力、时间和财力的投入。
作为以科技驱动的头部持牌消费金融公司,马上消费目前积累了1.79亿的用户,超2000个模型,10万+变量,近50PB的多模态和高质量的数据。
基于金融行业特殊性,必须要做到可控和安全。马上消费通过在这些自身数据上做模型精调对齐训练,同时再用推理加速技术实现模型可控,从而相比其他企业更懂金融。
通过不断对数据进行聚类,结合业务进行深度分析,实现业务的模型驱动、数据驱动。马上消费采用了先进的算法和人工智能技术,基于对消费金融领域的长期研究,颠覆了以往的洞察方式。即使面对每天20万张表随时都在产生变化,但不管环境如何发生变化,马上消费都能确保模型不会出错。
可见,数据、场景、行业知识以及算力和洞察力等等,都铸造了马上消费为什么能够做金融领域大模型的先决条件。
大模型的「判别性」纵深
据了解,通用大模型和垂直大模型是两种不同类型的大模型。
通用大模型是指具备广泛通用能力的大规模深度学习模型,可以应用于多个不同领域和任务,通过在大规模数据上预训练和微调来学习通用的表示。而垂直大模型则是专为特定领域或任务进行优化的大规模深度学习模型,在设计和训练过程中更加专注于该领域或任务的特定需求,从而获得更好的性能和效果。
马上消费副总经理兼首席信息官蒋宁举例分析了垂直大模型和通用大模型的本质区别——
生成大模型最大的问题在于“回答错了不承担风险”,然而在工业领域比如自动驾驶,1%的错都可能造成生命财产的损失,所以在工业界就要让它从99%做到100%。“这就是金融大模型和传统大模型最大的区别。生成式模型不能做解释,但金融大模型最主要的模型叫做判别性,它需要做决策。”
金融大模型就是一种专注于处理金融数据和相关任务的垂直大模型。基于依据金融行业的特殊性,数据源非常庞大和复杂,包含了大量的个人敏感信息和交易数据。因此,在开发和应用大模型需要具备高度的数据安全和隐私保护能力,需要确保算法的准确性、可解释性和风险控制能力。
鉴于以上要求和特殊性,天境大模型需要具备三个关键技术:持续强化学习和思维学习、鲁棒性技术以及组合式AI系统技术。
在“三横”能力维度上,注重持续学习、模型合规以及组合式AI技术,以产生安全、合规和可信的鲁棒性能力。在“三纵”场景中,关注实时人机协作、多模态智能以及数据决策智能,以实现结构性数据判别式模型的综合能力。
“通过已经拥有的2000多个模型和10万多个变量,无论何时何地,模型的回答都是合规的,并且在任何不可预测的情况下,模型的结果都是稳定的。”蒋宁如是说到。
但不容忽视的是,在金融行业中,由于市场环境、客户需求和政策变动等因素的快速变化,对模型的可靠性和鲁棒性提出了挑战。如果大模型对于异常情况或非典型数据的处理不够鲁棒,就有可能产生误导性结果或造成不良影响。
客观地说,大模型最核心的机制不在于其参数,而是其鲁棒性和持续强化学习。在金融领域,合规和安全是最核心的因素。无论什么情况下,金融机构给出的客户回答或决策结果都必须符合国家规定和消费者权益。
“从趋势来看,持续强化学习解决了鲁棒性问题,并能够将判别式模型和生成式模型的优势进行组合。”这是人工智能未来的发展趋势,也是马上消费提出了“三横三竖”的发展战略的原因之一。这个战略与挑战和趋势密切相关,也是马上消费努力和突破的方向。
因此,金融机构需要对大模型进行合理的设计和验证,以确保其在不同情况下的表现可靠和稳定。
技术变革的「长期」尺度
就消费金融行业而言,在垂直领域上不断探索,一类是在垂直领域的判别式模型,比如像风控、风险、量化决策、对错好坏的判别等;另一类是垂直领域的生成式模型,比如信息类,总结归纳类的等。
类似于金融大模型的探索可以聚焦在垂直领域的特定行业或应用中,除金融业外,目前垂类大模型还在教育、医药、营销等场景中已得到试炼。犹如“小切口大纵深”,可以更深入地探索和发掘产业数字化的机会。
顾名思义,天境大模型是通过将大模型与垂直领域多种能力的自动化组合式AI技术相结合,可以实现改变金融的个性化体验和提高金融服务效率的目标,这是组合式AI在金融领域非常重要的应用领域。
为了推动金融数字化转型产生实质性的飞跃,“三纵三横”的大模型布局旨在构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,并重点关注基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力以及安全与合规能力六个核心领域。
通过这样的大模型技术能力体系,能够进一步推动金融行业实现实质性的数字化转型。
在汇集智慧方面,可以通过大模型提炼一线优秀人工坐席客服的经验,形成群体智慧,从而提供一对多的客户服务,并且可以作为人工坐席的辅助角色,帮助推荐和优化回答。
在唤醒沉睡知识方面,能够高效地提取和利用非结构化文档中的数据资料,并深入解析金融领域专业术语,查询不同文档,并洞悉金融图表隐含的信息,具备强大的归纳总结能力
众创数据价值方面,SQL生成平台可以让用户直接说大白话向AI提出需求,无需专业指令,大大降低了使用数据的门槛。数据显示,天镜每日线上SQL生成数量650多次,线上SQL生成可执行比例53.4%,SPIDER标准数据集EX得分75.2,线上使用者满意反馈比例82.3%
数字人方面,陆全希望打造一个拥有数字外表、智慧大脑和情感内心的数字助手,让每个员工都能拥有自己的数字分身,5分钟的训练数据就可以生成“另一个我”,随时被唤起代替员工完成大量工作
据马上消费人工智能研究院院长陆全介绍,天境大模型已经运行了近3个月,意图理解的准确率达到了91%,相较于传统AI的68%,有了较大的提升。客户参与率也达到了61%,高于传统模型43%的参与率和人工坐席平均28%的水平。
无论是什么模型,最关键的是技术能否让所有用户参与并给予反馈是重要的,从而才能形成一个生态系统。马上消费融合“三横三纵”技术,还有巨大的成长空间。
人工智能发展已有60余年历史,经历了从实验室到产业化的过程,其创新成果不断融入社会各个领域,带来了巨大的变革,并为数字经济的发展做出了重要贡献。正如比尔盖茨所说,人们往往高估技术变革在短期内的影响,而低估技术变革在长期尺度上的影响。
可见,马上消费已在金融领域取得了快速发展。据了解,未来将会持续拓展虚实共生,构建可信开放的「数字融合体」

图片


分享到:
相关标签:
金融业
尺度
变革