原创| 平安银行刘锦淼:银行数智化的三个前提条件

2023-06-16 19:11:48 新金融城 微信号

“大模型是银行业从数字化向智能化迈进的重要驱动力量,但我们需要正视:很多业务仍是手工线下处理,很多信息并未有效收集,很多数据无法实现标准化,很多业务场景尚未实现策略配置驱动,仍是人为决策,这些都制约着银行走向数智化。”6月10日,平安银行(000001)数字资产管理与研发中心总经理刘锦淼在新金融联盟举办的“金融机构数智化转型与大模型技术应用”内部研讨会上表示。

刘锦淼表示,实现银行数智化能力,需要先实现以下三方面能力:在数据资产方面,数据采集需要极大丰富,内外部数据、非结构化数据均要实现资产化,数据充分共享打通、安全可控。在工具平台建设方面,构建营销、运营、风险政策配置化管理能力,提升相关工具平台中台能力。在AI应用和业务投入产出方面,探索实现闭环的数据化归因、自动优化的能力。

会上,新金融联盟学术理事、工商银行首席技术官吕仲涛,民生银行(600016)数据管理部总经理沈志勇、第四范式联合创始人胡时伟也做了主题发言。新金融联盟理事长、中国银行(601988)原行长李礼辉及中国信通院金融科技研究中心副主任赵小飞进行了点评交流。

56家银行及非银机构、55家科技公司的170多位嘉宾通过线上线下参会。会议由新金融联盟秘书长吴雨珊主持,中国金融四十人论坛提供学术支持。会议实录详见→《如何释放大模型对金融行业的价值?》以下为刘锦淼的发言全文,已经本人审核。

大模型概念驱动下的

银行数智化转型思考

文 | 刘锦淼

刘锦淼

人类社会发展经历了农业化、工业化进程,现在已全面进入数字化社会。数字化社会随着信息系统建设逐步完善、知识能力储备日益丰富,逐渐从信息化、知识化,发展为了自主化、自动化。人类社会早期的发展进程相对平稳,但随着信息、知识、模型、技术等不断升级和快速发展,信息化社会的发展模式将逐渐脱离体力劳动和脑力劳动,进入“创新为主、其他为辅”的智能化发展时代。在此趋势与背景下,以ChatGPT、AIGC为代表的自动化、自主化科技将成为银行数智化发展的一个重要突破口。

从“智障”到“智能”的五次迭代

大语言模型是基于大量文本数据训练的深度学习模型,具备自动生成自然语言文本或理解语言文本含义的能力,该能力也是从人工“智障”通向真人工“智能”的一条重要途径。大语言模型算法从出现、发展到成熟已经有五次的更新迭代:

第一阶段:1970~2010年,主要以基础理论研究为主,词嵌入算法逐步发展。

第二阶段:2011~2013年,NLP-DL进入到深度学习时代,以CNN、GNN为代表的深度学习神经网络算法逐渐应用于NLP自然语言处理。

第三阶段:2013~2017年,NLP出现新的Tranformer网络算法框架。该算法框架增加了Encoder和Decoder两个部分,实现了上下文语义获取和重点内容关注的能力。基于encoder和decoder的重点发展方向,分为自编译网络(BERT)和自回归网络(GPT)两个方向。

第四阶段:随着GPT的发展,2022年ChatGPT正式发布,经过市场不断推捧与发酵,整个社会对AIGC有了比较普遍的认知。

第五阶段:2023年以来,GPT迭代到GPT4版本,AIGC的应用领域逐渐从文本生成,拓展到语音、图像领域。

近五年来,GPT从GPT3到ChatGPT再到GPT4,模型的迭代经历无监督模型(学习填空)、有监督模型(优化精调)、SFT+RM(人类引导、喜好模型)、RLHF(人类强化反馈)等,均是靠大数据、大算力支撑。以ChatGPT为例,该大模型是基于45T高质量数据、159G代码、10万亿单词,在3万多片A100 GPU算力下训练生成,参数高达1750多亿(GPT4达到1.8万亿)。

大模型能做什么

大模型借助大模型技术、自学习技术以及内容生成技术,利用海量数据(603138)和知识来构建底层基础架构(GPT),支撑构建通识问答、内容创作、信息抽取等三大产品能力,可满足各种业务场景能力需求,包括知识问答、情绪分析、意图识别、信息抽取、内容生成、代码生成、图像生成等。

为什么NLP模型采用大模型之后效率会提升?从传统NLP训练角度来讲,通常先要做意图的定义、意图相关分析,再向上做语料训练、效果调优、识别意图等开发,最终实现对NLP模型效率的提升。而大模型基本上就能够涵盖和支撑从中间语料训练到调优过程,应用端无须再考虑自己去做大量标注训练,缩短了准备数据的周期,研发效率实现了提升。

大模型的三个层次

针对国内大模型发展,中国信通院制定了大模型分级标准,华为、百度、腾讯、阿里等一线大模型厂商形成了大模型分级架构。根据数据范围,训练方式,应用范围的不同,可将大模型分为基础通用层(L0),行业层(L1)以及行业内具体场景层(L2)。

针对基础大模型,国内厂商采用无监督预训练、强化学习的方法,完成对大模型的研发与训练,输出的模型初步具备几百亿到几千亿模型参数能力。

而在一些专业领域,各家企业也正在构建自己的行业大模型。例如平安集团已尝试引用国内提供的基础大模型,基于行数据数据进行预训练、无监督训练后,输出金融大模型。

针对场景化的模型应用领域,即基于行业的金融大模型,通过引入专家经验、模型调优策略,通过小样本标注及增量学习方式升级模型,从而形成场景化的大模型,构建类似营销专家、理财专家、信贷模型审批专家等AI模型,赋能具体业务场景。

平安银行的探索实践

平安银行投入了大量人财物在大模型的学习、研究与应用方面,基于银行数据,定制训练出针对银行场景的千亿级别参数的大模型,构建了行内私有化大模型应用平台,初步具备AIGC和多轮对话两大核心能力。目前主要有两个应用场景,一是面向行员的智能辅助工具场景,二是面向客户的金融服务机器人场景。

面向行员的智能辅助工具通过大模型实现低成本标注,支持实现行业业务知识库构建,成为行员非常重要的辅助。从应用场景看,涵盖了营销话术生成、风控文本生成、行内知识管理等典型的金融业务应用场景。

面向客户的金融服务机器人场景,主要是生成式大模型与问答机器人的结合,打造更拟人化、更智能、更以客户为中心的银行面客机器人,覆盖营销、服务、投教等场景。在营销场景,主要通过多轮对话,获取客户信息,丰富KYC,并进行个性化的营销策略引导;面客对话机器人场景,主要是通过精准问答引擎和AIGC引擎结合,实现用户全旅程陪伴,覆盖服务,营销场景。

平安银行就三类大模型在同样业务场景下的问答表现做了横向对比测试:

针对L0基础大模型,对清华ChatGLM、文心一言、ChatGPT初步评估,发现清华大模型的反馈比较中庸,文心一言比较复杂,但反馈的意思跟清华反馈的差不多,ChatGPT的反馈相对单薄了一些。

针对L1行业大模型,平安集团的PinganGPT,整体回复更亲切一些。

针对L2场景大模型,基于BankGPT训练的专业理财大模型,反馈结果比较匹配。它首先会判断客户意图,评估客户对长期理财是否感兴趣,是否愿意参加相关的营销活动。其次,从策略角度讲,针对需要推荐的产品,自动化生成话术,同时会推荐其他的业务产品,在客户服务过程中,以消息方式推送给客户经理进行推荐提醒和辅助。

通过以上测试分析,我们发现:虽然国内的大模型和ChatGPT都有差距,但中文语义理解方面,国内模型还是比ChatGPT要好一些,尤其是从BankGPT反馈的测试情况来看,它已经具备了作为一个智能助手适配场景的能力。

大模型未来可期

未来,大模型在银行的应用场景非常丰富。目前已经应用的场景有客户服务、信贷审批、投研服务三大类。

客户服务场景有机器人服务、辅助坐席回复、服务管理、辅助营销等;信贷审批场景有贷前风险评估、智能尽调报告、辅助审批、合规审查、贷后催收服务等;投研服务领域的主要应用场景是研报、年报、财报的自动生成。

大模型除了能够应用于文字类的语言生成和语义理解外,在图片类和视频类的生成方面也有着广泛的应用。

对于图片类,可以通过大模型技术,实现图像的编辑和自主生成。图像编辑工具可用于去除水印、提高分辨率、设定特定滤镜等。图像自主生成工具可用于生成创意图片,比如随机或按照特定属性生成画作等;也可生成功能性图片,比如根据指定要求生成营销类海报、logo等。

对于视频类,可以通过大模型技术生成视频,包含视频属性编辑、视频自动编辑及视频部分编辑三类功能。视频属性编辑可实现删除特定主体、生成特效、跟踪剪辑等;视频自动编辑可对特定片段进行检测及合成;视频部分编辑可进行视频换脸等。

平安银行也在积极推动大模型技术在贷款审批、海报生成、AI面审、数字人营销等场景的探索与应用,借助于AIGC智能化的技术手段,逐步推动AI替代人工,数智化助力全行降本增效的目标达成。

大模型如何驱动银行数智化转型

企业的数字化转型,尤其是金融行业,绝不仅仅是大模型这一方面的事情。无论是国家层面,还是银行监管层面,都已经提出银行向数字化快速转型和发展的要求。从2016年到现在,平安银行一直致力推动数字化转型变革,经历了三个阶段,主要以“科技引领、零售突破、对公做精”三个方面为战略牵引。针对当前阶段,平安银行将围绕零售智能化银行、对公零售打通开放银行为核心,从数字化经营、数字化管理、数字化运营、数字化风控几方面,推动全面数字化能力提升。

大模型是银行业从数字化向智能化迈进的重要驱动力量,必然会在数字运营、数字经营、数字管理、数字风控等更多场景,实现AI服务与替代人工。银行数智化绝不仅仅只有大模型的应用场景,但我们需要正视:很多业务仍是手工线下处理,很多信息并未有效收集,很多数据无法实现标准化,很多业务场景尚未实现策略配置驱动,仍是人为决策,这些都制约着银行走向数智化。

因此实现银行数智化能力,需要先实现以下能力:在数据资产方面,数据采集需要极大丰富,内外部数据、非结构化数据均要实现资产化,数据充分共享打通、安全可控。在工具平台建设方面,构建营销、运营、风险政策配置化管理能力,提升相关工具平台中台能力。在AI应用和业务投入产出方面,探索实现闭环的数据化归因、自动优化的能力。

我们需要进一步思考,AI算法模型对业务发展的价值如何、覆盖全行多少业务场景、让算法替代人还是让算法永远服务于人,并且制定相应的考核与牵引指标驱动更多的业务场景实现数智化能力。

“道阻且长、行则将至”,大模型的应用与发展的潜力和空间是无限的,驱动银行数智化转型本身也是任重道远的。转型成为数智化银行,未来还要有很长一段路还走,还有很多事情要做。

往期研讨会回顾

互金协会?金融机构?催收公司共议:催收的边界在哪,如何应对反催收黑产?

银行理财距离真正的投研驱动有多远?

个人养老金业务发令枪响,银行、理财子如何接招?

突破互联网贷款整改瓶颈,征信管理亟需分层、扩容

【关于我们】

新金融联盟(NFA)成立于2016年,致力于打造一个高质量的新金融政策研讨和行业交流平台。成立以来,联盟共组织各类闭门研讨会、优秀企业参访近百场,议题涵盖数字金融、数据治理、资产管理等方向。部分研讨成果形成报告,呈送给相关部门,推动了业界与监管的沟通交流,助力理事单位的合作共赢。

本文首发于微信公众号:新金融城。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:张晓波 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读