摘要:众多的金融机构及金融科技企业都在积极拥抱大模型的到来,除了已经涌现出若干金融垂域大模型以外,应用场景的探索也是重中之重。目前为止,相当多的金融大模型应用层出不穷,百花齐放,但仔细观察可以发现,大多还集中在改变或提升人机交互的方式方法层面,如智能客服、文档协助处理与生成、NL2SQL等全行业耳熟能详的领域。那么,大模型能否更加深入与广泛地与金融业务或科技需求融合以推进金融科技水平发生阶跃性的升级,甚至推动金融行业发生新一轮的智能化变革?本文首先提出是否并如何引入大模型的原则,接着试图尽量清晰地界定大模型的能力边界,然后对大模型在金融行业的具体应用领域进行全面的分析与讨论,旨在为大模型驱动的新一轮金融智能化行动提供参考与建议。
1. 大模型驱动AI无处不在
大模型的潮流席卷而来,除了基础模型方面各种开闭源大模型层出不穷,争奇斗妍以外,各行各业也掀起大模型智能应用探索的热潮,金融行业自然也不例外。本文认为,大模型有望彻底改变人工智能在金融科技中的应用状况,驱动AI无处不在。
长期以来,人工智能在金融行业的应用一直处于比较尴尬的状态:都在重视都在尝试却少有真正起到关键性作用的案例与场景,更不要说成为推动金融科技进步的主要因素了。“智能”这个词,相当多的情况下背后实际上是预定义规则,或者是部分自动化流程,以统计/机器学习为主体实现的并不多;而相当多采用统计/机器学习方法的项目,实效也并不理想。这主要是因为经典机器学习方法:
实践证明,人员、成本及技术等多个因素决定了以机器学习为主的经典人工智能很难成为平民化的通用IT设施,是一个“奢侈品”,而绝大多数关于AI中台的规划设计都停留在概念上。因此,人工智能一直都没有成为金融科技建设发展的主力军,成点困难,有点无面,难以普及,名不符实......。
而大模型驱动的新生代人工智能则完全不同:
因此,本文认为,虽然离AGI还有一段距离,但大模型有望使人工智能实现平民化,大大降低AI的使用难度,扩大应用范围,推动AI无处不在,成为通用IT基础设施。
2. 金融大模型及应用现状
众所周知,金融行业一直以来都是信息科技与人工智能发展与应用的高地,金融科技也一直在行业数字化转型中处于引领地位,大模型自然也是如此。目前,在模型基础设施(Infra)与应用场景方面,众多的金融机构及金融科技企业都积极的探索与尝试。
首先是预训练的金融垂域大模型。在Transformer架构与LLM流行之前,实际上就已经有专业领域的金融大模型推出,如基于深度双向架构BERT、用于金融文本情感分析的FinBERT系列,以及基于生成器-鉴别器框架的ELECTRA模型的金融领域变体FLANG;2022年底由GPT3.5推动的Transformer架构流行以来,也出现了如T5(Text-to-Text Transfer Transformer),基于GPT的PloutosGPT,FinGPT,基于BLOOM的BloombergGPT,XuanYuan 2.0,基于LLama的FinMA、Fin-Llama、Cornucopia – Chinese,以及FinTral,以及华为盘古基础大模型之上的L1金融行业大模型与L2金融场景大模型等。同时,也有相当多的金融机构在采用全量或微调方法自行训练本企业或者行业专用的垂域大模型。
然后就是大模型的金融行业应用。本文认为,现阶段,真正有效的大模型金融应用场景探索比金融垂域大模型研发重要的多。与通用大模型不同的是,垂域大模型的作用主要体现在其所能支持的专业应用场景上,否则将毫无价值。在这一方面,可以说已经在业界掀起了一股强烈的探索热潮,其中部分是在自有垂域大模型基础之上开展,部分是直接在通用大模型之上开展,并已经取得了一些可圈可点的效果。目前为止,可见并已证明可以产生实效的场景主要包括:
需要指出的是,虽然上面这些场景都是大家能够最先想到的,但真正要做的很好,也不是那么容易,必须结合优质的技术架构与工具设计,模型优化,数据准备与处理,以及反复的尝试与试错,同时也不可避免的需要对所在行业与场景知识的专业性通过实操深入理解。以客服为例,可以说,即使对通用大模型什么也不做,直接使用或者简单定义一些提示词知识提示模板,也能达到一定的效果,比如百分之六、七十真人的准确度。但如果想到达到90%以上的准确率,那就必须结合专业细致的行业数据、话术抽象、切分,上下文学习/RAG使用,知识图谱的构造,人类反馈的常态化,模型的选择,模型微调中参数调优、数据质量与混合比例的调优、减少遗忘的策略设计,甚至模型结构的创新改造设计等手段综合起来,才可以达到。
虽然这些场景也需要投入相当专业的工作才可以达到比较好的实效,但可以发现,如上场景基本都可以归为一类,即人机交互方式的改变与提升,统称为自然语言用户界面也不为过。严格来讲,也还没有使大模型在金融科技或者金融业务的主体部分发生作用,例如金融科技中的数据、交易、运维体系系统性改进或改造,金融业务中的存、贷、投、保、风控、营销等产品或服务质效提升、模式变化甚至催生新业态。这正是大模型在金融行业的应用现状,即大都集中在人机交互模式的升级,还没有广泛深入到金融科技与业务的主体中,那么所谓智能金融革新的具像自然也处于较为模糊的阶段。
但由上文分析,我们还是希望并坚信大模型的能力远不仅限于此,坚信大模型能将人工智能在金融行业的应用推向新的水平,更加广泛与深入的改变金融科技与业务的现状,甚至驱动产生一个名符其实的智能金融新时代。下面我们将从大模型的应用引入原则,大模型的能力边界分析,以及具体的、更大范围的大模型金融应用场景几个方面进行论述(需要指出:本文主要讨论大语言模型LLM,以下统称大模型)。
3. 大模型的应用引入原则
大模型究竟能在哪些应用中发挥作用?这是目前探讨最为热烈、广泛的问题。有观点认为大模型的适用范围非常广,几乎可以改造所有应用,人类即将进入人工智能无所不能、无处不在的时代,大量的工作工种将被人工智能替代,甚至有一股强烈声音认为人类自己都将被AI替代与控制;还有观点则认为大模型的作用被严重夸大与炒作了,实际上大模型的主要进步还是局限在自然语言的理解与对话生成上,在其它方面并没有明显的突出能力与优势。这两种观点究竟孰是孰非呢?
本文认为,大模型的应用探索,并不需要以准确回答这个问题为前提。或者说,评判“无敌论”与“炒作论”,对大模型究竟能在哪里发挥作用,没有太多的实际意义。我们需要回答的问题是:在应用中,究竟可以在哪些地方引入大模型?对这些问题的具像回答,我们会在后文中与大家一起探讨,但本文尽最大努力所能列举出来的场景参考,肯定只能涵盖大模型可能作用范围的一部分,甚至是一小部分。因此,本文试图给出实践中大模型的应用引入原则,即如何判断究竟在哪些地方适合尝试引入大模型进行提升或改造。这里认为,相关的原则讨论比具体的场景介绍还要重要,它可以在实践中有效地指导产品或者研发的判断,从而将有限参考的作用转变为无限挖掘的支持。
就是说,在探索挖掘大模型应用场景时,不要停留在整个场景的宏观层面,比如:“能否用大模型实现智能决策?”“能否实现智能营销?”“能否实现智能风控”,对此类回答“是”或者“否”往往没有太多的意义。应该对要提升与改造的场景的实现流程、分支步骤的实现方法、所依赖的数据与工具等进行细粒度的分解与分析,每一步、每一点都探究下是否可以使用大模型进行提升,所谓“精耕细钻”;
那么,在实施“精耕细钻”的过程中,究竟怎么判断哪个环节适合引入大模型呢?这自然需要具体问题具体分析,很难给出一个统用的答案。但是,本文认为,以现阶段大模型的能力表现来看,倒是可以总结相对通用的原则:凡是依赖人类手工的工作,或者人类专家经验的环节,都有可能基于大模型进行智能增强或者替换,所谓“人”“智”增替。也就是说,如果有某项工作过去一直无法避免大量的人工耗费,现在大模型就很有可能大幅减少人工甚至实现完全自动化;如果有某些环节过去必须依托专家经验的亲自参与才能取得较好的效果,现在大模型就有较大概率在一定或者很大程度上替代专家经验。
总之,笼统的讲大模型适用不适用哪个场景意义不大,应该在“精耕细钻”的基础上,以人”“智”增替为原则进行判断,可以做为大模型的应用引入原则标准,从而有效地指导大模型的应用推广实践。
当然,这并不是说所有符合原则的情况都一定能通过大模型得到明显的成效,只是说这些地方值得仔细研究与尝试,但却可以帮助我们避免大量不必要的尝试。例如复杂的数学计算,分明是可以直接调用相关的软件包或接口来实现,目前看用大模型的必要性显得不是很大。另外这也只是大模型现阶段在工程实践中的应用引入原则,在科研领域,则不应该受此限制。
4. 大模型的能力边界分析
有了大模型的应用引入原则之后,还需要讨论一下大模型的能力边界,或者准确地讲是指现阶段大模型的工程能力边界,这也是有助于更进一步界定应该在什么时间、什么程度上应用大模型。需要限制在工程而非科研领域。因为大家经常会看到一些介绍或探索大模型非凡能力的文章,但有可能是在科研领域内。严格来讲,在科研领域,可以是无所不能的,但在工程实践中是否适用,实际是个问号。现在来尽量准确回答这样一个问题:大模型究竟能做什么,擅长做什么,不能或者不擅长做什么?
关于大模型的对话、文档摘要与生成、翻译、情感分析等语言型能力,属于众所周知的,本文就不再赘述了,这里从如下几个方面进行分析:
首先看一下大模型的能力擅长,即大模型比较其它特别是经典AI方法有明显优势的能力究竟还有哪些?可以重点关注几个方面:
关于大模型能力擅长,还有一个重要问题需要在工程实践中特别关注:即关于确定性的问题。目前看来,虽然可以结合专向微调,上下文学习icl/RAG,知识图谱等多种方法来提升大模型的准确率与确定性,也出现一些可喜的研究成果,但至今业界没有人、没有实践、也没有理论基础能保证大模型输出结果的可靠性,包括幻觉(Hallucinations)、思维连贯性与一致性,以及认知错误等。因此,原则上现阶段大模型不适合应用于必须精确或确定结论的场景!或者说在这种场景中,大模型的结果只能做为辅助人类判断的参考。例如金融行业的信贷决策、投资决策、风控决策、利率确定等等,不应该基于大模型向着自动或者无人化的方向努力;关于包含决策或者直接影响决策的文档与报告,也不应该完全由大模型来生成。
5. 大模型的金融应用场景探讨
基于如上大模型应用引入原则与能力边界的总结,现在对大模型一些可能的具体金融应用场景进行探讨。需要指出的是,正如上文所述,下面所有具体场景,都需要依据“精耕细钻、人智增替”的原则在实践中从业务、技术、产品三个角度仔细分析斟酌大模型的可适用度。并且即使是判断可适用的环节,也需要从数据准备、模型优化以及技术方法与架构设计几个角度不断结合实效调整迭代、深度打磨,才可能得到相对满意的效果。
除如上列举之外,大模型还可以在数据库查询优化(如通过学习历史模式智能生成查询计划、智能索引优化、智能缓存管理等),集群效能分析(如SQL资源占用分析、集群资源扩缩需求量化分析等),安全审计,隐私保护等等很多方面发挥作用,只要遵循上文引入原则仔细分析,其可适用的场景可以是非常广泛的。
6. 结语
大模型在金融领域的应用场景还在持续不断的探索中,这种探索首先应该遵循对场景流程精细分析,以及尽量减少人工干预的原则,同时参考大模型已被证实有效的能力边界来做决定。除了较为普遍的人机交互类场景以外,大模型可以在金融数据智理、客户分析、营销推荐、价格预测、异常检测、风险评估、流程自动化以及金融场景模拟等方面发挥不同程度作用,但如何有效的在这些场景中正确引入大模型,需要依据细粒度上下文情况,结合大模型的技术特点做仔细业务分析与产品设计。并且具体的工程实现方法,包括数据预处理、模型调优、上下文相关学习、训练技巧、技术架构、经验总结并不断迭代优化等非常关键。总之,简单停留在宏观描述层面某个场景讲行与不行,没有太大的意义。