LLM搭建金融系统

背景:

这篇文章主要给大家介绍如何基于LLM模型配合各种pluging工具(这边主要是跟数据连接、检索的工具相关:知识图谱、向量库...)。在开始文章前先讲讲我的观点:大模型的颠覆性应用应该不在于AIGC,而在于数据驱动技术的一次迭代,由稀疏数据驱动的数据到稠密数据驱动。怎么理解这件事情呢,所谓的数据驱动就是我们个人或者社群的行动数据是没有人收集、然后把数据反馈到我们下次社会活动中形成闭环改造和影响我们的社会活动的。但是从又了互联网后,一方面互联网的便捷沟通让我们更多社会行为发生在互联网,另一方面互联网也记录着我们的各种行为,并且这些曝光、浏览、点击、转化...数据通过算法和系统方式反馈回来影响我每个人的行动和社会形态,也就是所谓的形成加速的行为反馈驱动机制(数据驱动)。但是反观有互联网后我们产生的系统有哪些:搜索系统、推荐系、UGC系统(包括社区、内容创作)。搜索系统、推荐系统使用的数据一直都是利用曝、点、转数据作为行为激励通过集体智慧方式来参与这个社会活动的个体;UGC部分因为能分析的数据大部分也是用户在某细分内容下停留时长、点赞数、传播数,通过这些数据的分析洞察来引导内容创作,保持社区的活力(同时也带来内容的单一化)。

可以看到上面这些曝、点、转、停留时长、点赞数、传播数...都是比较稀疏的数据,并不能够把用户在做这些动作时候的复杂心理、场景、情景刻画出来。但LLM模型的基于少量信息额输入,可以把可能的场景、情景刻画出来的能力,会让用户在做这些动作决定的信息变得更饱满信息量更大更稠密。这种以少补多的脑补能力可能会改变整个数据驱动的形态,由信息量数据稀疏驱动到稠密数据驱动。可能会有同学讲这事不就是脑补了些画面数据吗,你这个数据都是猜出来的很有可能不够准确。确实是,感觉数据是猜出来的能解决什么问题呢?

1.LLM模型是对世界知识的更接近人类思考的通识建模,所以不是猜而是用了更先进技术用少量数据得道更准确预测

2.数据准确度提升后,可以让交互和产品设计发生更大改变,可以获取到更多更准确数据(通过AIGC内容反馈用户根据反馈得到进一步确认)

3.以前没法设计和收集没法用然后放弃不收集的数据,可以收集来更好复杂提高信息准确度

例子:

这部分会介绍一个金融营销文案例子,主要目的在于相对完整的介绍如何通过LLM搭建一个系统和工作流来满足业务的复杂需求。开始例子介绍前,我们可以先来看看这件事情的难点在哪:

1.业务给的信息很少,他们会默认我们知道很多业务背景知识

2.金融营销文案有严格的表达方式,很多商品营销文案的写法在金融域是不能用的

3.金融文案要求表述准确,营销要求多样化,准确往往意味单一,所以单一的多样化难度很高

4.很多专业名词,专业名词概念理解不对很容易出现表述错误

营销文案生成可以从哪几个方面入手增加多样性:

人群

货品卖点+场景

场景+时间

表述方法+货品卖点

人群

突出人群特点

场景化故事营销

某事件人群需求点

人货匹配差异化表述

货品卖点

人群和货品匹配点

突出产品在特定场景卖点

特定事件货品特点

卖点差异化表述

场景

人群在场景需要什么货品

场景化卖点差异化表述

时间

在特定时间人对货品需求

特定事件货品卖点

事件化卖点差异化表述

表述方法

突出人群对表达方式偏差

特定场景下卖点表述包装

故事化表述事件

营销文案的写法其实无非也是围绕着“人、货、场、时间、表述方式”这几个维度来组合构建更多样化和差异化的文案。换句话说也就是最好业务能够给我们提供上面几个维度的信息,以及一些组合条件和约束;那么我们应该就可以通过各种组合方式产出文案,然后通过筛选给出满足条件文案。或者说我们有一个模型具备了,给定上面文案生成的物料输入,然后给定了些好例子、给定了些背景约束,这么行能够判断哪些组合是符合业务需求的。

业务输入:

1.人群:20岁以下年轻人——刚入职场、在校大学生 

2.产品卖点:债券产品、稳健、周期短、灵活

3.参考例子:“小成本也可理财,让你的钱有所作为,不再为钱无奈”

缺什么输入:

1.场景

2.时间

3.需要什么样组合来生成文案

4.产品卖点单薄、产品专业术语没给出

5.人群和卖点契合度是什么

补充信息:

1.补人群画像特点:消费欲望强、对未来憧憬、没什么钱、不太喜欢严肃表述方式、喜欢调侃、表述要有趣

2.补人群理财生活场景和理财目标:旅游、买房、消费、

3.补例子优秀的原因:年轻人的生活场景和理财目标,并且表述方式不那么严肃符合年轻人朝气蓬勃要求

4.年轻人喜欢的表达方式:更亲切、自由、不要过于严肃,好玩有趣、可以更委婉表达

5.补充产品和人群契合点:产品收益稳定风险小,买卖灵活;年轻人没什么收入,抗风险能力低,资金周转要灵活,对生活美好向往,想要赚钱消费旅游

6.表达元素组合:人群+产品卖点、人群+场景+产品卖点、人群+产品卖点+表述方法

如何去补这些信息:

1.把人、货、场、表述方法、时间中一些稳定的知识构件知识库,根据用户输入的少量信息从知识库里检索出需要信息,如果要检索的准,应该要对用户输入和投放业务做业务建模,通过建模固化一些信息映射规则

2.用户输入一些临时的数据,比如产品说明书、人群的喜欢的阅读内容、产品卖点,通过卖点抽取方式即时的对临时数据消化抽取出有用信息

3.大模型具备一些人、货、场、时间、表述常识,可以根据用户的输入作为上下文,来生成一些信息(有可能不准确需要人过滤)

4.训练一个根据用户输入信息可以给出补充信息的大模型(为什么不是直接训练输入到文案生成模型,原因是链路太长数据太少,这么训练很容易过拟合)

模型生成:

有了这些补充信息文案生成准备工作到位了,那么接下来该如何去把这些补充资料组织起来放入LLM模型做文案生成呢。原理很简单:把补充信息作为上下文,加上约束条件后构建生成prompt输入LLM生成就好。这里可能会出现的问题:

1.LLM模型理解能力不够,这么复杂上下文有可能模型理解不了;解决方案训练更强LLM

2.模型生成的效果不太好,不够专业,并且明显不是信息不足带来的:解决思路训练更强LLM

Q:结合年轻人的生活场景和理财目标,想象自己是一个年轻人,想要看到什么样的理财信息,考虑他们初入职场或在大学,抗风险能力弱、能投入资金不多,灵活购买的理财需要,结合主标题的场景:年轻人的理财方式,你跟上了吗?写30对符合场景预期连贯多样化的副标题、底部引导文案更文艺委婉,不要出现用户注册下载的硬广描述,每句字数不超过20个字文案风格多样化、差异化,贴近年轻人生活,亲切可执行,场景化描述,有代入感,不承诺收入,不要过于绝对描述;输出格式如下json:{主标题:年轻人的理财方式,你跟上了吗? ;副标题:;底部引导文案:}\n。
产出文案:

Q:指令:用关键词组{"稳健理财、抗风险能力差、理财好习惯、逐步积累资产、小成本也可理财、收益稳健、抗风险、历史无亏损、资产稳健、小投入、交易灵活、买入成本低、收益快、周期短、交易灵活、收益稳步提升、练手好选择、可及时止损"},结合年轻人的生活场景和理财目标,想象自己是一个年轻人,想要看到什么样的理财信息,考虑他们初入职场或在大学,抗风险能力弱、能投入资金不多,灵活购买的理财需要,结合主标题的场景:年轻人的理财方式,你跟上了吗?写30对符合场景预期连贯多样化的副标题、底部引导文案更文艺委婉,不要出现用户注册下载的硬广描述,每句字数不超过20个字文案风格多样化、差异化,贴近年轻人生活,亲切可执行,场景化描述,有代入感,不承诺收入,不要过于绝对描述;输出格式如下json:{主标题:年轻人的理财方式,你跟上了吗? ;副标题:;底部引导文案:}\n。
产出文案:

我们对需要补充的数据进行分类,下面会来讲如何去构建这些数据,以及如何通过LLM+数据提供Agent来构建系统和工作链路,让这个复杂问题变得更可行。最后也会介绍如何缩短这个工作流程简化系统,其实原理很简单:等到数据足够我们会把每个环节训练一个LLM模型来一步到位解决这些需要多步解决问题,到最后甚至可以端到端的一个LLM模型来解决用户输入直接产出文案的问题。所有的前提都是数据量足够,分步构建系统的解决也是因为数据不够但是事情也要推进,不得已为之。

构建知识库

相对稳定知识:

用知识图谱存储,拓扑结构有更强信息扩展性

基金产品的目标客户群体,如年龄、收入、风险偏好等

指标、数据常识知识补充

基金产品的名称、类型、目标、风险等基本信息

基金产品的特点、优势、亮点等核心卖点

LLM搭建金融系统_第1张图片

动态变化知识:

向量知识库存储,LLM对输入信息抽检索词,检索会关键词上下相关100字,然后对信息作抽取和观点判断生成判断摘要

基金产品的数据指标,如收益率、净值、排名等

基金产品的竞争对手或同类基金,以及相比之下的优势或差异(对比的指标是什么)

临时性给出的产品卖点文档

约束条件:

存储成规则模版

基金产品的文案字数限制,如不超过25字

基金产品的文案表述要求,如不能过于绝对,不能出现幻写,绝对或者虚假的表述

不能出现的词

不能出现的组合

句子模版:

存储成规则模版

指标对比+指标总结突出自己

指标对比+突出卖点

指标对比+人群喜好

指标对比+时事洞察

......

改写模版:

增加一些情感化的语言,如赞美、鼓励、吸引等,来增强文案的感染力和说服力

增加一些数据或证据,如历史业绩、客户评价、媒体报道等,来增强文案的可信度和权威性

增加一些互动或引导,如提问、回答、扫码、点击等,来增强文案的互动性和转化率

在开头和结尾增加了一些情感化的语言,如亲爱的、惊人的、赶快行动吧等,来增强文案的感染力和说服力

在中间增加了一些数据或证据,如2007年的收益率、投资者和媒体的好评等,来增强文案的可信度和权威性

在结尾增加了一些互动或引导,如扫描二维码、点击阅读原文等,来增强文案的互动性和转化率

负面词:

不可错过

不二选择

无人能及

最优

最佳

......

#写
为了让AI文案生成机器人能够稳定高效的理解你的话,你需要设计一个清晰、完整、具体的prompt,包括以下几个要素:

基金产品的名称、类型、目标、风险等基本信息
基金产品的特点、优势、亮点等核心卖点
基金产品的数据指标,如收益率、净值、排名等
基金产品的竞争对手或同类基金,以及相比之下的优势或差异
基金产品的目标客户群体,如年龄、收入、风险偏好等
基金产品的推广渠道,如网站、微信、APP等
基金产品的文案字数限制,如不超过200字
基金产品的文案表述要求,如不能过于绝对,不能出现幻写
一个可能的prompt示例是:

我想要生成一篇关于华夏成长混合型基金的文案,用于在微信公众号上推广。这是一款混合型基金,主要投资于具有成长性的中小盘股票,追求长期稳定的收益。该基金的特点是:

有着20年的历史,是国内最早成立的混合型基金之一
由王亚伟担任基金经理,他是国内知名的成长股投资专家,有着丰富的投资经验和独到的投资理念
采用主动管理的策略,根据市场变化灵活调整仓位和配置,把握市场机会,控制风险
在过去的5年中,该基金的年化收益率达到了25%,在同类基金中排名前10%
该基金适合有一定风险承受能力,追求长期稳健收益的投资者
该基金的文案字数限制是不超过200字
该基金的文案表述要求是不能过于绝对,不能出现幻写

#改
这篇文案已经比较符合你的要求,但是如果你想要进一步改进,你可以考虑以下几个方面:

增加一些情感化的语言,如赞美、鼓励、吸引等,来增强文案的感染力和说服力
增加一些数据或证据,如历史业绩、客户评价、媒体报道等,来增强文案的可信度和权威性
增加一些互动或引导,如提问、回答、扫码、点击等,来增强文案的互动性和转化率

#如何改
我是根据你提供的prompt和文案要求,以及我自己的创意和知识,来改进这篇文案的。我主要做了以下几个方面的改进:

在开头和结尾增加了一些情感化的语言,如亲爱的、惊人的、赶快行动吧等,来增强文案的感染力和说服力
在中间增加了一些数据或证据,如2007年的收益率、投资者和媒体的好评等,来增强文案的可信度和权威性
在结尾增加了一些互动或引导,如扫描二维码、点击阅读原文等,来增强文案的互动性和转化率

原文:华夏成长混合型基金,王亚伟主理,20年混合型基金经验,主动管理,把握成长股机会,长期稳健收益。
提问:请用一句话改写这段文案,使其更加简洁和吸引人,但不要失去原文的意思和信息。请不要使用过于营销和过于专业的词语,也不要使用过于绝对的表述。请尝试使用不同的风格和语气,以适应不同用户的意图。
改写:王亚伟带领华夏成长混合型基金,20年稳健投资成长股。(正式风格)
改写:华夏成长混合型基金,王亚伟操盘,20年擅长成长股,主动调仓,收益稳定。(口语风格)
改写:想要投资成长股?华夏成长混合型基金是你的不二之选。王亚伟主理,20年经验,主动策略,稳健收益。(引导风格)

#

首先,你可以看基金的投资目标,这部分会告诉你基金的主要投资方向和策略,以及基金的风险收益特征。例如,华夏成长混合型基金的投资目标是“通过对具有成长性的中小盘股票进行投资,追求长期稳定的收益”1。
其次,你可以看基金的费用和开支,这部分会告诉你基金每年向你收取的费用,包括管理费、销售费、交易费等。这些费用会影响你的实际收益,所以你要仔细比较不同基金的费率。例如,华夏成长混合型基金的管理费是1.5%,销售费是1.2%,交易费是0.05%1。
再次,你可以看基金的业绩表现,这部分会告诉你基金在过去一段时间内的收益率和风险指标,以及与同类基金或者基准指数的比较。这些数据可以帮助你评估基金的历史表现和潜力。例如,华夏成长混合型基金在过去5年中的年化收益率是25%,在同类基金中排名前10%1。
最后,你可以看基金的管理团队,这部分会告诉你基金经理的姓名、职位、工作经历和投资理念等信息。这些信息可以帮助你了解基金经理的专业水平和风格。例如,华夏成长混合型基金由王亚伟担任基金经理,他是国内知名的成长股投资专家,有着丰富的投资经验和独到的投资理念1。
如果你想要把这些数据特点卖点和基金产品的卖点关联起来,可以有以下的方法:

首先,你要明确你的目标受众是谁,他们有什么样的需求和偏好。例如,如果你的目标受众是有一定风险承受能力,追求长期稳健收益的投资者1,那么你就要突出基金的长期稳定性和成长性。
其次,你要选择最能体现基金优势和特色的数据和信息,并用简洁明了的语言表达出来。例如,如果你想要强调基金经理王亚伟的专业水平和风格,那么你可以说“王亚伟主理华夏成长混合型基金,20年成长股投资专家”2。
再次,你要注意避免过于绝对或者虚假的表述,并且符合法律法规和行业规范。例如,如果你想要描述基金在过去5年中的业绩表现,那么你不能说“该基金保证每年25%以上的收益”,而应该说“该基金在过去5年中的年化收益率达到了25%”1。
如果你想要让AI机器人设计prompt来解决这个问题,可以有以下的方法:

首先,你要定义你的问题的输入和输出,即你想要让AI机器人从哪些信息中提取数据特点卖点,并且生成什么样的文案。例如,你可以设定输入是基金的招股书,输出是一段不超过25字的推广文案。
其次,你要给AI机器人一些示例,即你想要让AI机器人参考的已有的数据特点卖点和文案。例如,你可以给AI机器人一些其他基金的招股书和文案,让它学习其中的规律和模式。
再次,你要给AI机器人一些约束,即你想要让AI机器人遵守的条件和规则。例如,你可以给AI机器人一些法律法规和行业规范,让它不要生成过于绝对或者虚假的表述。

如何串接链路

prompt结构化

指令约束prompt+输出格式prompt+工具API prompt+内容约束prompt+金融常识prompt+上下文prompt+问题结构prompt

Q:指令:用关键词组{"稳健理财、抗风险能力差、理财好习惯、逐步积累资产、小成本也可理财、收益稳健、抗风险、历史无亏损、资产稳健、小投入、交易灵活、买入成本低、收益快、周期短、交易灵活、收益稳步提升、练手好选择、可及时止损"},结合年轻人的生活场景和理财目标,想象自己是一个年轻人,想要看到什么样的理财信息,考虑他们初入职场或在大学,抗风险能力弱、能投入资金不多,灵活购买的理财需要,结合主标题的场景:年轻人的理财方式,你跟上了吗?写30对符合场景预期连贯多样化的副标题、底部引导文案更文艺委婉,不要出现用户注册下载的硬广描述,每句字数不超过20个字文案风格多样化、差异化,贴近年轻人生活,亲切可执行,场景化描述,有代入感,不承诺收入,不要过于绝对描述;输出格式如下json:{主标题:年轻人的理财方式,你跟上了吗? ;副标题:;底部引导文案:}\n。
产出文案:

流程控制

检索式生成

摘要抽取流程

生成流程
多步生成

生成素材回流

LLM搭建金融系统_第2张图片

小结:

1.结合一个金融营销文案生成的具体例子介绍了如何利用LLM搭建文案生成系统保证生成质量

2.介绍了营销文案多Agent配合生成每个Agent部分的功能和构建架构

3.介绍了要如何把每部分串接的链路

4.提出一个观点:大模型的颠覆性应用应该不在于AIGC,而在于数据驱动技术的一次迭代,由稀疏数据驱动的数据到稠密数据驱动

你可能感兴趣的:(金融,AIGC,人工智能,机器学习,算法)