2023世界人工智能大会期间,创邻科技创始人兼CEO张晨博士受邀走进第一财经的演播室,围绕人工智能技术和图技术在金融行业的赋能展开讨论,为线上数万名观众分享精彩前沿观点。
AI赋能金融 大模型催生新业态 | 图技术赋能金融领域进入全新阶段
以下为张晨博士采访汇总,阅读时长5分钟。(部分内容有调整)
第一财经:请先分享一下,人工智能技术和图技术两者是什么关系?
张晨:想要直观理解两者关系,我们可以先将AI比作一个大的圈,覆盖多种实际业务应用。同时将包含操作系统和数据库的Infra比作另一个圈,那么两个圈之间的重叠部分则可以理解为图技术。换句话说,图数据库作为底层基础设施,有机会成为 AI 的新基建。
而在两者的结合上,首先我们可以发现,图数据库不同于传统数据库只用来进行数据存储,它本身和业务存在密切关系,并且不同业务线的建模方式有非常大的区别,因此图数据库需要和人工智能技术的上层应用更紧密地结合;其次是图数据库十分善于处理关联关系,因此可以做到对AI涉及多条业务线的不同数据源进行关联,发挥过去单片数据无法实现的作用。
第一财经:了解到您在图数据库领域深耕多年,请问您如何理解人工智能技术和图技术对金融行业的赋能?
张晨:我们回顾图技术对金融行业的赋能历程,可以发现金融业现在已跳过最初的技术认知鸿沟,迈入飞速发展阶段。而认知的迭代离不开市场发展初期,金融知识图谱应用方案的迅速普及,同时市场中出现许多底层采用图技术的风控解决方案。久而久之,金融机构开始了解图技术。在此背景下,创邻科技率先深入金融行业,打磨产品和解决方案,现已为多家银行提供图数据库产品与服务,稳定运行图规模超两万亿点边,受到客户认可。
而随着以大模型为核心的人工智能技术的迅速发展,图技术在金融行业的应用也将迈进新阶段。对银行而言,如何通过内网数据建设既符合数据的合规性、安全性,又能高效落地应用场景的优质大模型成为关键挑战。并且由于银行内部数据安全性、准确性要求高,如何能够避免大模型应用过程中的胡说八道问题至关重要。而图数据库的最大优势之一便是可解释性,以事实之间的关联进行分析从而输出严谨的结果,因此两者的结合能够让答案变得更加准确,赋能金融大模型更精准、更高效,从而更安全地应用于金融行业中。
第一财经:金融行业在技术落地方面充满挑战,为何在创业初期选择这个领域?
张晨:这与我的第一份工作相关。我博士毕业后曾担任美国运通的大数据科学及工作,从事风控算法研究,因此对风控业务场景比较了解,积累了很多金融机构的服务经验;并且金融属于非常特别的行业,它在认知和技术上非常的先进,同时它拥有海量的数据,技术和业务场景存在非常多的创新需求。除此之外,新技术应用在金融行业时,它的效果也比较容易量化。综合以上,我们最先将产品应用于金融领域,以点带面,逐渐辐射到其它关键行业。
第一财经:我们了解到银行对技术先进性与数据安全性要求高,想了解图技术目前落地过程中存在哪些难题?
张晨:当前图技术在落地过程中遇到的最大问题,我认为是图技术相关标准的不完善。 我们可以在 《金融电子化》杂志社最新发布的调研报告了解到这点。图技术属于前沿技术,因此在市场教育上十分滞后,金融机构迫切地需要更全面的测试标准来辅助业务决策,我们在现实中和客户接触时也能明确感知需求。
因此,创邻科技在过去几年中,也在积极构建完善的标准体系。 我们主导或参与了所有国内外图数据库标准的制定,目前也正牵头与电子四院推进图查询语言GQL的制定。我们期待金融机构基于公平、公正、公开的标准来选择更合适的图数据库,真正发挥图分析的作用,增益行内数据资产价值。
第一财经:图技术对反洗钱、反诈骗等金融场景中是否更有优势?
张晨:以反欺诈为例,由于银行内部业务交易频繁且迅速,传统的关系型数据库并不能有效满足需求。因为传统数据库在反诈骗时需要关联非常多的表,随着关联表变多,查询速度会呈现指数级的下降。 但是,银行的资金流转实际是一个天生的网络,存在复杂的关联关系。当银行采用图数据库后,凭借图数据库的查询性能,能够做到实时复现整个交易网络。尤其是在实时的审批系统中,当欺诈行为发生时,图数据库能够从单笔交易迅速、直观地查询到关联的交易,从而发现可能的犯罪线索。相比于传统数据库,图数据库能够支撑起金融机构上百亿规模大图的动态在线构建和实时复杂查询返回,真正做到实时分析、计算和决策,提升风控效率。 当下我们也在和人行合作试点,希望利用图技术推动金融风控体系从“人防”向“技防”“智控”的数字化转变。
第一财经:随着Chatgpt的爆火,AIGC也在快速发展中,谈谈图技术和它结合发展的可能性?
张晨:毫无疑问,图技术和大模型存在很多互补之处。最简单的就是图技术作为抽象的底层技术,存在一定的理解难度,所以需要和上层应用紧密结合。大模型当前已经被行业广泛接受,两者结合能够降低图技术应用的门槛,降低市场教育的成本。
当然,也存在更深层次的结合。一方面,大模型走向应用的过程中需要以预训练的方式将海量企业数据沉淀到大模型中,需要花费巨大的训练成本,难以做到实时更新。而图数据库专用于存储、查询和计算关联数据,能够作为底层数据存储平台,汇聚多源异构数据,提升数据计算的效率。
另一方面,图数据库在业务逻辑上符合人类认知,并且基于事实进行计算,通过明确的、点对点的计算路径得出客观严谨的结果。因此,图数据库能够通过数据的关联计算对大模型的答案进行 “精调”,有效弥补大模型在逻辑上的漏洞,成为大模型和精准答案之间的桥梁。
未来的一段时间内,图数据库会随着大模型的发展而蓬勃发展。我们同样期待和更多的大模型厂商开展合作,共同推进图技术和人工智能技术的发展。