伴随着金融科技的不断创新,人工智能技术已成为金融行业的重要驱动力。
在9月27日于杭州云栖小镇召开的云栖大会“金融智能”专场上,蚂蚁金服集团副总裁、AI首席科学家、达摩院金融智能负责人漆远博士做了开场演讲,向与会嘉宾分享了金融智能方面的思考与实践。议题覆盖复杂网络、共享智能、知识图谱、深度图学习等多个核心技术领域,以及这些技术在蚂蚁金服的业务落地和实践,体现了以”人工智能+金融服务+普惠可持续”来打造“有深度有温度的金融科技”的理念。
以下为演讲的文字实录。
最新调查显示,全世界仍有超过17亿成人没有使用过银行服务,占世界总劳动力的50%,并且,金融服务在不同地区存在巨大服务差异,尤其是低收入、女性、少数民族和经济不发达地区。由此可见,普惠金融仍然任重道远。
AI是普惠金融的核心驱动力之一,这里将分享蚂蚁金服在发展金融智能过程中的实践与思考。
金融与AI两者是相辅相成的。AI可以赋能普惠金融提升风控能力,提高效率,改善用户体验和减少信息不对称。而金融也为AI提供完美的场景,因为金融行业数字化程度最高,拥有全方位多场景的应用,同时AI可以对金融服务提供显著的改善效果,所以金融行业也更有动力去发展和应用AI。
金融智能的机会与挑战
那么从金融行业的角度,目前对金融智能有哪些机会和挑战?我们总结,它主要集中在复杂动态网络、对抗性、人机协作、公平性、数据安全和隐私保护,以及不确定性几个方面。
首先是复杂动态网络,网络在金融服务里无所不在,不管是人和商家、商品间的网络,还是支付交易网络,再是社交网络,各种网络产生大量复杂的结构性数据,这些网络之间带有各种强网络效应,比如合作或竞争活动等,如何对它们进行建模后分析是非常有意思的挑战。
规模本身也是一个挑战,蚂蚁金服已经服务了上千万家的商户,全球十二亿用户,超过一百万服务和小程序,这背后有海量的数据和巨大的生态,我们需要考虑如何从这些海量并有噪音的数据里提取有效信息构建好的金融服务。
比如对贷款的套现欺诈,或者保险的带病投保,如何有效地利用机器学习分析海量的网络数据来防止欺诈行为是非常关键的。蚂蚁金服在这方面已经取得了一些成果,在AAAI 2019上发表论文:基于Attention及LSTM的GeniePath学习网络关键路径的重要性,在实际防骗保应用里达到95%的准确率。
第二,对抗性是金融里非常关键的特点。每一笔交易都有可能是人和系统的对抗。对抗性与前面的大规模网络和实时处理需求结合起来,将会变成更大的挑战。比如在支付宝一个简单的扫码结账的操作里,需要多个流程节点,而人和商家之间的结账交易构成了一个非常大的关系网络,同时要得到近乎实时的返回结果。对此,对抗性的风险决策的时间需要控制在100ms以下。这绝对不是个容易的任务。
第三,人机协作问题,要想服务海量用户,可扩展是很基础的能力,而要实现可扩展,需要把操作链条中的人移除,实现自动化。但另一方面,为了防止灾难性风险或者系统性错误,金融系统中人工干预是不可或缺的。在这种混合式的人机系统里,我们需要解决机器预测和决策的可解释性,自动化算法可监测、可中断等等问题。
第四,算法的公平性。女性、少数族裔、低收入人群等弱势群体都应享有无偏见的金融服务。但标准化方法极易引发不自觉的偏见,完美的公平性和算法的准确性可能产生矛盾。随着机器智能在我们越来越多的系统里发挥着关键决策功能, 我们如何能够合理设计算法及其Metrics来预防和减少算法偏见,也是一个非常关键的研究方向。
第五,数据安全和隐私保护,在整个社会对数据和隐私保护越来越重视的大前提下,作为服务提供方希望能够打破数据孤岛,让更多的数据融合产生价值,同时保证数据安全隐私,这两者其实也是矛盾的,因此,我们要想办法应对这个挑战。
最后,还有金融风险的不确定性,现实中的一些黑天鹅事件会对金融造成非常大的影响。这些不确定性可能来自非线性自反馈或者隐含变量或者复杂动态网络。当前的机器学习缺乏好的工具来处理这些问题。我们看到一个好的方向是把经济学中的理论,比如博弈论和机制设计,与机器学习进行融合,推动对抗学习、基于机器学习的机制设计、多智能体系统,及因果分析等方面的进步。
当然,金融智能还有不少其他方向,这些方向既是挑战也是机会,每个方向往前走一步会推动技术发展和业界落地。
蚂蚁金服金融智能实践
蚂蚁金服致力于实现普惠金融,为全球的商户和消费者提供服务。
在过去几年里,我们构造了两个非常关键的学习能力,分别是蚂蚁图智能平台和蚂蚁共享智能平台。蚂蚁图智能平台支持百亿节点/万亿边的图数据推理和深度学习训练、毫秒级实时构图与查询能力;蚂蚁共享智能平台提供安全可信的数据共享和机器学习算法的跨机构联合建模能力,支持对百万级金融样本建模,秒级计算。
基于图智能技术,我们提升了企业风险刻画能力,帮助新增数百亿的贷款,其背后是从单点建模到网络化的升级,有效利用了海量的关系信息。另外一个关键词是共享智能,这是一种在多方参与且各数据提供方与平台方互不信任的场景下,能够聚合多方信息并保护参与方数据隐私的学习范式,详细的技术解读可以查看我们之前的技术文章《共享智能:蚂蚁金服数据孤岛解决方案》。我们已经在信贷业务里进行了实践。
另外,基于共享智能技术我们将风控能力赋能合作伙伴,联合数据建模提升模型性能,已经在外部银行落地联合放贷能力。我们希望将来能够联合更多的金融机构,使用共享智能更有效地提升双方风控能力,服务广大的客户。
这些实践应用的背后是多年的基础开发和经验积累,从2015年开始研发,我们有50多个专利在审,拿到了一系列相关奖项,并正在牵头制定国际IEEE、国内以及行业等技术标准。我们有完整的软硬件结合的解决方案,既包括数据出域、在可信环境里共享智能,也包括数据不出域、模型在本地的共享智能,参与方可以非常灵活的选择不同模式共同提升风控能力。
前面的案例是用AI提升风控能力的,下面再介绍几个在提高效率,改善用户体验和减少信息不对称方面的落地案例。
首先是智能理赔,目的是通过人工智能能力来提升理赔效率。多收多保服务已经覆盖全国千万小商贩;相互宝已吸引9千万用户加入,去年新推出的老年版相互宝也在9天内突破1000万用户,真正让更多人享有保障。但是通过人工进行理赔由于单据多、流程复杂,相应的服务成本是非常大的挑战。如何提升服务效率,降低成本是智能理赔要解决的核心问题。在多收多保上,我们将它的核心能力总结为“212”:2分钟报案,1秒钟核赔,2小时到账。
这里面的流程是,用户通过支付宝上传材料,我们基于金融级图像识别能力识别材料中的非结构化的文字、图章等信息,并结合NLP与健康知识图谱理解背后说什么,再抽取关键信息进行后续的校验和分析推理,从而进行智能理赔决策。
另一个案例是企业知识图谱。很多金融的风险来自于各方信息不对称,我们希望通过知识图谱来减少这种信息不对称。我们把非结构化的数据结构化,相关的数据通过相关的关联面联系起来,形成企业知识图谱,用来理解当前面临的重大风险,公司的风险指数,相关的风险级别等。
它的背后是一整个处理链条,比如这一段非结构化的自然语言的法律文本,我们把它给结构化,并把主体提取以后变成有效的知识图谱,就可以辅助分析和推理。
接下来讲用户体验的提升。对金融机构而言很重要的一点是客服体验,2016年我们的用户大概是4.5亿,现在已经达到12亿,同时过去几年我们不断推出新的产品和服务,但客服人员并没有和用户数量及产品数量一样呈线性增长,核心的原因靠的是AI。我们在2015年智能客服的自助率从60%提升到了94%,2016年则是97%,2017年机器人服务平均质量超越了人工服务, 2018年通过支付宝可以语音买票,今年云客服能力在钉钉服务了广大的客户,并助力菜鸟服务大量的物流公司,其背后即是借助人工智能改善用户体验。
最后讲一个非常有意思的事,是我们的同事在过去几个月志愿完成的一个小项目——“智能垃圾分类”。大家知道,正确分类是垃圾可回收处理的关键步骤。今年7月1号上海出台了垃圾分类政策。垃圾分类对回收垃圾减少碳排放是件大好事,但是对居民而言面对上千类垃圾如何正确分类不是件容易的事。于是蚂蚁AI几个算法同学和支付宝产品与运营同学一起组成了自愿攻坚小分队,基于我们已经有的图像、搜索、智能助理和知识图谱平台,快速开发AI垃圾分类,在两周后,就是7月15号,发布了AI垃圾分类小程序 。对于图像、语音、文本的准确率均达到了90%以上,能够覆盖2万多种物品的识别与分类。上线一周后就达到了400万DAU,3000万的模型调用量。除了软件的小程序之外,我们还和生态合作伙伴研发出了“智能垃圾回收箱”的IoT硬件。
9月27号,我们的同学在纽约参加了第74届联合国大会,现场宣讲蚂蚁金服智能垃圾分类解决方案,用AI技术践行联合国可持续发展目标(Sustainable Development Goals)。下一步,我们会和阿里云以及生态合作伙伴加强合作,将智能垃圾分类的技术开放出来,赋能整个垃圾处理产业,期待在2025年能帮助将中国的垃圾处理环节的碳排放降低20%,这是我们的一个长期目标。
我们希望技术不仅仅有深度,也是有温度的,希望能够用人工智能来推进普惠可持续的金融服务。