转载:基于大数据的互联网金融反洗钱模型初探

该文章的作者是:国家开发银行股份有限公司 石文娟
原文链接是:http://www.cfc365.com/technology/bigdata/2016-04-05/13752.shtml

当前,快速发展的互联网金融在便利交易支付、促进经济发展的同时,也为洗钱活动提供了不少便利。与传统金融活动相比,网络洗钱更为隐蔽、全球化程度更高、成本更低廉、追踪难度大。近年来,洗钱犯罪呈现由传统支付工具向信息化支付工具转移的趋势。互联网洗钱的方式主要有两类:一是利用在线支付业务洗钱;二是利用网络借贷平台洗钱。如何对互联网金融洗钱活动进行有效识别,已成为当前反洗钱工作亟待解决的问题。

一、互联网金融交易的主要特征

    互联网金融是指借助互联网技术、移动通信技术实现资金融通、支付和信息中介等业务的新兴金融模式,是互联网与金融相结合的崭新领域。互联网金融已呈现出移动支付代替传统支付业务,人人贷替代传统存贷款业务,众筹融资替代传统证券业务的发展趋势。由于参与人数不断增多,互联网金融风险逐步放大,洗钱犯罪活动愈发隐蔽,这对我国互联网金融领域反洗钱工作提出了挑战。

    互联网金融交易具有以下特征。

    1.属于非实名交易,客户身份识别难

    在传统金融支付交易过程中,银行等服务机构会要求客户提供真实身份证明,并提供直观的交易物证,这使得客户的信息追溯比较容易。在网络交易中,由个人在网站上自行办理账户注册,用户可以在任何地方进入在线金融账户并实现资金转移,用户的真实身份难以确定。

    2.交易的真实性难以确定,可疑交易发现难

    一是交易过程虚拟化程度高,客户通过互联网可以自主地汇划资金,无须注明用途,交易信息多以电子备份方式保存。二是不受时间、空间限制,存在资金额度小、多笔转入转出或者在多个账户间转账等操作,可以在短时间内实现快速、多笔资金转移,交易数据量巨大,交易行为复杂。

    3.洗钱渠道多,资金流向追踪监控难

    互联网实现资金转移,不仅减少了客户与金融机构的直接接触,而且不受距离的限制,在远距离甚至跨国资金转移的情况下,即使涉嫌洗钱行为被发现,网络交易也难以被追踪和控制。

    4.网络交易呈现复杂化趋势,完整信息掌握难

    支付流程的碎片化导致了交易信息和客户身份信息的分割,完成一笔交易,需要发卡机构、互联网支付机构、电信运营商、收单机构、持卡人、商户甚至外包服务机构共同参与。参与主体的碎片化致使同一客户的身份信息和交易信息被分散保存在不同的机构中。

二、互联网金融的数据及特点

    互联网金融数据最大的特征就是数据碎片化导致的信息分割。借助互联网金融平台完成一笔交易,从纵向来看,需要发卡机构、互联网支付机构、电信运营商、收单机构、持卡人、商户甚至外包服务机构共同参与,支付流程的碎片化导致了交易信息和客户身份信息的分割;从横向来看,发卡机构包括全国性商业银行、股份制商业银行、城商行、农商行、农信社、村镇银行等,持卡人和商户数量更是数不胜数,参与主体的碎片化使得同一客户的身份信息和交易信息被分散保存在不同机构中。

    支付、融资、各种金融行为都会“网上留痕”,这让网络平台保留了巨大的数据。从互联网金融数据的构成形式来看,主要有:用户数据、交易数据、用户操作行为数据等,下文重点分析前两类数据。

  (1)用户数据

    互联网金融业务的开展,离不开用户的参与。互联网金融的用户注册信息,包括用户身份证、电子邮件、电话号码、家庭住址、联系方式以及登录互联网的终端设备包括电脑的IP地址、GPS定位信息等。

  (2)交易数据

    互联网金融为用户交易提供了平台媒介及相关金融服务。网络记录用户通过互联网平台交易的时间、金额、购买的项目、盈利情况、赎回时间等。长期积累的交易数据不仅可以用来分析用户的交易偏好,也可以用来侦测用户的异常交易行为,为防止交易风险提供依据。

    根据互联网金融的数据特征,模型设计需要充分考虑客户身份的识别和碎片化数据的整合。

三、互联网金融的反洗钱模型设计

    1.设计思路

    互联网金融在运营中实时获得原生态保存的大数据,不仅保存交易的金额数据,还包括消费行为等多维度信息。客户身份识别就像蜘蛛网一样,各方面的信息积累越多,这些信息可根据客户属性、交易对手、资金进出等方面构成预警监控体系。借助现代科学技术,特别是大数据分析、人工智能的应用,设计出自定义融资交易监测指标的反洗钱模型,构建甄别系统,建立监控名单报警机制。

    2.设计原则

    (1)数据的全面性、时效性

    根据用户在互联网上的操作,获取完整的交易数据,包含用户访问互联网的终端、互联网交易网站、交易对手、交易流水、交易项目、账户金额等数据。由于互联网具有简单、快捷的操作特点,对于用户来说,有网络的地方就可以进行金融操作,操作频度高、实时性强,因此实时处理分析很重要,数据在时间上要有关联性,在内容上要有连贯性和可比性。

    (2)模型的客观性和科学性

    以定性分析与定量分析相结合,建立全面、客观、公正、科学的评价指标体系、评估标准、预警方法。设计过程中应尽量考虑采用可量化的指标,同时也要设置一定的定性指标,以进一步系统地反映定量指标所不能表征的金融风险。对于定性指标也要给出准确的判断标准,尽可能避免人为因素的误导,确保评价结果的科学性、合理性和准确性。

    (3)模型的应用性、可操作性

    选取的指标数据来源一定是能够直接或间接得到的,模型具有可操作性。在数据的收集、管理时,要有利于用户集中度的识别、判断、预测;在数据分析过程中,选取的指标、统计方法、相关判别准则要易于分析、有利于操作,不仅能快速地识别、判断、预测风险,还能进行预警,判别风险的源头。

    3.设计方法

    在建立以数据为中心的互联网金融反洗钱模型的过程中,必须以大数据技术为基础,建立海量关联交易数据库,包括数据的收集、整理、加工、储存、应用。数据处理模型设计思路如图1所示。

转载:基于大数据的互联网金融反洗钱模型初探_第1张图片

    (1)数据收集

    一是通过网络爬虫系统,突破地理距离的限制,捕捉和整合相关信息,并通过校验规则的设立及其关联性分析得到有效数据。二是考虑与互联网金融机构建立合作机制,直接通过数据接口获取相关数据。

    (2)数据整合

    数据整合是保障分析结果可靠性、准确性必不可少的环节。从金融风险的定义出发,确定反洗钱需求,对数据进行重新整合,提取与之对应的分析数据。具体而言,一是数据类型转换,使不同的数据信息来源可以被量化分析,比如将字符型变量转换成数值型变量等;二是数据变量的非线性转换,使得转换后的变量能更好地适合模型算法;三是挖掘不同主题数据的关联关系,建立关联数据仓库。

    (3)数据分析

    数据分析是互联网金融风险管理控制的实施手段。全面的数据分析应包括现行的指标体系、统计模型以及人工智能方法等。通过聚类分析,一方面从物理地址上识别关联用户,同一IP、移动终端(手机终端、iPad终端)、电脑终端、网站ID等用户入口识别关联账号;另一方面从交易末端账号对应的银行卡号往前追踪,从而识别关联客户。从正向的用户入口和逆向终端银行账户交叉验证识别同一用户或用户群,发现关联交易。用户身份识别模型设计思路如图2所示。

转载:基于大数据的互联网金融反洗钱模型初探_第2张图片

  (4)数据应用

    以数据分析层发现的关联交易群为基础,深化数据应用,具体功能包括风险识别、判断、预警、监控、自动上报。一是对网络资金账户设置交易限额。根据用户或用户群设定网络交易限额,对难以进行真实交易身份识别、难以判断真实交易是否存在的资金支付的要限制在一定规模以内,如果超过某一阈值则预警。二是建立客户风险等级识别制度。根据用户等级设置支付单笔限额、单日限额和跨境支付限额,将资金流与信息流加以匹配和管控,通过规模控制实现对风险的有效防控。三是建立和完善互联网金融参与方的反洗钱内部控制体系。督促金融机构完善其线上业务的内控制度,禁止通过其系统进行非法在线支付,关注可疑账户资金异动,及时提交相应的可疑交易报告。

    互联网金融的反洗钱工作应贯彻“风险为本、大众参与"的原则,反洗钱是一项综合性的工作,需要社会各界的广泛配合,除了银行类金融机构外,承担反洗钱义务的责任人还应包括互联网支付机构和互联网服务提供商。因此,所有的反洗钱责任主体都应承担起反洗钱的义务,互联网金融提供商应依靠自身强大的数据信息以及技术优势,积极探索基于大数据的互联网金融反洗钱模型的探索研究,采用科技手段加强网络交易监控识别,及时根据网络交易特征设置识别参数和标准,对大额交易和可疑交易进行自动、及时监测和记录,使数据甄别分析智能化,并与反洗钱行政主管部门实行联网,以利于及时监测和甄别洗钱线索,促进互联网金融健康发展。

你可能感兴趣的:(互联网资讯,实践,企业征信,征信业务,人工智能,个人思考,经验分享,大数据,互联网金融,反洗钱,模型,央行)