【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击

目录

1、简介

2、图机器学习应对金融欺诈对抗攻击

背景

 图机器学习识别金融欺诈 

 挑战 

挑战1-类别不平衡的解决 

挑战2-标签不可信的解决

挑战3-分布有漂移的解决 

图机器学习应对欺诈对抗攻击

从数据角度出发 

从攻击者角度出发 (倾向于添加异构边)

总结展望

问答 

3、参考


1、简介

报告主题

图机器学习应对金融欺诈对抗攻击

报告嘉宾

敖翔(中国科学院计算技术研究所)

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第1张图片

报告摘要

近年来,图机器学习方法由于其强大的关联特征提取能力,在数字金融反欺诈应用中取得了显著成效。然而,该场景中的动态对抗成为了制约图机器学习方法取得进一步提升的重要挑战之一。如何净化图结构中已存在的对抗攻击,如何增强图机器学习的鲁棒性提升分布外样本的泛化能力,成为近期研究热点。本报告将围绕图的同异质性偏好假设、对抗攻防、可解释性等技术,介绍图机器学习方法在应对动态对抗、增强分布外泛化能力和可解释性方面的研究进展,并探讨此方向值得关注的技术趋势。

报告人简介

敖翔,博士,中国科学院计算技术研究所副研究员,硕士生导师,CCF高级会员。研究方向为智能金融、数据挖掘与自然语言处理。先后主持国家自然科学基金项目3项,CCF-腾讯犀牛鸟科研基金(获优秀奖)、腾讯广告犀牛鸟专项基金、阿里巴巴AIR计划(获优秀学术合作项目)、蚂蚁金服金融安全专项基金等10余项科研项目,在IEEE TKDE、KDD、WWW、ICDE、SIGIR、ACL、AAAI、IJCAI等国际权威期刊和会议上发表论文60余篇,其中CCF A类30余篇。入选北京市科技新星、中科院青促会、微软亚洲研究院“铸星计划”。担任SIGKDD、WWW、ACL、AAAI、IJCAI等学术会议的高级程序委员或程序委员。

2、图机器学习应对金融欺诈对抗攻击

背景

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第2张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第3张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第4张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第5张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第6张图片

 图机器学习识别金融欺诈 

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第7张图片

 获取数据集

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第8张图片

 数据很多,标签也易获得(监督学习)

用户注册时+用户活动+用户关系收集【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第9张图片

 拿到数据后就可以训练模型,如下

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第10张图片

为啥使用图机器学习?

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第11张图片

 挑战 

 存在三个挑战

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第12张图片  

挑战1-类别不平衡的解决 

 类别不平衡:坏人还是少的

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第13张图片

 默认整个数据集都有label【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第14张图片

 重采样

先对正常和非正常的节点采样差不多的量;之后距离自适应采样

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第15张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第16张图片

少数类别做过采样+降采样;多数类别值做降采样 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第17张图片

 框架

其实就是在GNN聚合之前做了采样(集合的扰动)

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第18张图片

 实验结果

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第19张图片

baseline

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第20张图片 真实数据集上提升会多些【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第21张图片

 实验分析可以采纳

挑战2-标签不可信的解决

所谓的好人可能不是好人,有可能检测错误-误判(也就是白样本能不能用,用多少的问题)

可以采样小规模白样本套模型做(未做报告)

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第22张图片

挑战3-分布有漂移的解决 

时序图,在图变化过程中,图的分布发生了改变

引出下文做的欺诈对抗攻击

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第23张图片

图机器学习应对欺诈对抗攻击

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第24张图片

从数据角度出发 

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第25张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第26张图片

 识别攻击恢复图结构

从数据的角度解决,识别噪声则消除该噪声

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第27张图片

 以往方法【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第28张图片

对比学习

在采样上改进

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第29张图片

 核心关键

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第30张图片

图净化 

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第31张图片 实验

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第32张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第33张图片

从攻击者角度出发 (倾向于添加异构边)

攻击者提升了自身的异质偏好的概率

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第34张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第35张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第36张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第37张图片

大部分情况下是正常节点,少数异常节点 

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第38张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第39张图片

 降低偏差,提升异质节点偏好的性能

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第40张图片

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第41张图片

 在模型训练上改进(设置不同seed等)

直接置0(相当于做了mask)

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第42张图片

实验结果

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第43张图片

总结展望

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第44张图片 数据缺失

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第45张图片 落地上

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第46张图片

其中在可解释性上有初步研究成果

指定边关系传播(使用元图指导消息传递)

定义搜索空间,然后将NAS引入

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第47张图片 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第48张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第49张图片 发现特征传播就足够

 【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第50张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第51张图片

【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击_第52张图片

问答 

1、异质偏好含义:

一条路径上两端节点label是相反的

2、构造的图稀疏

是的,现实生活中的图也是稀疏的(大规模稀疏图暂时也没什么好的方法,依旧处于探索中)

3、参考

LOGS 第2022/09/04期 ||中科院计算所敖翔:图机器学习应对金融欺诈对抗攻击

LOGS第20220904期 中科院计算所敖翔:图机器学习应对金融欺诈对抗攻击_哔哩哔哩_bilibili

Ao, Xiang-ICT, CAS-Homepage

你可能感兴趣的:(图神经网络,机器学习,金融,数据挖掘,GNN)