基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯

近日,B站一位开发者UP主基于开源大模型“源1.0”,开发了一个能够无障碍进行微信聊天的人工智能“小源”,并在与骗子的真实对话场景中进行测试,破解“杀猪盘”诈骗套路,识破诈骗话术,进而加深公众对诈骗套路的认识,增强公众的反诈骗意识,减少网络诈骗受害者。

“杀猪盘”是当下一种交友婚恋类网络诈骗:诈骗分子利用网络交友,诱导受害人投资赌博的电信诈骗方式。

诈骗分子准备好人设、交友套路等,通过建立恋爱关系,最后骗取钱财,而他们的目标女性一旦被锁定,无论最终结果如何,都将“渡劫”。从此类诈骗手段的名称——“杀猪盘”就能看出,在这场圈套中,目标女性已不再被诈骗分子视为“人”,而是浑身洋溢着金钱味道、等待被用感情装饰的大刀挥下的“猪”,目的极其恶劣。

以“杀猪盘”为代表的情感诈骗,不仅给受害者带来巨大金钱损失,更带来严重感情伤害,甚至屡屡导致自杀事件发生。

诈骗团伙一般身处境外,伪造身份信息并通过各种社交平台寻找对象,若要根除这些团伙仍需时间,因此自身防范与识破套路的防御能力就变得尤为重要。

然而“以身试险”代价太大,在这个高科技发达的时代,能用魔法打败魔法吗?

情感诈骗毒瘤“杀猪盘”,用黑科技打败黑魔法

先看下这几张聊天截图:

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第1张图片

 

小源是一线城市独生女,房车双全,工作体面稳定,唯独爱情还未开花结果,但她在赛博世界遇上了一份缘。

而对面正是一位从事金融行业的北京男孩,不仅性格爽朗体贴,经济上更是独立,随便一个项目就能小赚几百万,对她还很热情。

但都说谈钱伤感情,小源也未能幸免,面对投入资金进行共同投资的要求,我拒绝了对方,他因此认为小源没有和他走下去的心意,后来甚至恶语相加。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第2张图片

很明显,小源成为了这次杀猪盘的目标,但也不要太为“她”捏把汗。

因为严格来讲,上述聊天截图真假参半,真的是:确实在与怀有别样目的性的男士在文字聊天,假的是:这位女生并非真实人类,而是人工智能。

这是一位开发者B站up主@图灵的猫 基于开源预训练中文模型“源1.0”,开发了一个能够无障碍进行微信聊天的人工智能“小源”,并在与骗子的真实对话场景中进行测试,试着观察AI如何与骗子斗智斗勇。

为了让骗子上钩,@图灵的猫 在多个社交平台注册了账号,然后根据反诈中心发布的受害者画像,为账号定位了单身、多金、高学历乖乖女等身份标签。果不其然私信爆炸。

AI通过大量学习,能更好地掌握对话规则,反套路诈骗犯,破解“杀猪盘”诈骗套路,识破诈骗话术,进而加深公众对诈骗套路的认识,增强公众的反诈骗意识,减少网络诈骗受害者。

目前@图灵的猫已将这一AI反诈项目已在Github上开源:

https://github.com/Turing-Project/AntiFraudChatBot

“杀猪盘”往往是有套路的,AI在对话中,又是如何见招拆招的呢?

当诈骗份子遇上AI:一场各怀心思的文字交锋

这是一场文字上的交锋,哪怕是AI上场,所谓的“见招拆招”需要有丰富的语料作为储备。

本次项目基于的NLP大模型浪潮“源1.0”是浪潮人工智能研究院研发成功的大规模中文语言模型,参数量高达2457亿,于2021年9月发布时即超越此前由美国OpenAI组织研发的1750亿参数量的英文语言模型GPT-3,成为全球最大规模的人工智能语言模型。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第3张图片

有了“源1.0”作为智能基础,开发者还在对话机制上进行了一些设计,让AI对话起来更加自然,比如:设定每条信息的回复间隔,模拟真实打字速度(total_len / 10 * 2s)。

万事具备,就开始交锋吧。另外,作为一名潜在受害者,小源也并非事先知道哪位找她来聊天的是诈骗犯,“她”将和我们一起在沟通中发现蛛丝马迹并进行防御,“她”发现蛛丝马迹的过程正是为公众识别诈骗做出的示范。

当然为了避免误伤,开发者设定了一些严格的筛选条件,例如人设背景完美但关键信息模糊、照片确认为网图、从事如私募、证券或投行等高端行业等,满足这些条件的人才会让小源接管对话。

之前就提到“杀猪盘”有一套严格的诈骗套路,规范的话术流程,诈骗犯把受害者叫做“猪”:

第一步,“找猪”,指私加好友。面对小源,诈骗犯也一上来就通过旁敲侧击来打听女生的现实情况,小源也会根据对方提供的信息做出反应,一些俏皮玩笑语句输出,让对话有来有回。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第4张图片

 

第二步,“喂猪”,指盗用他人优质资料包装自己,灌输自己很成功、很优秀等信息,获取受害者的信任。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第5张图片 

开始了开始了,他开始装了。没关系,根据他给的信息,小源也会给他舞台,还给对方起了“富哥”作为昵称,拉进彼此距离。

第三步,“养猪”,指恋爱过程,这也是往往受害者放下警惕,交出信任的过程,诈骗犯在这一步都表现得深情款款,试图让对话氛围蜜里调油,并且说一些套路骚话来确认“恋爱关系”。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第6张图片 

到了这一步,小源已经识别出他是诈骗犯了,那么为了反套路诈骗犯,小源装作上套,也表示喜欢诈骗犯。

“杀猪盘”其实就是一种规则化、模式化的对话博弈,诈骗犯本就毫无真心真情,只求在一来一回的对话中让受害者放低心理防御。在开发过程中,传统的无目标导向的“开放域对话”或“词槽式目的域对话”方案都表现不佳。

与GPT-3不同的是,“源1.0”更加擅长的是零样本(Zero-Shot)和小样本(Few-Shot)学习,而非目前更多模型所擅长的微调试学习(finetune)。在中文语言理解评测基准CLUE榜单的零样本学习(zero-shot)和小样本学习(few-shot)均取得过总榜第一的成绩。

从实际应用效果来看也确实如此,在1~ 3个,甚至只有1个合适example的示范下,模型就可以实现开发者希望达到的“对话策略”,比如反套路、用语料抛梗等等,让AI看起来能够对骗子具备识别能力,本质上这也是一种query->value的查询匹配。

而开发者在本次项目中,example语料主要抽取自B站和贴吧的热门评论,一来因为评论是天然的对话形式,有显式的回复与被回复关系;二来自古评论出人才,一些金句和梗可以把人机对话变得不那么生硬,就像“富哥V5”、“小黑子,露出鸡脚了吧”,以及“喵”、“捏”都是颇具网感的语句和语气助词。

具体语料经过人工筛选,过滤不当言论,再处理成prompt格式。 以下是Prompt Example的生成样例:

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第7张图片

第四步,“杀猪”,指欺诈过程。这是诈骗犯的终极目标,于他们而讲,能不能成就这一哆嗦了,而对受害者来说,这也是涉及财产有无损失的关键一步。

在这个项目里,诈骗犯在循序渐进、有意无意地总是提到一个利润率很高的项目,试图给对方留下高回报率的印象。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第8张图片

这是一个连环计,这时候就要考验到AI的记忆力了。由于微信聊天是多轮对话,AI有时并不记得自己或对方上一句说过什么。

“源1.0”具备记忆能力,开发者同时参考了LSTM的思想,为系统增加了记忆机制,具体机制如下:

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第9张图片

 聊天记录放入记忆区,在每次回复时计算相似度,超过相似度阈值的历史对话将被AI读取使用;并且设定遗忘窗口M,超过M/2轮次的对话将被pop() 这样,AI就能够实现简单的长短期对话记忆,比如昨天聊过的内容或上一轮对话内容。

带着这样的记忆,当过了两天当诈骗犯再试图和小源聊天时。小源也顺着对方问出了“在哪里可以买到”的话:

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第10张图片 

当然,聊归聊,开发者在进行开发时就给小源加上了“思想钢印”——凡是涉及投资理财、引导资金投入的都是诈骗。

哪怕是面对诈骗犯的威逼利诱,小源依然不为所动,坚持声称自己没有钱,并提出向诈骗犯借钱。

到了后来,AI直接金蝉脱壳来一波反杀,面对PUA话术和挑衅行为,直接点出对方违法要求和“她”去警局自首,反将一军。

基于浪潮“源1.0”的AI反诈项目:看高智商AI如何反杀诈骗犯_第11张图片

 

AI向善,感性与创新引导下的理性应用

据开发者@图灵的猫 介绍,对话中的这位Henry骗子哥,只是主动找上“小源”的其中一位聊天对象,还有13位“嫌疑诈骗分子”,这个数字还是在开发者已经进行了一波筛选之后。

小源完美的待嫁单身女生形象,吸引了无数人,私信爆炸。可以想象,同样条件的人类女生在社交网站上是多么危机四伏,随时都可能成为受害对象。

人类和AI的最大不同在于,多数时候人类的感性是占据上风的,做不到AI那样的绝对理性,所以才会不知不觉间落入圈套。

但正是这样感性的驱动下,AI在我们日常生产生活所发挥的空间才无穷,因为人工智能等先进技术的本质仍是工具,而工具所谓的善恶倾向则取决于人类的出发点。

就如同@图灵的猫 这样的开发者因为身边有遇到过杀猪盘的朋友们,进而义愤填膺基于“源1.0”大模型开发出AI反诈“工具人”小源,提醒广大女性提高警惕性,注意防范网络上的陌生人。

人类善用AI的智慧定会胜过日益强大的AI技术。

如今,人工智能已经从点到面渗透到更多行业、更多领域的各类场景,创新不断。作为通用的巨量中文AI模型,“源1.0”具备优秀的自然语言理解和自然语言生成的能力,可以作为新一代认知智能的引擎,适应广泛的下游AI任务,自开源问世以来,不少开发者和相关机构都基于此进行了诸多创新应用。

“源1.0”可以完成各种风格、类型文本的生成,如新闻资讯、金融行研、办公公文、法律文书、广告营销、网络文学、诗词歌赋、食谱菜谱等。

超1000家用户,采用“源1.0”提供的数据和API显著提升了金融、互联网、医疗和自动驾驶等行业应用的精度;

源1.0已经与多个行业用户开展深度合作,支持手机智能语音助手、大型互联网翻译平台等应用的AI智能化升级……

除了这些相对“常规”的操作,不少开源社区的开发者们通过源1.0的开放开源平台进行了创意实现。

在文娱方面,一群来自上海学生开发者创作的“AI剧本杀”就是其中代表,曾在GitHub引发热烈讨论。

Github链接:https://github.com/bigbrother666sh/shezhangbujianle

在心理辅导方面,自香港浸会大学社会工作系副教授 陈智达教授负责的运用AI模拟求助者支援社会服务工作者培训项目。

在上述案例中,AI在不同领域以意想不到的方式发挥着自己的潜力,也帮助着诉求不同的开发者们拓宽创新的边界。这些创新想法或许早就出现在他们富有想象力的脑海中,而将“灵光乍现”变成可实现、可落地的应用,很大程度上需归功于外部技术环境的变化,例如,如今以“源1.0”为代表的大模型已经成为人工智能算法基础设施,正在普惠千行百业。

事实上,创新往往并非无中生有的顿悟,而是某一领域发展到一定阶段、厚积薄发的涌现,技术是向善的工具,亦是创新萌发的沃土。

你可能感兴趣的:(源AI,人工智能)