「瓦力保镖」

知乎上线算法新功能「瓦力保镖」智能识别阴阳怪气内容

  1. 「瓦力」

介绍:「瓦力」是知乎打造「智能社区」的AI 算法系统,于 2016 年正式上线

功能:识别、处理包含辱骂、人身攻击的不友善评论,以及答非所问、低质提问等内容;全年无休、24小时在线

  1. 「瓦力保镖」

模型:情感模型、用户亲密度模型、文本识别模型

优点:
1) 大幅优化了AI 识别的准确率【(TP+TN)/(TP+TN+FP+FN)】
2) 主动对网友评论的「阴阳怪气」内容进行进行毫秒级智能识别和折叠处理

功能:识别并处理那些不友善、辱骂、阴阳怪气、答非所问、色情内容以及知乎不鼓励的用户爆照

痛点①

答非所问、评论区水化、回复者阴阳怪气、找到志同道合的人越来越难的情况蔓延开,使一大批优秀答主们生产内容的热情大减,甚至淡出社区

目标:

提升社区维护效率,全力维护认真、专业、友善的讨论氛围,保护每一位用户的分享和好奇心

解决方案的迭代:

1)早期:依靠用户举报和人工运营,逐条处理帖子里的情绪毒瘤

2)瓦力前期:

背景:

无论处理量,还是处理的时效性,都已经超出人工干预能承受的负荷(平均每天知乎上会产生10万条回答,它们会衍生出50万至60万条评论,这些内容中又有成千上万条会被用户标注为举报)。故2016年,知乎上线了机器人瓦力

方案:

负责瓦力的算法工程师,会根据不同场景,人工构建包含一些嘲讽特征的关键词汇包,输入算法作为一种衡量维度。当检测到不友善关键词,瓦力就会自动折叠答案

3)瓦力后期:

背景:

随着瓦力试图识别反讽评论,即所谓骂人不吐脏字的阴阳怪气,关键词法失效。讽刺对负面情绪的表达,隐蔽又多变。如果不看上下文语境,人类也未必听得出来。(比如上文说你数学考了100分,我说你太牛了,那就是赞扬。但如果上文是你数学考了20分,那这就是讽刺。另一个问题是,数学考20分是高是低?对于人类,生活常识会积累起感性的判断。但对于机器,这种价值判断却无从着手。当算法试图识别讽刺,摆在它面前的就是各式各样的场景,和各式各样的价值判断)

方案:

首先通过知乎社区里的举报、反对等负向用户行为收集训练数据。然后通过各种同义替换、规则模版方式对训练数据进行扩展,以缓解训练数据稀疏的问题。同时,“瓦力”提取文本、句法、表情符等特征,并利用一个带attention的CNN和LSTM的融合模型进行分类,最终判断出内容是否为阴阳怪气

image.gif

实现方式:

当评论发出后,「瓦力」作为先头部队,进行自动识别和清理,接下来,回答评论区中有「折叠」和「踩」两个功能,每个人都可以对不礼貌的评论点击「踩」。当被踩评论的分值达到一定阈值后,评论会被自动折叠。同时,回答者拥有「一键折叠/取消折叠」的权利,进一步加大了对回答评论区的可控力度。此外,用户也有点击举报和申诉的权利,而知乎管理员会定期人工处理折叠区中的辱骂评论和帐号


image.gif
image.gif

痛点②:

人们对辱骂等内容可以基本形成统一的判断标准,但却可能因文化背景、理解程度或是生活经历的不同,对「阴阳怪气」的理解度、接受度存在差异

目标:

分层清理诸如「阴阳怪气」、「发泄负面情绪」等严重影响知友讨论体验的评论

解决方案:

提供两种定制模式可供选择:一种热情、一种冷静

1)热情模式下的「瓦力保镖」较为「勤劳」,会积极地折叠掉任何它认为有阴阳怪气倾向的内容;

2)冷静的「瓦力保镖」则会相对「保守」,只会对非常有把握的内容进行折叠处理

痛点③:

跟“小而美”的果壳不同,知乎追求更大的用户量,即寻求更多广告变现的基础。故需用AI去提升运营效率

目标:

根据兴趣让用户分层、建立人与人之间的联系,建立一个智能社区。推送消息,作为舆论警察,消除城市中的负面情绪和暴力

解决方案:

机器用一套权重体系定义着你在各个领域的专业程度。不过用户的认识水平和知识结构可能随着时间变化、升级,因此知乎的算法也需要实时追踪用户的水平。每两个居民之间会基于兴趣偏好、个人在知乎的行为以及社交关系的向量,被计算出一个亲密值。亲密值的范围在负一到正一之间。知乎算法会计算两个陌生人之间产生连接的概率,然后通过推荐等手法让他们相遇。但当用户之间爆发过谩骂冲突,亲密值偏向于负一一极,算法就会尽量降低他们相遇的概率

你可能感兴趣的:(「瓦力保镖」)