“网络暴力”与人工智能自然语言处理的碰撞（上）

引

回看2014年6月，当时随着人民日报一篇题为《激励见义勇为不能靠“键盘侠”》的时评发出后，各路媒体纷纷转载，“键盘侠”这个词在网络上迅速火爆起来。其中，以“键盘侠”为主人公的漫画尤为受人关注，漫画里主人公前后的行为反差，以及在表达效果上对键盘侠这种不良网络风气所进行的辛辣讽刺，着实搅动着观众们的眼球。

键盘侠的世界你真的懂吗

让我们简单回顾一下故事内容：一个带着耳机外表很斯文的小伙在街上看到有老人摔倒默默地骑车走了，注意到公交上有扒手也装作没看见，看见路边有小朋友受欺负也没有上去帮忙。然而回到家后看到网上刚刚发生的新闻，小伙脱去斯文的外衣，露出“KEYBOARD MAN” 字样的衣服，在电脑前恶评。

键盘侠们，平日光鲜亮丽待人友好，可在虚拟的世界中网络，他们对着狭小的显示屏露出了邪恶的一面。键盘侠们动动手指敲击几个字母就可能引起一场“命案”，可想而知键盘侠们的力量是多么强大。他们不甘在云淡风轻的生活中低调，愿在虚拟的网络世界中做一界妙语连珠、舞刀弄枪的“侠客”。

键盘侠们的这种行为不同于现实生活中拳脚相加血肉相搏的暴力行为，而是借助虚拟的网络空间用语言文字对他人进行伤害和诬蔑。众人拾柴火焰高，在虚拟网络中，键盘侠们将文字、图片运用的淋漓尽致，在自己看来这种行为对自己并没有什么影响，但对受攻击的受害者来说却是一种危害严重、影响恶劣的暴力形式，这种暴力形式就是我们常说的网络暴力。

在泛泛而谈的虚拟世界中为什么会出现网络暴力？网络暴力给我们带来了什么影响又给这社会造成了什么影响？言论自由是延续网络暴力的罪魁祸首吗？我们是否又可以通过一些技术手段更深层次去分析、甚至去抑制网络暴力？而人工智能技术又在其中扮演一个什么角色呢？以及如果没有网络暴力世界会变得更好吗？

这也就是我们今天所想探讨的问题：网络暴力以及和其相关的人工智能技术。

浅谈网络暴力一二

首先我们来说说网络暴力的形式，随着互联网时代的快速发展，即将迎来快速的5G时代，无论是上班族、学生、工人、老人，人手一台智能手机。就我们最常见的网络暴力的出现在微博、视频、新闻资讯、论坛上，而微博作为一个能与明星接触的媒体平台，加上一些其他有影响力的博主，使得整个资讯圈互动性非常强。由于这些平台都有一个通病就是实时新闻强，内容丰富，刷新频次快，这个通病不免也带来了一些缺陷。

匿名性、门槛低和传播快是网络暴力的一大缺陷，喜与不断地接受新事物的网友们，抓住了这个缺陷。由于注册不受年龄限制，网名随意起，无上限的网速，便开始网友们通过留言、点赞、转发等无底线的畅所欲言。

网络暴力在键盘之下没人可以幸免，明星晒自拍、晒娃遭到无辜的被怼；知名公众人物在自然灾害发生后捐款达不到民众心理价位遭受网民们的议论被逼捐；体育运动员输了比赛会被说不敬业；一个没有让座位的视频，网友们并不知道事情真相却把当事人骂得狗血淋头。

下面来看看近期发生且热度较高的事件。

杜嘉班纳辱华事件（D&G）

上个月在微博上热议的杜嘉班纳（D&G）辱华事件，因杜嘉班纳拍摄了一个把中国传统文化与意大利饮食相结合的《起筷吃饭》广告片，视频传出后被某社交网站上某亚裔模特怒怼，并通过私信质疑视频涉嫌性别歧视、对中国传统文化的歧视嫌疑。

随后有网友爆出杜嘉班纳设计师在ins上的辱华言论，辱华言论截图迅速在微博上引起热议。随后杜嘉班纳联合创始人S.G在社交媒体及微博平台发表道歉声明，并声称是账号被盗行为。当晚21日正是杜嘉班纳的上海时装秀，消息传出后，众多要出席当晚活动的明星都拒绝出席此次活动。

作为大品牌公众人，物杜嘉班纳的辱华行为因接受谴责，但事后杜嘉班纳负责人也通过视频致歉，视频中说因为家庭教育和社会因素导致对文化艺术理解上存在偏差，希望得到大家原谅。

然而视频里女模特的公司同样也发表了道歉声明，有不少网友对道歉恶评。

说到文化差异，有时误解往往是因为我们看待事物的角度不同，对于这件事言辞过激的网友们，我觉得我们对待任何事情都应该保持冷静，当我们说出那样的话的时候，我们是不是应该站在道德的最高点审视自己的所作所为，说出那样激进的话是不是也有损我们的道德形象。

重庆大巴坠江事件

还记得上个月的重庆大巴坠江事件吗，公交碰到小轿车坠入江中，一时间热度在微博热搜榜上停留了好几天。在证据为核实前由于主流媒体的报道带偏了舆论的真相，导致网友们盲从评论，小轿车女司机成为众矢之的。

轿车女司机被贴上“女司机真可怕”、“轿车女司机逆行”等标签，有不少网友跟风留言发帖辱骂女司机，就连女司机以前和朋友开的店铺也被无端砸毁至歇业。然而剧情反转，经进一步调查找到了公交车上的行车记录仪内存卡，显示是因乘客坐过站打司机，司机方向盘失控导致公交坠江。

我们在没有了解事情真相的时候，我们不应该带着有色的眼镜去看待问题，更不应该用歧视的视角看待女性，往往一出什么事故的时候最先想到的是女性。然而当真相公布的时候，有个别媒体出来向女司机道歉，但还是有不少曾诬蔑女司机的网友们180度反转去谴责公交车视频的真相。

对于上述两个事件，无论是因文化差异引起的喷愤，还是在未了解事情真相的时候对无辜者的责任指定，还是明星们、公众人物发的生活动态或出席某个活动，无非对错都能遭到愤青们的肆意评论。喷子们不仅用文字或图片的方式进行人身攻击，还通过人肉搜索直接从网络参透到现实社会，对受害者直面攻击。

网络暴力就像一滩浑水，若深陷其中将越陷越深，受害者因网络暴力受到的道德的谴责和非等量惩罚，你们是否有考虑过受害者的感受，是否会有那么些许的怜悯？

网络暴力的背后

在快节奏的生活中，琐碎的生活难免会遇到一些不顺心的事情。在公司面对领导的不公对待、同事间的窃窃私语；公交车、地铁上不小心的碰撞；一些看不惯事情或是突如其来的霉运。在现实社会人与人之间的交往中，我们受到很多制约的因素而无法将这些压抑的情绪正常的宣泄和释放。

近年来随着互联网的多变形式，暴力形式也变得多种多样，从最开始的直接人身伤害逐渐演变成了网络实施暴力。伴随着互联网虚拟化、匿名性、零成本、零代价的特点，使得网民可以更自由地表达自己的意见和观点。

由于网络暴力往往处于灰色地带，大部分暴力行为都尚未构成诽谤和侮辱，因此很难对网络暴力实施者处以刑罚或者行政处罚。网民的言论只要不超越法律底线，有权自由发表言论。

爱钻空子的网友们抓住了网络的漏洞，俗话说的好：“耍猴儿不怕人多，看热闹不嫌事大”。既然在现实社会中因诸多因素制约不能宣泄，又何尝不在虚伪的网络世界中为所欲为呢？

说到网络暴力带来的危害，12年由陈凯歌导演的电影《搜索》，女主角在得知自己癌症晚期后坐公交车回公司，因得知病情心情十分低落没有及时给老人让座在公交上与老人发生了争执。这场争执不料被实习记者拍摄并发到网上，随之而来的是对女主角的一系列人肉搜索和谩骂，最后导致女主角无奈跳楼。

不仅仅是电影，我们现实生活中有很多这样的例子，有的时候在我们没有了解事实真相的时候对无辜者无端的谩骂和指责，这能带给我什么好处呢？语言是有形的，最后造成的悲惨就是靠言语一点一点堆积的。

通过这些事件，那么对于网络上泛滥成灾的言论我们又该应对、至少更深入的了解其背后的成因呢？通过当下的科学技术，我们是否能通过大数据分析去总结一下互联网暴力事件中网民们的核心观点或思想呢？我们又是否能从中找出一些规律和特征，帮助我们更好地理解网民行为，从而有效地应对、遏制这种现象呢？再者，对于提高整体网民的素质和青少年（构成了大部分网民）的道德水平，是否又能起到什么帮助呢？

为了更好地解决这些问题、或是寻找到未来的方向，我们将视线对准了当下最新的技术——人工智能，我们尝试将人工智能自然语言处理技术应用于网络暴力的分析上，看看是否能为未来解决互联网暴力的相关工作抛砖引玉。

AI技术于网络暴力分析

随着16年围棋机器人Alpha Go战胜围棋世界冠军，人工智能再一次进入了公众视野。同时，无人驾驶、语音对话、人脸识别等人工智能技术亦不断完成了数项突破。不可否认，近些年来人工智能发展迅速，和其相关的产品、服务已经不知不觉进入到我们生活中的方方面面。

人们普遍对人工智能的理解在智能家居、机械工具、图像识别、软件操作上，对自然语言处理（NLP）技术了解的人并不多。通常来说，电脑易于处理可以统计和计数的结构化数据，而对于文本、图像等难以处理非结构化数据就要用更复杂的方式进行处理。故尝试着让电脑理解人类的语言、并用自然语言和我们进行通讯，这就是自然语言处理技术想要最终解决的问题。

回过头来我们再来思考，自然语言处理对于我们更深入地分析网络暴力现象有哪些帮助呢？这里让我们先抛砖引玉，从语忆自然语言处理引擎说起。

首先，对于评论、弹幕这样成千上万的非结构化语言数据，在自然语言处理技术的帮助有：

情绪解析引擎

情绪极值：以50分为分界，对整体正负面情感特征打分；十二种细节情绪：根据Plutchik情感轮理论体系，识别语义中12种不同细节情绪；情绪值/浓度：计算出语句的情绪浓度，即反映了特定情感的激烈程度；情感关键词：从文本中智能识别并提炼对文本整体情绪影响最大的关键信息。

基于情绪解析引擎，我们可以针对某条微博内容所表达的情绪极值以及十二种细节情绪进行全量分析，从而详细了解千万条评论内容中网民们的整体情绪分布；其次还可根据时间段来看随着时间的推移网友们对这件事的态度的变化，即是否还是那么厌恶/喜欢；再者，结合第三方数据——如用户地域、性别等信息，我们还可以对不同人群的肖像进行更精细地刻画。

文本观点提取

基于知识图谱以及字词间的相似度计算，高度精炼、概括每段话的核心表达观点。

例如一句“喜欢这个妆容，但是口红颜色太深了”，观点1：妆好；观点2：口红深。对海量评论进行观点提取，可以精准、高效地总结不同网民对于同一件事件所表达出的不同观点，并可以对其进行归类和比较，帮助分析人员在第一时间获取用户的关注热点信息或是用户最反感的主要问题等关键信息。

文本相似度判断

一对一、一对多或是多对一的文本匹配，从理解不同字词所表达的含义入手，结合知识图谱，判断两段文本核心观点的一致程度。

对同一事件或两个不同事件的评论进行相似度对比，不仅可以根据结果看看用户在用词或表达上有什么共同点；，不同事件间的评论对比，是不是还能帮助我们发现“恶性”事件及其评论内容之间的潜在关系，甚至能洞察出某件事/某个人近期的活动形象会不会影响对其舆论的积极/消极性？

词法分析

句式分析：对文本内容中字词的解读，依照文本核心观点表达，将字词拆分成有语法含义的序列；词法分析：基于知识图谱以及字词间的关系分析，可以展示出每个字词的词性和语法结构。

针对网民们成千上万条评论，我们可以通过词法分析引擎来观察积极评论或消极评论分别常用的用词习惯、句式、词法。从中，我们可以总结出当下网民普遍所使用的的话术/用词习惯，以及不同人群在表达自己观点时所特有的语言特点。而这，是否又能从某一个角度去帮助我们窥探如今这个互联网时代中，大众所受到的一些重要文化驱动……

我们相信，基于技术手段对互联网暴力——新形态的“大众情绪真实发泄”——进行分析，不仅能帮我们更好地了解暴力事件产生成因，亦能将互联网这一平台/媒体在信息传播、文化传承上所扮演的社会角色更清晰地展现在我们面前。

在《“网络暴力”与人工智能自然语言处理的碰撞（下）》中，我们将具体结合NLP技术对我们挑选出来的网络暴力事件进行分析，尽情期待。

—— 专注于大数据与人工智能 yuyidata.com

“网络暴力”与人工智能自然语言处理的碰撞（上）

引

键盘侠的世界你真的懂吗

杜嘉班纳辱华事件（D&G）

重庆大巴坠江事件

你可能感兴趣的:(“网络暴力”与人工智能自然语言处理的碰撞（上）)