浅谈网站敏感词过滤

阅读更多

【前言】

    使用多了iteye的博客用户会发现,iteye的敏感词过滤相对于其他博客网站更加严格。接下谈谈为什么使用敏感词过滤吧

 

【主体】

(1)理由:法律限制

        敏感词是针对博客内容设置的一种电脑程序自动过滤的词库,各个网站的过滤词库不尽相同。简单说,敏感词一般是指带有敏感政治倾向、暴力倾向、不健康色彩的词或不文明语,也有一些网站根据自身实际情况,设定一些适用于本网站的特殊敏感词,如广告性质的,比如“办证”,你的文章中如果含有“办证”二字,有可能就不能通过。政治方面的就不举例了,因为举例本身要涉及敏感词。

  有的敏感词只是一个人的名字,文章可以歌颂他,也可以诋毁他,可能是尊敬他,也可能是骂他,所以,敏感词会不分青红皂白,一律“和谐”。怎么解决呢?不少网站采取人工审核加以补充。比如,程序自动识别文章中含有某类敏感词,就自动转入“待审核”,提醒管理员人工处理。

  如果希望自己的文章顺利通过,最好不要谈敏感的内容。如果非用不可,可以在那个词的中间加一个空格。

 

(2)普遍性

         现在基本上所有的网站都需要设置敏感词过滤,这似乎已经成了一个网站的标配,如果你的网站没有,或者你没有做相应的处理,那么小心相关部门请你喝茶哦。

 

(3)新广告法

        新广告法的上线实行,限制了很多的违规词,敏感词的使用,极限用语的处罚由原来的退一赔三变更为罚款二十万元起!如何确定文章中是否存在有敏感词呢?Enweitech恩威科技博客经过多方努力,终于找到了新广告法违规词、敏感词在线检测工具赶快右键收藏吧。推荐文章:《新广告法医疗修饰词替换大全》

  在输入框中输入需要检测的内容,点击“立即检测”按钮即可检测其中是否含有敏感关键词。敏感词在线检测工具可快速在线检测新广告法中敏感词、违规词等,关键词库每日动态更新。

        

 

(4)敏感词这里就不发了,因为iteye规定,敏感词过多会直接封号~~~~

 

 

.

你可能感兴趣的:(后端积累,PHP)