如何高效过滤游戏中的敏感词?

敏感词不仅出现在传奇游戏、SLG游戏的社区论坛、聊天等内部评论或上传信息区,还隐藏在头像、昵称、签名等需要全面识别的地方。

不同场合的屏蔽时效性各有不同,屏蔽方法分为同步过滤和异步召回,由于涉及到技术层面的知识,在这里不展开详细解释。但综合来说,技术屏蔽手段主要通过特征库、语义分析、机器学习等方法。

运营的同学则主要通过以下两种方式进行日常维护与审查: 

1. 用户举报:

主要是指用户在体验游戏的过程中遇到不良信息,于是进行投诉。

为了保证投诉的效果,我们需要在其便利性、曝光度和奖励机制上下功夫。同时,我们还需要建立科学的报告分类,这样不仅方便用户选择,而且大大有助于反垃圾训练的特点样本。

2. 内容聚合:

主要是通过判断内容的相似性,从而确定是否为垃圾信息。

举例而言,文本内容的相似性是基于编辑距离的文本计算。这种算法是根据一段文本如何通过添加、删除和移动转换为另一段文本的操作步骤来计算两段文本的相似性,计算时间和空间的复杂性非常高。对于游戏论坛中的评论,标题,聊天发言等短文本类型往往可以取得良好的效果。

但是这类方式的缺点是不适用于长文本,无法不考虑文本中心组的重要性。因此在游戏中的使用率更高一些。

游戏中的网络信息内容数量非常惊人,想要达到内容聚合的最优效果,单纯只依靠人力是几乎不可能的。游戏内的拉人广告和不良信息层出不穷,今天处理完一批,明天又将有新的一批出现。

因此,最直接有效的方式还是通过智能化的谛听安全机审结合人工复审去处理每日海量的网络信息,以此达到最优效果。通过净化一些违规敏感词,去提升游戏整体的环境,以及游戏玩家们的体验感。

你可能感兴趣的:(游戏,人工智能,网络安全)