Anti Plagiarism 反学术剽窃工具

首先反剽窃不是我提出的,我只是利用网络让更多的人能用到它,所以编写了这个小工具。

此工具原理是自动批量使用搜索引擎并取回结果(我应该已经违反了大部分搜索引擎的用户条款了,呵呵呵)。

当然这个工具还不能给出抄袭程度,那是在原始数据基础上分析出来的,非常复杂,不过它还是能够很轻松找出哪里是抄袭的和抄袭的来源。

 

这里给出了工具对两篇文章的分析结果做对比:

 

括号中的数字代表对应句子在搜索引擎中查询结果条数

左侧展示了,一篇剽窃的作品是如何原形毕露的

右侧是一篇未发表的原创文章,基本上在互联网上搜索是没有结果的

使用此工具判断文章的原创性,非常简单

 

未来要做的是:

使用复杂条件,例如屏蔽某URL结果,这个使用谷歌可以做到,可惜目前国内用谷歌不是很稳定

目前“长度短的句子 不分析”这个策略不是很理想,替换成“词少句子 不分析”,这个需要中文分词技术——一个讨论不完的话题。

你可能感兴趣的:(Anti Plagiarism 反学术剽窃工具)