对百度文库文件上传防重复的一点思考

    前几天从百度上下了一些资料,不知道什么时候金币就用完了,就想着上传一点东西赚几个金币吧。恰好我刚刚开始学习linux,有一份liunux安装的教程的一篇文档,名字好像是‘linux安装教程’,然后我就登陆百度账号准备上传这篇文档,等上传的滚动条到头了却提示说与XX的文档'linux安装教程'重复,我这个郁闷啊,就在本地吧‘linux安装教程’改为了‘linux安装指南’又上传了一遍,结果还是说重复,恼了改成‘linux不能说的秘密’结果还是一样。我想了一下,首先文档的名字重复是不行的,说明上传完成后百度会在文库里原有的文档里检索是否有重名的,改了名以后还不行,只能说明百度对文档的具体内容也进行了检索,但是有一个问题,每篇文档的大小不同,百度考虑到效率的问题,不可能在检索的时候把文档从头到尾都去检索一遍,我尝试着把文档(这篇是doc的)的第一页改成了其他内容
从第二页开始是正文,就上传上去了。看来百度只看了文档的第一页啊。后来我又想到,文档的名字应该是可以重复的,只要内容不同就可以,这个我没尝试,有兴趣的朋友可以尝试一下