[C#]文本相似度检测(1)

任务:

 

 完成一个反作弊的网络程序(或单机版的.exe),能够在多篇文本的作业中识别出最相似的若干对文本。

 

 

进度:

 

借助MD5,初步实现了两篇文档的相似度检验;

完成K均值聚类的实现;

 

 

目标:

MD5的速度很慢,所以在完成原型的实现后,要进一步更新算法;

实现聚类以及最后结果的输出;

实现软件的.exe以及网络版。

 

 

最近正在解决的是多线程的问题,想在文档录入以及转码过程中实现多线程

 

关于thread,参考了:

http://www.albahari.com/threading/

感觉很不错~

 

 

你可能感兴趣的:(thread,多线程,网络,C#,文档,作业)