正则表达式+词频统计+TF-IDF及其算法

https://github.com/Yixiaohan/show-me-the-code的一道题目。
第 0006 题: 你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词
参考的两个答案:
http://www.cnblogs.com/InitialD/p/7348877.html
http://blog.csdn.net/huangxiongbiao/article/details/45154445
http://blog.csdn.net/jacky_chenjp/article/details/52268272

在线正则表示测试:
http://rubular.com/
正则表达式讲解:
http://www.php.cn/regexp/regexp-tutorial.html
TF-IDF及其算法:
http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html

你可能感兴趣的:(基础)