Python在这些年异常的火爆,这也得益于其功能的庞大效率的高效以及第三方库的。最近也来追一下“潮流”哈。
统计单词出现的次数可以做搜索,也可做关联。Python实现起来也非常方便。(只支持英文)
具体代码如下:
from collections import Counter
import re
cnt=Counter();
f=open("mytest.txt");
for w in f :
print(w);
w = w.lower();
# 正则表达式替换特殊字符
#w = w.replace("\n","");
w=re.sub("[!,\n,!]","" ,w);
for word in w.split(" "):
cnt[word] += 1;
print(cnt)
利用到了正则和集合两个类。
其中正则是为了去掉字符串中的标点符号。(也可以用replace实现或者translate)
使用规则如下:
# translate把其转换成字符串
s = 'abc123xyz'
print(s.translate(str.maketrans('abcxyz', 'xyzabc')))
结果:xyz123abc
官方文档: collections