Python学习--统计字符串中单词的数目

    Python在这些年异常的火爆,这也得益于其功能的庞大效率的高效以及第三方库的。最近也来追一下“潮流”哈。

统计单词出现的次数可以做搜索,也可做关联。Python实现起来也非常方便。(只支持英文)

具体代码如下:

from collections import Counter
import re

cnt=Counter();

f=open("mytest.txt");
for w in f :
    print(w);
    w = w.lower();
    # 正则表达式替换特殊字符
    #w = w.replace("\n","");
    w=re.sub("[!,\n,!]","" ,w);
    for word in w.split(" "):
        cnt[word] += 1;

print(cnt)

利用到了正则和集合两个类。

其中正则是为了去掉字符串中的标点符号。(也可以用replace实现或者translate

使用规则如下:

# translate把其转换成字符串
s = 'abc123xyz'
print(s.translate(str.maketrans('abcxyz', 'xyzabc')))
结果:xyz123abc

    官方文档:  collections

你可能感兴趣的:(Python)