数学之路(机器学习实践指南)-文本挖掘与NLP(5)

#条件频率,每个词条在不同分类中出现的频率
print "------------------"
cfd=nltk.ConditionalFreqDist(samplewords)   
fdist=cfd[u'财经']
for word in fdist:
    print word
print "---------流动性出现次数-----------"
print cfd[u'财经'][u'流动性']
print "----------条件:分类----------"
for cnd in cfd.conditions():
    print cnd
print "---------------------------"
print cfd[u'财经'].max()
#条件频率分布表
print "----------条件频率分布表----------"
cfd.tabulate(title=u'条件频率分布表',conditions=[u'科技',u'财经'])
cfd.plot(title=u'条件频率分布图',conditions=[u'科技',u'财经'])


本博客所有内容是原创,如果转载请注明来源

http://blog.csdn.net/myhaspl/


数学之路(机器学习实践指南)-文本挖掘与NLP(5)_第1张图片

你可能感兴趣的:(数学之路(机器学习实践指南)-文本挖掘与NLP(5))