python——三国演义 制作词云
题目:
设计一个程序,读出threekingdoms.txt文件中的三国演义全文,将常见人名进行去重后生成词云,并列出词频最高的5个词。
例:'玄德','刘备','玄德曰','刘皇叔','皇叔'都是同一个人。
可利用字典来保存需要去重的词。
dupDict={'曹操' : ['孟德','丞相'],
'玄德' : ['刘备','皇叔','刘皇叔','玄德曰'],
'云长' : ['关羽','关云长','关公'],
'孔明' : ['诸葛亮','诸葛','孔明曰'],
'张飞' : ['翼徳'],
'赵云' : ['子龙','赵子龙'],
'周瑜' : ['公瑾','都督']}
首先:
下载jieba,wordcloud ,imread
代码:
import jieba
from wordcloud import WordCloud
from imageio import imread
# 读文件
filename='threekingdoms.txt'
mytext=open(filename,encoding='