python 词云示例

python词云示例

以2021年中央1号文件和政府工作报告文件为例,输出50个关键词。

# testPython.py

import jieba
import wordcloud

def outputWordCloud(text, outPngName):
	# 配置词云对象参数	
	temp = wordcloud.WordCloud(width = 1000, height = 1000, font_path = "msyh.ttc", max_words = 50)
	
	# 加载文本
	temp.generate(text)
	
	# 输出词云图片文件
	temp.to_file(outPngName)

def getTextData(textName):
	fd = open(textName, "r", encoding = "utf-8")
	
	textData = fd.read()
	
	fd.close()
	
	return textData
	
def main():
	tempList = [["2021年政府工作报告.txt", "2021年政府工作报告.png"], ["2021中央1号文件.txt", "2021中央1号文件.png"]]
	
	for item in tempList:		# 获取文本数据
		textData = getTextData(item[0])
	
		# 处理文本数据
		textDataList = jieba.lcut(textData)
		textDataListTemp = " ".join(textDataList)
	
		# 输出词云图片
		outputWordCloud(textDataListTemp, item[1])
	
main()

python 词云示例_第1张图片
python 词云示例_第2张图片

你可能感兴趣的:(python)