最近在研究WordCloud,对于Github上的一些例子,无法识别中文的txt文件,因此就此问题进行了资料的查阅,解决方法如下(仅个人方法,可能会有更方便的,可以自己取研究)
text = open(path.join(d, '3.txt'),'rb').read() #rb读取二进制数
text = text.decode("utf-8") #按照utf-8编码
二、对字体进行设置
首先可以先去网上下载一些中文字体库,这里给一个地址:
字体下载地址
接下来将其链接到程序中,代码如下:
wc = WordCloud(max_words=1000, mask=mask, stopwords=stopwords, margin=10,
random_state=1, font_path="simkai.ttf").generate(text)
就是指定font_path这个参数,给其赋值(字体所在路径)