实验题目:n Python 词云制作实验报告
实验目的与要求:
础 掌握基础 Python 安装过程和词云制作。
实验步骤:
n Python 安装
1.击 双击 Anaconda2-4.0.0-Windows-x86_64 ,打开 Python 安装程序。
图
1 1 —1 1
2. 单击“Next ”(下一步),
图
1 1 —2 2
3. 单击“I Agree ”(我同意)。
图
1 1 —3 3
4. 单击“All Users (requires admin privileges)
)
”(所有用户),单击“ Next ”。
图
1 1 —4 4
5.在 在箭头所示栏中设置安装目录(推荐在 C 盘安装)。
图
1 1 —5 5
6 6. . 单击“Next ”,等待安装完成。
7.的 找到刚刚安装好的 anaconda, 打开“Scripts ”文件夹。单击箭头所示目录栏,右键复制路径。
图
1 1 —6 6
8. 在桌面右键单击“我的电脑”,选择属性。
图
1 1 —7 7
9. 打开新窗口。点击箭头所示“更改设置”。
图
1 1 —8 8
10. 打开新窗口。单击“高级”选项卡,再单击“环境变量”按钮。
图
1 1 —9 9
11. 打开新窗口。下拉下方小窗口侧边滚动条,找到箭头所示区域。双击蓝色条。
图
1 1 — 10
12. 打开新窗口。在下方变量值中粘贴刚刚复制到的路径信息。此处需要注意与前一个要用英文分号隔开。
图
1 1 — 11
13. 单击多个确定。关闭所有窗口。
14. 使用键盘组合键“WIN+R ”,打开运行窗口,在打开后方的文本框中输入“ “cmd ”。单击确定。
图
1 1 — 12
15. 打开新窗口。在后方输入代码“jupyter
notebook ”。单击键盘“Enter ”。
图
1 1 — 13
16. 此时弹出网页。即表示安装完成。(窗口可以关闭)
图
1 1 — 14
词云制作准备工作
1. 使用键盘组合键“WIN +R ”, 打开运行窗口,在打开后方的文本框中输入“ “cmd ”。单击确定。
图
1 1 — 15
2. 打开新窗口。输入“mkdir demo” ”, , 点击“Enter ”。创建文件夹“demo ”操作完成。再输入“cd demo ”,打开“demo ”文件夹。(由于我已经创建,所以会出现如图所示文字)
图
1 1 — 16
3. 将“实验源数据”文件夹中的“demo ”目录下的文件复制到刚刚新建的文件夹内。目录路径为刚刚命令提示符中所设置的路径。
图
1 1 — 17
4. 在命令提示符窗口中输入“pip install wordcloud ”。敲击键盘“Enter ”键。
图
1 1 — 18
5. 再次输入代码“pip install wordcloud-1.3.2-cp27-cp27m-win_amd64 ”。敲击键盘“Enter ”键(代码可以右键复制粘贴)。词云生成插件安装完成。
图
1 1 — 19
6 6. .码 再次输入代码“ “pip install jieba ”。
( 该过程需要联网)
)
结巴分词插件安装完成。
图
1 1 — 20
7. 将要进行词云制作的文章(编码模式必须为 UTF- -8 8 )放入“ demo。
”文件夹中。
英文词云制作
1. 使用键盘组合键“WIN +R ”, 打开运行窗口,在打开后方的文本框中输入“ “cmd ”。单击确定。
图
1 1 — 21
2.
打开新窗口。在后方输入代码“jupyter
notebook ”。单击键盘“Enter ”。进入网页。
图
1 1 — 22
3. 单击右上方“New ”按钮,下拉菜单,选择“Python 2 ”。
图
1 1 — 23
4. 弹出新窗口。
图
1 1 — 24
5.。
在第一个文本框中输入代码(注意空格以及必须在全英文状态下输入代码)。
filename = "GT.txt" with open(filename) as f: mytext = f.read() 如图所示
图
1 1 — 25
6. 按下键盘组合键“ Shift+Enter ”, , 试运行代码,无错误将会自动另起一行。以后每完成一段代码的编辑,都要进行该项操作。如图所示。
图
1 1 — 26
7. 在新生成的文本框中输入代码“print(mytext) ”并且运行,结果如图所示。
图
1 1 — 27
8. 在新生成的文本框中输入代码
from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext) 并运行。结果如图所示。
图
1 1 — 28
9. 在新生成的文本框中输入代码
%pylab inline import matplotlib.pyplot as plt plt.imshow(wordcloud, interpolation="bilinear") plt.axis("off") 并运行。结果如图所示。词云图可以右键单击另存到目标路径中。
图
1 1 — 29
10. 英文文章词云图制作完成。
图
1 1 — 30
中文词云制作
1. 使用键盘组合键“WIN +R ”, 打开运行窗口,在打开后方的文本框中输入“ “cmd ”。单击确定。
图
1 1 — 31
2.
打开新窗口。在后方输入代码“jupyter
notebook ”。单击键盘“Enter ”。进入网页。
图
1 1 — 32
3. 单击右上方“New ”按钮,下拉菜单,选择“Python 2 ”。
图
1 1 — 33
4. 弹出新窗口。
图
1 1 — 34
5. 在第一个文本框中输入代码,
filename = "sjdbg.txt" with open(filename) as f:
mytext= f.read() 并运行,如图所示。
图
1 1 — 35
6. 在新生成的文本框中输入代码
print(mytext) 并运行。如图所示。
图
1 1 — 36
7. 在新生成的文本框中输入代码
import jieba mytext = " ".join(jieba.cut(mytext)) 并运行。如图所示。
图
1 1 — 37
8. 在新生成的文本框中输入代码
print(mytext) 并运行。如图所示。
图
1 1 — 38
9. 在新生成的文本框中输入代码
from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytest) 并运行。如图所示。
图
1 1 — 39
10. 在新生成的文本框中输入代码
%pylab inline import matplotlib.pyplot as plt plt.imshow(wordcloud, interpolation="bilinear") plt.axis("off") 并运行。如图所示。
图
1 1 — 40
11.
在新生成的文本框中输入代码
from wordcloud import WordCloud wordcloud = WordCloud(font_path="simsun.ttf").generate(mytext) plt.imshow(wordcloud, interpolation="bilinear") plt.axis("off") 并运行。如图所示。
图
1 1 — 41
实验总结:
安装过程中,因为系统的不同,安装步骤会些许的差别。本实验提供的安为 装过程为 win8 系统 4 64 位的安装方法。
如果需要分析其他文章,可以将文章放到“demo ”文件夹中进行分析。
在输入代码的时候 , 需要在全英文的输入法中输入 , 最好使用系统的英文输入法 。
在制作中文词云图的过程中 , 可以调用不同的字体文件使词云图更加美观。
。