安装Anaconda
安装NLTK
地址 : https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&O=D
地址:https://repo.continuum.io/archive/
文件:https://repo.continuum.io/archive/Anaconda3-4.2.0-Windows-x86_64.exe
打开Windows的cmd,在cmd中输入jupyter notebook --generate-config
可以看到路径为C:\Users……找到此路径修改jupyter_notebook_config.py文件
打开此文件找到
#c.NotebookApp.notebook_dir = ‘’
将其改为
c.NotebookApp.notebook_dir = ‘C:/Users/Administrator/workspace/Jupyter’
其中C:/Users/Administrator/workspace/Jupyter为我的工作空间,你可以改成你自己的,
注意:
1.#c.NotebookApp.notebook_dir = ''中的#必须删除,且前面不能留空格。
2.Jupyter文件夹必须提前新建,如果没有新建,Jupyter Notebook会找不到这个文件,会产生闪退现象。
3.但是当我们通过快捷方式再次打开后,发现还是没有变化,因为还需要在快捷方式的目录里面的
%USERPROFILE%
删除
import nltk
nltk.download()
选择需要下载的内容,修改数据存储路径(c:\nltk_data)
官网的镜像在境外,所以直接update可能会比较慢或者不能访问。
用中科大的镜像
conda config –add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes
加个小tip:要删除 .condarc文件 。
.condarc以点开头,一般表示 conda 应用程序的配置文件,在用户的根目录
(windows:C:\users\username\,linux:/home/username/)。但对于.condarc配置文件,是一种可选的(optional)运行期配置文件,其默认情况下是不存在的。
当用户第一次运行 conda config命令时,将会在用户的家目录创建该文件。
让python pip使用国内镜像
国内源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
豆瓣:http://pypi.douban.com/simple/
note:新版ubuntu要求使用https源,要注意。
临时使用:
可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple
例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。
永久修改,一劳永逸:
Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)
内容如下:
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
windows下,直接在user目录中创建一个pip目录,再新建文件pip.ini。(例如:C:\Users\WQP\pip\pip.ini)内容同上。
也就是说,今天开始必须恢复官方源了
使用以下语句可以恢复到默认源。
conda config --remove-key channels
如果还是嫌慢,那么命令行科学上网方式可以使你加快速度。
使用conda 创建虚拟环境报错,
conda config --add channels http://mirrors.aliyun.com/pypi/simple/
conda config --set show_channel_urls yes
删除了 defaul
问题解决
conda update --all
conda install tensorflow-gpu
conda install keras-gpu
恢复清华源
channels:
致谢
《Python自然语言处理》1 2 3,作者:【印】雅兰·萨纳卡(Jalaj Thanaki),是实践性很强的一部新作。为进一步深入理解书中内容,对部分内容进行了延伸学习、练习,在此分享,期待对大家有所帮助,欢迎加我微信(验证:NLP),一起学习讨论,不足之处,欢迎指正。
参考文献
https://github.com/jalajthanaki ↩︎
《Python自然语言处理》,(印)雅兰·萨纳卡(Jalaj Thanaki) 著 张金超 、 刘舒曼 等 译 ,机械工业出版社,2018 ↩︎
Jalaj Thanaki ,Python Natural Language Processing ,2017 ↩︎