《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置

安装Anaconda
安装NLTK

安装Anaconda

下载Anaconda 中 支持python 3.5(WIN 7)版本(本人桌面系统环境)

  • 地址 : https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&O=D

  • 地址:https://repo.continuum.io/archive/

  • 文件:https://repo.continuum.io/archive/Anaconda3-4.2.0-Windows-x86_64.exe

修改Anaconda中的Jupyter Notebook默认工作路径

打开Windows的cmd,在cmd中输入jupyter notebook --generate-config
可以看到路径为C:\Users……找到此路径修改jupyter_notebook_config.py文件
打开此文件找到
#c.NotebookApp.notebook_dir = ‘’
将其改为
c.NotebookApp.notebook_dir = ‘C:/Users/Administrator/workspace/Jupyter’
其中C:/Users/Administrator/workspace/Jupyter为我的工作空间,你可以改成你自己的,
注意:
1.#c.NotebookApp.notebook_dir = ''中的#必须删除,且前面不能留空格。
2.Jupyter文件夹必须提前新建,如果没有新建,Jupyter Notebook会找不到这个文件,会产生闪退现象。
3.但是当我们通过快捷方式再次打开后,发现还是没有变化,因为还需要在快捷方式的目录里面的
%USERPROFILE%删除

安装ANLTK

打开Anaconda Prompt,输入conda install nltk 安装ANLTK

输入python启动python-shell环境

《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置_第1张图片

import nltk
nltk.download()

《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置_第2张图片
选择需要下载的内容,修改数据存储路径(c:\nltk_data)

建议:

官网的镜像在境外,所以直接update可能会比较慢或者不能访问。
用中科大的镜像
conda config –add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config –set show_channel_urls yes

加个小tip:要删除 .condarc文件 。
.condarc以点开头,一般表示 conda 应用程序的配置文件,在用户的根目录
(windows:C:\users\username\,linux:/home/username/)。但对于.condarc配置文件,是一种可选的(optional)运行期配置文件,其默认情况下是不存在的。
当用户第一次运行 conda config命令时,将会在用户的家目录创建该文件。

让python pip使用国内镜像
国内源:
清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/

豆瓣:http://pypi.douban.com/simple/

note:新版ubuntu要求使用https源,要注意。

临时使用:
可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple
例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。

永久修改,一劳永逸:
Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)

内容如下:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
windows下,直接在user目录中创建一个pip目录,再新建文件pip.ini。(例如:C:\Users\WQP\pip\pip.ini)内容同上。

也就是说,今天开始必须恢复官方源了

使用以下语句可以恢复到默认源。

conda config --remove-key channels
如果还是嫌慢,那么命令行科学上网方式可以使你加快速度。

使用conda 创建虚拟环境报错,

conda config --add channels http://mirrors.aliyun.com/pypi/simple/
conda config --set show_channel_urls yes

删除了 defaul
问题解决

conda update --all

conda install tensorflow-gpu
conda install keras-gpu

恢复清华源
channels:

  • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    show_channel_urls: true
    ssl_verify: true

致谢
《Python自然语言处理》1 2 3,作者:【印】雅兰·萨纳卡(Jalaj Thanaki),是实践性很强的一部新作。为进一步深入理解书中内容,对部分内容进行了延伸学习、练习,在此分享,期待对大家有所帮助,欢迎加我微信(验证:NLP),一起学习讨论,不足之处,欢迎指正。
在这里插入图片描述

参考文献


  1. https://github.com/jalajthanaki ↩︎

  2. 《Python自然语言处理》,(印)雅兰·萨纳卡(Jalaj Thanaki) 著 张金超 、 刘舒曼 等 译 ,机械工业出版社,2018 ↩︎

  3. Jalaj Thanaki ,Python Natural Language Processing ,2017 ↩︎

你可能感兴趣的:(2017年度)