Python ML环境搭建与学习资料推荐

##python

  1. 下载anconda
  2. 更新pip源
    参考文章一: Python类库三两事 - 一次解决:http://blog.csdn.net/FontThrone/article/details/76560698
    参考文章二:Anaconda多环境多版本python配置指导http://blog.csdn.net/fontthrone/article/details/76560293

IDE

  1. 下载pycharm专业版
  2. Pycharm建议激活方法使用(license server),注册码亦可,但是现在能用的注册码不好找

配置环境

1.创建新环境,并激活conda create -n MLEnv python=3.6.2

2.激活环境activate MLenv

Python ML环境搭建与学习资料推荐_第1张图片

3.检查基础类库

# 建议的使用的命令,顺序如下
conda install pandas
conda install scipy
conda install matplotlib

直接使用pip 进行安装和更新scipy往往会安装失败,这是因为系统环境中缺乏其他基本组件造成的,conda安装(install)或者更新(upgrade)则会把需要的组件全都安装上,但是conda的版本更新往往滞后于pip.
4. 其他基本类库

# 其实机器学习需要的基本类库,除了第三部中给出的科学计算与可视化的基础类库外,就不在需要什么了
pip(conda) install scikit-learn
# 图像处理的基本库
pip(conda) install scikit-image

# 自然语言处理的基本库
pip install jieba
pip(conda) install nltk
# nltk下载之后需要下载其他东西

4.NLTK的问题
看图:
Python ML环境搭建与学习资料推荐_第2张图片

如图,nltk在下载完毕之后,还需要下载其他资料和模型,才能发挥出真正完整的功能,如图所示,下载的地址在外网,而且大小有3.17g之巨,所以下载贼慢,我第一次下载下载了十几个小时,途中还经常断线,需要手动再重新下载某个单元组件,不然整个模块就会停止下载,好在第一次下载之后所有环境的NLTK都使用这一个文件夹里的内容,那么港道理,我直接把文件发给大家,大家应该也可以直接使用(事实上确实可以,我在其他电脑上搭建环境就是直接copy过去的)
百度云地址

学习资料

2018年12月12日更新

  1. 入门书籍个人比较推荐麦好的**《机器学习实践指南第二版》**,这本书的结构和花书很像,有基础,有各个部分介绍,但是还有代码,比较适合入门机器学习.读完这本书机器学习的整体把握包括数学基础,应用领域都可以有比较好的认识.但是本书中的很多代码虽然实现了功能,但是代码的专业程度似乎比不上《机器学习实战》,假如你想要自己实现机器学习算法的代码的话,后者可能是更好的选择. 目前而言,我更推荐《精通数据科学:从线性回归到深度学习》这本书,首先这本书写作水平确实够高,而且作者文笔不错。其学术背景与职业背景也导致了,其不仅仅能够从机器学习的角度出发思考问题,这本书中更强调的是统计机器学习,计量统计学,数理统计等多方面的结合。而且在算法原理上,这本书讲的更由浅入深却又简单易懂。同时如果有需要的话,代码实现可以参考《机器学习实战》
  2. 理论方面首推西瓜书,也就是周志华教授的**《机器学习》**,二推李航教授的《统计学习方法》
  3. 在之前的几本书之后,你可能还需要一本书对数据科学的工程有更好地理解,这个时候建议 《python机器学习及实践-从零开始通往kaggle之路》 《Python预测分析核心算法》,当然也可以直接从这本书入门.或者**《数据科学入门》**也可能是一个不错的选择.
  4. 视频: 人工智能研究网的教程还不错http://www.studyai.com/course/index/。现在我更推荐ApacheCN的教程,目前我本人也是该组织的正式成员,主要负责项目维护,并担任部分项目的负责人。除此之外还有很多其他资料,建议去官网浏览一下。
  5. python科学计算与可视化的基础也很重要,尤其是科学计算,各个组件的官方文档已经非常适合入门,你完全可以通过官方文档入门,给出个国内的中文教学链接:http://old.sebug.net/paper/books/scipydoc/index.html
  6. scikitlearn是工程的利器一定要学会使用,可以直接通过官方文档或者源码注释学习,非常好用,也可以直接用 7 中的推荐,非常好
  7. 如果你想比较快速的入门机器学习工程,或者想进一步提升建议阅读**《Python大战机器学习:数据科学家的一个小目标》,这本书很好**,很适合初中期的学习

你可能感兴趣的:(【机器学习】基础)