本系列记录本人机器学习以Python为实现方式的实践过程,希望自己能够踏踏实实完成这个系列,也希望能够与各位切磋交流!
一、安装Python
下载官网:https://www.python.org/downloads/
问题1:
Python2以及Python3的选择问题
回答1:
Python3毫无疑问是最新的而且不断在发展,而Python2已经完结,最终版为Python2.7
However, there are some key issues that may require you to use Python 2 rather than Python 3.
问题2:
安装后Python的目录结构
回答2:
\DLLs python的动态链接库
\Doc python官方文档
\include python编译器的C语言头文件源代码
\Lib python的标准库(注:\Lib\site-packages python的拓展库,即第三方库)
\libs python的内置库
\tcl python默认内置的GUI工具Tkinter
关于Tkinter:
http://www.cnblogs.com/fuyunbiyi/archive/2012/06/13/2548497.html
\Tools python的工具
\Scripts easy_install、pip 等工具位于此处(注:若无安装easy_install 等工具,则没有此文件夹)
二、设置环境变量,以便在cmd上使用
注意环境变量的分号是英式分号!
三、Python模块的安装
安装的模块:
1.基本数学工具库——进行矩阵运算,进行基本的算术处理,元数据处理等:pandas、numpy、scipy
2.统计算法库——statsmodels:统计建模和计量学库
3.机器学习库
通用库——scikit learn:包含了常见机器学习算法的库,简单方便
机器视觉——SimpleCV:—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。
自然语言处理——NLTK :一个领先的平台,用来编写处理人类语言数据的Python程序
中文断词工具——jieba
4.绘图——matplotlib :Python的2D绘图库。
补充:常用的python模块:http://blog.csdn.net/hengcai001/article/details/4166996
安装方法:该链接总结的很好,我就不重复说明了
http://blog.163.com/yang_jianli/blog/static/161990006201162152724339/
建议:
1. 使用ez_setup.py安装setuptools(http://jingyan.baidu.com/article/b907e627e78fe146e7891c25.html)
2. 然后easy_install pip安装pip工具
3. 利用pip方式下载Package (pip install packageName)
问题3:
Windows下pip安装包出错“Microsoft Visual C++ 9.0 is required (Unable to find vcvarsall.bat)”
回答3:
http://www.cnblogs.com/ldm1989/p/4210743.html
问题4:
Windows下pip安装包出错“fatal error LNK1181: cannot open input file 'xx...xx.obj'”
分析4:
http://www.cnblogs.com/strive-forever/archive/2011/12/20/2295292.html
回答4:
当初装python的时候不懂事,路径中的文件夹中有空格——”Python 2.72",所以导致了这个问题,我只好把Python重装了一遍,据说有空格其实也是可以的,不过需要加上“”——前提当然是我们熟悉源代码的情况下...总之路径不用空格是一种良好的习惯= =。
问题5:
Windows下pip包安装出错“numpy.distutils.system_info.NotFoundError: no lapack/blas resources found”
回答5:
http://stackoverflow.com/questions/30753431/numpy-distutils-system-info-notfounderror-no-lapack-blas-resources-found
http://jingyan.baidu.com/article/fdffd1f8390029f3e98ca102.html
问题6:
Python version 2.7 required, which was not found in the registry.
回答6:
http://blog.csdn.net/zklth/article/details/8117207
四、补充资料
资料一:
了解.egg
(http://blog.csdn.net/turkeyzhou/article/details/8876658以及http://my.oschina.net/u/89296/blog/42393)
资料二:
了解MIME TYPE
(http://www.cnblogs.com/jsean/articles/1610265.html)
资料三:
径向基核函数RBF
(http://www.zhizhihu.com/html/y2010/2103.html)
资料四:
IPython
(http://ipython.org/ipython-doc/3/index.html#ipython-documentation)
资料五:
scikit-learn github
(https://github.com/scikit-learn/scikit-learn)
资料六:
scikit-learn官方文档
(http://scikit-learn.org/stable/documentation.html)
资料七:
scikit-learn视频教程
(http://52opencourse.com/552/%E6%8E%A8%E8%8D%90%E4%B8%80%E4%B8%AApython%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%B7%A5%E5%85%B7%E5%8C%85scikit-learn%E4%BB%A5%E5%8F%8A%E7%9B%B8%E5%85%B3%E8%A7%86%E9%A2%91-tutorial-scikit-learn-machine-learning-in-python)
资料八:
pip 与 easy_install
http://52opencourse.com/552/%E6%8E%A8%E8%8D%90%E4%B8%80%E4%B8%AApython%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%B7%A5%E5%85%B7%E5%8C%85scikit-learn%E4%BB%A5%E5%8F%8A%E7%9B%B8%E5%85%B3%E8%A7%86%E9%A2%91-tutorial-scikit-learn-machine-learning-in-python
资料九:
集成平台
http://www.cnblogs.com/starimpact/p/3526146.html
资料十:
Python数据科学资源
http://blog.csdn.net/xmuecor/article/details/44175855
https://github.com/jonathan-bower/DataScienceResources
资料十一:
关于Anaconda
http://continuum.io/
http://www.jb51.net/article/51651.htm
http://blog.csdn.net/rumswell/article/details/8927603