为便于使用Python进行机器学习与数据挖掘的学习,先安装sklearn等常用库。然后搭建出集成开发环境。由于之前常采用Eclipse IDE来开发C/C++和Java,故先考虑搭建Eclipse-Pydev环境来学习使用Python。
Ubuntu-14默认的Python解释器是Python2.7,若需采用Python3则将Python链接重指向Python3.X。
参考: ubuntu中修改默认Python版本号
然后基于对应的Python安装numpy,pysci,maplotib,scitit-learn (sklearn) 。
参考: ubuntu14.04搭建scikit-learn环境及pydev
首先注意pydev的版本对Python和JDK的要求,pydev-3.0以上版本需至少JDK1.7支持,pydev-4.6以上版本则需JDK1.8以上支持,根据当前JDK版本安装合适的pydev到Eclipse,并配置Python解释器。
参考:python+Eclipse+pydev环境搭建
至此,基于Eclipse的Python开发环境搭建完成,同时整合了基本的数据挖掘工具包和计算库。
关于python-sklearn的基本使用,可参考:
Introduction to Machine Learning with Python and Scikit-Learn