从零开始学习机器学习算法,并使用python语言实战,本类别是我个人起步学习的过程记录和学习总结。参考书目:《机器学习实战》、《Python编程-从入门到实践》。
《机器学习实战》U1
机器学习十大算法:C4.5决策树、K-均值(K-mean)、支持向量机(SVM)、Apriori、最大期望算法(EM)、PageRank算法、AdaBoost算法、k-近邻算法(kNN)、朴素贝叶斯算法(NB)、分类回归树算法(CART)。
根据任务类型,机器学习算法分类如下:
有限集合 | 数值 | |
监督学习 | 分类 | 回归 |
非监督学习 | 聚类 | 密度估计 |
监督学习中,训练集提供对应每个样本的label,非监督学习则没有label。
根据数据处理的目标变量类型,对于单纯的分类问题,有分类和聚类算法;对数值估计的问题,有回归和密度估计算法。
本书介绍的分类问题算法:kNN、决策树、NB、Logistic回归、SVM、AdaBoost。
Python3在macOS环境下的搭建:
1、打开Terminal,在终端窗口内输入“python”,确认本机是否装有python及版本情况(17款MacBook Pro上的版本是2.7.10)。
2、下载及安装Xcode(后续操作的平台支持)。
3、在终端输入命令“xcode-select --install”,下载命令行工具Xcode。
4、在终端输入命令“rube -e "$(curl -fsSL http://raw.githubusercontent.com/Homebrew/install/master/install)" ”,下载及安装Homebrew。使用命令“brew doctor”测试,若显示“Your system is ready to brew”,说明下载安装成功。
5、在终端输入命令“brew python3”,下载安装最新的Python3版本。使用命令“python3 --version”测试下载版本(安装了3.6.1版本)。
6、登陆“http://sublimetext.com/3”下载安装Sublime Text文本编辑器。
7、在终端输入“type -a python3”获取Python3解析器的完整路径,再启动sublime Text,选择菜单Tools/Build System/New Build System,删除所有内容,输入“{"cmd": ["/user/local/bin/python3", "-u", "$file"]}”,保证其中地址与前述操作获取的地址一致。将文件保存到Save默认地址,命名为“Python3.sublime-build”。
8、在桌面上新建文件夹“python_work”,打开Sublime Text,选择菜单File/Save as将空文件保存到新建文件夹中,即可在该文本编译器中进行编程操作。