《机器学习实战——基于Scikit-Learn和TensorFlow》阅读笔记

阅读这本书的目的还是基于毕设的需求,也是一定程度上为复试做准备,也很大程度上决定了这本书肯定不会完全阅读,只是会阅读自己需要的部分,由于毕设“基于深度学习框架下近距离环境下的面部表情识别系统研究与实现”在caffe和TensorFlow架构中选择了后者,在寒假结束前的任务也是把tensorflow架构以及opencv给弄明白,这本书也就成为了一本必不可少的参考书。

第1章 机器学习概览

机器学习的种类

两个较为常见的分类方法是:
1、是否在人类监督下训练(监督式学习、无监督式学习、半监督式学习和强化学习)
2、是否可以动态的进行增量学习(在线学习和批量学习)

监督式学习
标签/标记:提供给算法的包含所需解决方案的训练数据
典型的监督式学习任务:分类(回归算法)

无监督式学习
典型的无监督式学习:聚类算法,降维算法,异常检测,关联规则检测
降维算法的执行过程成为特征提取
聚类与分类的区别:简单来说,分类算法就是先贴标签,然后根据标签分类,因此是监督式的学习方法;聚类算法是根据给出数据的联系,类别在聚类过程中自动生成,是非监督式的学习方法。

半监督式学习
大多数半监督式学习算法属于监督式学习算法和非监督式学习算法的结合,例如深度信念网络(DBN),它是基于一种互相堆叠的无监督式组件,组件名称是受限玻尔兹曼机(RBM)

强化学习
用于解决智能体问题

线性回归的意义:通过所提供的样本,找出最符合所提供数据的线性模型的参数,这就是训练模型的过程。

无关特征

特征选择:从现有特征中选择最有用的有用的特征进行训练
特征提取:将现有特征进行整合,产生更有用的特征

测试与验证

将数据分割成两个部分:训练集和测试集,80%用于训练,20%用于测试,no free lunch定理说明,并不存在一个先验模型,能保证数据集一定工作的更好。

第二部分 神经网络和深度学习(TensorFlow)

第9章 运行TensorFlow

TensorFlow原理,在python中定义一个用来计算的图,然后TensorFlow就会使用这个图,并用优化过的C++代码来执行运算。

你可能感兴趣的:(机器学习,tensorflow)