文章原创,最近更新:2018-04-20
1."机器学习"课程内容导学
2.Sklearn库的安装
3.Sklearn库标准数据集及基本功能
Python机器学习应用-北京理工大学-礼欣、嵩天
1."机器学习"课程内容导学
1.1机器学习的目标
1.2机器学习分类
- 监督学习
监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。
监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种"合理"的方式从一种从训练数据到看不见的情况下形成。
https://baike.so.com/doc/6064719-6277778.html
- 无监督学习
无监督学习(unsupervised learning):设计分类器时候,用于处理未被分类标记的样本集
目标是我们不告诉计算机怎么做,而是让它(计算机)自己去学习怎样做一些事情。非监督学习一般有两种思路。第一种思路是在指导Agent时不为其指定明确的分类,而是在成功时采用某种形式的激励制度。需要注意的是,这类训练通常会置于决策问题的框架里,因为它的目标不是产生一个分类系统,而是做出最大回报的决定。这种思路很好的概括了现实世界,Agent可以对那些正确的行为做出激励,并对其他的行为进行处罚。
https://baike.so.com/doc/3749396-3939000.html
- 强化学习
强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。
所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。
https://baike.so.com/doc/6297303-6510824.html
- 半监督学习
半监督学习(Semi-supervised Learning)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。主要算法有五类:基于概率的算法;在现有监督算法基础上作修改的方法;直接依赖于聚类假设的方法;基于多视图的方法;基于图的方法。
https://baike.so.com/doc/5166522-5397082.html
- 深度学习
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。 深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。 深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。
https://baike.so.com/doc/7000002-7222884.html
1.3scikit-learn介绍
scikit-learn官网上,可以找到众多的机器学习资源,包括模块下载,文档
1.4课程目标
1.5相关书籍及课程推荐
吴恩达-介绍机器学习及其算法知识
李菲菲-深度学习课程推荐
深度强化学习课程推荐
2.Sklearn库的安装
2.1Sklearn库介绍
2.2numpy库安装
如果未提示任何安装错误
以上安装过程有点复杂了
其实可以在cmd输入:pip install numpy,就可以直接安装numpy库
2.3Scipy库安装
如果未提示任何安装错误
以上安装过程有点复杂了
其实可以在cmd输入:pip install scipy,就可以直接安装scipy库
2.4matplotlib库安装
以上安装过程有点复杂了
其实可以在cmd输入:pip install matplotlib,就可以直接安装matplotlib库
2.5 sklearn库安装
以上安装过程有点复杂了
其实可以在cmd输入:pip install sklearn,就可以直接安装sklearn库
2.6测试
python命令行模式,导入包进行测试,如果没有错误,则全部安装成功.
3.Sklearn库标准数据集及基本功能
3.1数据集总览
3.2波士顿房价数据集
>>> from sklearn.datasets import load_boston
>>> boston=load_boston()
>>> print(boston.data.shape)
(506, 13)
>>>
>>> from sklearn.datasets import load_boston
>>> data,target=load_boston(return_X_y=True)
>>> print(data.shape)
(506, 13)
>>> print(target.shape)
(506,)
3.3鸢尾花数据集
>>> from sklearn.datasets import load_iris
>>> iris=load_iris()
>>> print(iris.data.shape)
(150, 4)
>>> print(iris.target.shape)
(150,)
>>> list(iris.target_names)
['setosa', 'versicolor', 'virginica']
3.4手写数字数据集
>>> from sklearn.datasets import load_digits
>>> digits=load_digits()
>>> print(digits.data.shape)
(1797, 64)
>>> print(digits.target.shape)
(1797,)
>>> print(digits.images.shape)
(1797, 8, 8)
>>> import matplotlib.pyplot as plt
>>> plt.matshow(digits.images[0])
>>> plt.show()
最终显示的结果: