机器学习笔记

定义:

在一个问题下,计算机程序从经验E中学习,解决某一任务T进行某一性能度量P ,通过P测定在T上的表现因经验E而提高。

主要两类:监督学习,无监督学习

监督学习(典型:回归分类):通过已有的训练样本去训练得到一个最优模型,再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现预测和分类的目的,也就具有了对未知数据进行预测和分类的能力。简单来说,就像有标准答案的练习题,然后再去考试,相比没有答案的练习题然后去考试准确率更高。监督学习中的数据中是提前做好了分类信息的, 它的训练样本中是同时包含有特征和标签信息的,因此根据这些来得到相应的输出。

例如:我们给出一个房子的数据集,在这个数据集中我们每一个都给出正确的报价。让我们找到通过算法找到最合适的连续的线去表示。(回归(连续)问题)

        给我们肿瘤的尺寸为变量,给我们一个数据集:告诉我们这个肿瘤是恶性的还是良性的大小是多少也告诉我们,我们通过算法在数据空间中找到一个数据的界限,能尽可能的分出来是良性还是恶性,然后我们通过这些数据对给我们新的肿瘤进行预测(分类(离散)问题)

无监督学习(典型:聚类):概念:
训练样本的标记信息未知, 目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础,此类学习任务中研究最多、应用最广的是"聚类" (clustering),聚类目的在于把相似的东西聚在一起,主要通过计算样本间和群体间距离得到。深度学习和PCA都属于无监督学习的范畴。
 

例如:网页中同一个事件中,有很多url而且每一个url都能进入相关的文章虽然内容不一样但是都是说的这个事件(这就是在无数条新闻中进行了分簇有相关的主题,放在一起(聚类))

例2:两个人距离麦克风的距离不一样,两个麦克风收集到两人的声音的大小等就不一样,通过算法将两人的声音分开

参考:【机器学习笔记】有监督学习和无监督学习_Liaojiajia-2020的博客-CSDN博客_有监督学习

你可能感兴趣的:(机器学习)