西瓜书第一~二章学习笔记

一、收获

什么是机器学习,可以理解为数据通过学习算法计算得到学习模型。因而影响机器学习的三要素是数据、算法、算力。

关于数据,它被分为训练集,验证集,测试集,都应该与样本数据保持独立同分布,这样才能避免额外偏差的产生。我们用训练集训练模型,在测试集上判别模型泛华效果,基于验证集上的性能来进行模型选择和调参。由于过拟合与泛化能力不可调和的矛盾,产生了很多种优劣势不同的划分数据集的方法,常见的有k折交叉验证法,留一法,自助法。

关于学习模型,他是机器对数据潜在规律的一种解读,被称为假设,相对于数据客观存在的规律,假设有很多种,为了衡量假设的泛华能力,引入性能度量指标。常见的由均方误差、错误率、查准率与F1。

二、疑问

为什么过拟合与拟合之间是NP!=P的问题?

随机变量的期望计算公式

F1指标贝塔系数的理解,查准率与查全率的联系

什么是假设空间,机器学习基础概念的数学定义是什么

你可能感兴趣的:(机器学习,机器学习)