ML机器学习理解

1.什么是机器学习

2.

3.为什么要机器学习

(2)

作用:寻找数据之间的隐秘关联,对真值与目标属性进行聚类或者回归

分类:有监督、无监督、半监督;离散型、连续型

有监督:有真值,数据分组:训练与测试,训练所得到的模型在实际测试值的时候会有差错,那么就应该对其进行调整,但本质原因是我们搜集到的数据无法避免的包含其他因素;另外,训练的不理想结果也是有两个:欠拟合与过拟合

欠拟合:显著偏离真实值的模型,——模型需要复杂化

过拟合:与训练数据拟合较好的模型,但不能很好的推广到不可见数据——算法简单化(正则化算法)

(3)

优点:解决非ML算法无法结局的问题,提供非ML算法不具备的优势

重要特征:将模型与数据分离,以适应不同的业务场景或相同的业务案例,但具有不同的上下文

目前:需要一种整体的方法来改进模型,而不是逐利修补模型。因为模型对我们而言是非直观的

,我们难以对模型做出解释或者推理(最先进模型 PesNet)

1.怎样标记一个新点

把具体特征抽象化,如在观测新生儿是否会得癫痫病的时候,将新生儿的特征抽象化,变成数值,以已经观测到的结果作为真值,目标是寻求特征值与真值之间的关系,真值设为1(不会),-1(会),那么根据会与不会的结果,找到一条直线,划分x值,这条支线也就是一种“线性分类器”(Lineal classifer)。在进行标记的时候,主要是逐层将x标签化,比如 通过某种方式计算 x相对于 y的投影是 0,那么某直线上所有的x值可以作为符合这一条件的数据,并且根据数学定理,这条直线进行平移得出的结果也是一样,那么就能得到一个数据域,这在某种意义上就是说,符合一定条件的x值,均能得到预期的结果,这也就能将 x 具象化 并且标签化(浅薄理解)

2.怎样变得更好?

首先,当得到一个关于目标属性与真值的函数之后,要进行测试,那么测试之后出现的误差,要对其进行评估。(好像牵涉到0-1问题)超参数,就是对该函数的一种调整。学习算法也就是更为具体的数学应用。

你可能感兴趣的:(机器学习)