Construct a framework

说到Machine Learning(ML)大家肯定不会陌生,近几年好像处在持续火热之中,很多人也开始对这方面的内容进行学习研究。
我是在上学期也就是研一的时候开始学习的,但一直是停留在理论阶段,中途也完成过相应的作业,但还未正式地将其与实际应用相结合,没有用来解决实际性的问题。所以记录这个版块的主要原因是保存下基本的理论框架知识,对自己是一种检测,同时也为后续的应用夯实基础。另外也希望能和更多的伙伴进行交流学习~

在这儿我主要以框架的方式梳理一下知识网络,具体的细节部分,在以后随着更深入的理解再提供补充~~


What:
ML:让机器自身学习,针对一类问题的不同输入均可得到相应的输出,而非针对一个具体的输入写出一个完备的算法。由此可见,相比于传统的算法设计逻辑,其更灵活。

How:
那它的整个流程框架是怎样的呢?既然机器学习的结果能够对不同的输入均产生作用,那么这个算法在形成的过程中就得给它“喂”进多量且多样化的食物,得先让它尽可能地尝遍各种美食,既要有山珍海味,也得有粗茶淡饭,这样才能让它的胃有更好的适应性,不至于在来了一种新食物时出现肠胃不适紊乱的现象~~养好胃之后,当再给它“喂”入新鲜的食物后,它便能立刻反应出这是何种食物。这也从另一个角度说明耕耘和收获是成正比的,既然我们希望这种算法能解决更多不同输入的问题,那么在一开始,我们就得多给它更多的投入啦:)


上面这段是我自己总结的形象化理解,下面还是用规范化的词语说明其具体的含义吧~
【算法】——Model,也就是我们最终希望得到的模型,当有了这个模型之后,输入一个之前没有的    数 据也能得到对应合理的输出
【食物】——dataset,为得到理想模型而必不可缺的数据集,只有有了数据之后,才能利用数据来训练模型,最终得到理想的模型。没有数据,也就没有营养来源,一切都只是空谈了~~
【山珍海味/粗茶淡饭】——这指的是数据集中不同的数据属性,也就是为了能让模型有更好地适应能力,不能只让它接触到一种类型的数据,而应该让它根据实际地应用情境(如二分类或多分类问题),让它接触到多种属性的数据。
【紊乱】——大的误差,也就是模型在处理一批新的输入数据时,其效果不佳。这分为两种情况:a、模型本身对训练的数据就有比较大的误差(高偏差),b、模型能很好地适应进行训练的数据,但针对一批新输入的数据产生较大的误差(高方差)。这两个问题是在模型设计过程中时常产生,尽量减小,不可避免的,毕竟,人间美食那么多,怎么可能让一个有限容量的胃去尝尽呢:(
【反应】——评估,也就是拿训练好的模型来处理一个新的数据,并得到对应的结果,也就是整个机器学习最终的目的。

Why:
上面所说的便是机器学习的一个流程,理解上似乎并不困难,但是如何得到所需数据?怎么利用已有数据训练得到想要的模型?怎样才能得到一个更好的模型?如何去评估一个模型的好坏?……可能一开始还会有更多的问题,不过,不要着急,学习是循序渐进的过程,在后续的笔记中我就逐步的把握学到的知识点概括总结出来,希望能对你从大体上的理解有所帮助,当然这种理解可能是比较片面的,要是你能献策那就更好啦~

Framework:so……有了上面的介绍,下面给出整体的一个思路框架以形成比较形象化地理解,如图1,毕竟看图有时比看文字更直观,印象更深~~

Construct a framework_第1张图片
图1

注:在这儿推荐一下AndrewNg的公开课Machine Learning的入门级课程,这也是我已开始接触学习的内容,感觉不错~由于文件比较大,可以直接到网上找资源:)也可以私信qq:1195104546



你可能感兴趣的:(Construct a framework)