【AI浅谈】AI算法,用尽可能简单的话讲懂AI的原理【4】

上接:

【AI浅谈】AI算法,用尽可能简单的话讲懂AI的原理【1】

【AI浅谈】AI算法,用尽可能简单的话讲懂AI的原理【2】

【AI浅谈】AI算法,用尽可能简单的话讲懂AI的原理【3】

事前说明

学无止尽,个人能力不足,如有错误之处烦请见谅,感谢您的阅读与指出!

PS:小伞是一直在学习的唐伞妖怪欧,由于只是一只菜菜的妖怪,所以学习的地方可能会有些不对(||๐_๐),感谢各位大佬的指正!

 

评估就不谈了。。。才怪

虽然是AI考试的成绩,但还是要提一嘴的。

你以为AI考试的成绩跟你一样只有一个分数而已吗?

虽然他也确实有这一个分数,但那个分数是给我们看的离散量(正确率)。不足以反映模型的“综合学习水平”。

其实主要的问题就是AI学习用的教科书(数据)并不像现在市面上流行的教科书那样规范,对于有一些教科书来讲,会出现缺页漏印的现象(缺失值和重复值)。

有些“教科书”编写者太过激进,书里带偏见(样本不均衡)。

有些教科书的编写者本身实力不过关,经常写错东西(数据带噪声)……针对这些东西,研究者们想了很多方法来检测出模型的真实实力。

(所以说白了,其实如果数据足够好,这一切都不会发生,但现实总是那么不尽如人意,说白了,AI数据科学的研究者们,大部分时间都是在跟数据较劲(或者是在跟模型较劲))。

例如对于缺印、漏印的教科书,像这些一般来讲会采用填充的方法,也有直接删掉的。通常是对数据做处理。

对于教科书本身带偏见的(样本不均衡),通常采用的方法是使用召回率的方法,因为召回率更能体现样本不均衡条件下的分类正确率(原因在于正确率有一个缺陷,那就是当模型无脑选a的时候,正确率是很高的,这个时候题目答案为B的题是全错的,但是因为这些题太少了,所以说体现不出来)

再来就是数据样本里面带噪声的情况了,这些通常也是在数据处理阶段或者是模型设计阶段动手,或是采用带噪学习的方法。

总而言之,评估归根到底来讲就是评估一个模型的好坏,一般来讲是要根据数据和模型整体的情况来选择不同的评价指标与“考卷”。

另:而且用来评估的试卷也必须要选好,不然评估的结果是不可信的。

To Be Continue...

你可能感兴趣的:(小伞谈AI,人工智能,算法)