李宏毅机器学习(一)导论

机器学习是什么

老师列举了个实例漫画,一个机器人被切开了后里面都是if(else),这种机器人不具备自我学习的能力

机器学习   是根据我们的大量数据寻找到一个function函数,以获得对新数据的预测(回归)或识别(分                        类)的过程

插图1 训练好数据实现分类,输入一张猫图片,输出cat

回归   

       函数输出是个   数值(连续或区间连续)

分类

       函数输出是0,1,2,3……(包括多分类和二分类)

二分类

       函数输出是0,1即yes,no,如判断是否为垃圾邮件,是不是一只猫

多分类

       函数输出是多个类0,1,2,3等等,如判断文章属于什么类型(政治,社会,经济,体育等)


插图2 机器学习图谱

分类学习有无监督

监督      

数据有对应的标签(已分类好)

可分为有监督,无监督,半监督

半监督,测试数据部分没有标签,可能只有小部分有标签,但是没有标签的数据是有用的

无监督,测试数据没有标签(无法通过标签直接判别验证),如让机器自己看大量文章,进行分类等等

插图3 无监督学习--机器去动物园看到这些动物,能否自己创造新的动物

迁移学习 transfer learning 

如要训练猫狗的分类,有大量无关的图片数据(可能部分有标签)

插图4  迁移学习

结构学习structure learning

输入数据,提取多个信息(目前有很多技术尚未被探明)

插图5 结构学习

强化学习reinforcement learning

常常是因为没有办法做监督学习(缺少数据)

与监督学习相比,监督学习会给出正确答案,而强化学习会给出一个评价

如聊天机器人跟人聊天,人给出对话评价,机器学会总结

如alpha go下棋,给出下棋的评价(其实alpha go是监督学习和强化学习的结合)

插图6

你可能感兴趣的:(李宏毅机器学习(一)导论)