Task01:概览西瓜书+南瓜书第1章、第2章

文章目录

  • 前言
  • 第 1 章
  • 第 2 章 模型评估与选择
  • 参考

前言

Task01:概览西瓜书+南瓜书第1章、第2章_第1张图片
之前的机器学习的笔记链接

第 1 章

Task01:概览西瓜书+南瓜书第1章、第2章_第2张图片      上面公式的结论就是总误差与学习算法无关,无论效果多好或多坏,它们的期望性能是一样的,这是NFL定理(No Free Lunch Theorem) 没有“免费的午餐“定理
      这是你可能会想这学个屁算法,所有的学习算法和你瞎猜一样,真的是这样吗?显而易见不是的,上面定理存在的一个重要前提是就是f都是均匀分布,就是真实目标函数均匀分布,个人理解就是所有的结果猜想的概率都是一样的,想我是否想去干饭?目标函数是有什么菜,吃佛跳墙和吃白粥对我想去吃的欲望可能性是一样的大的,但是现实是我肯定想吃佛跳墙(#虽然我没吃过www)

      互联网搜索是通过分析网络上的数据来找到用户所需的信息,这个过程,用户的查询时输入,搜索结果是输出。现在可能是因为学习机器学习学多了 学疯了,都疯狂开始类比了,觉得一个人,每天睡醒开始,就开始感知这个世界,视觉,嗅觉,听觉,触觉,味觉,所接受进来的信息,经过大脑(模型),输出(起床刷牙干饭)。

      但是有时觉得机器相比于机器,机器太笨了,即使阿尔法狗能干掉世界第一的围棋高手,它也教不会一个小孩为什么1+1=2,也教不会小孩明白ta是不是从垃圾桶捡来,也做不饭给我干。当然这些扯得有点远了,从计算机视觉方法,图像识别,一个小孩识别出一个物体是否是车,只要有几个样本告诉它车大概是这样,接下来ta能轻松辨别出一个物体是否是车,但是机器不行,喂了几千张图片,还是识别效果不好,但是机器有一个人无法相比的优点就是速度快而且不会疲惫,只要人给予教会它一些规律(算法),它能为我们做很多事情(智慧司法,智慧城市,智慧金融,智慧交通等)

第 2 章 模型评估与选择


感悟:
<1> bootstrapping 自助法在随机森林里面也有用到,1份数据集D,通过n次自助抽样,生成n份数据集(每份数据集大概是D的63.2%,通过上面的极限公式可以求解出来),然后生成n个决策树,每个决策树基本是相互独立的,通过降低方差来降低误差,至于为什么能降低误差
详细一点的链接

参考

Datawhale的github开源吃瓜教程项目,目的:一起吃冰西瓜

你可能感兴趣的:(#,【机器学习】吃瓜教程!)