吴恩达老师机器学习笔记(二:Logistic回归)

吴恩达老师机器学习视频课程笔记简记

第7章节
课时46:
Logistic回归 是一个 二分类问题

Logistic 案例
Email 垃圾分类
商城交易 虚假交易
信用卡 盗刷
肿瘤 良性和恶性判断

第8章节
课时55:
过拟合概念如图:

吴恩达老师机器学习笔记(二:Logistic回归)_第1张图片
泛化:一个假设模型应用到新样本的能力
吴恩达老师机器学习笔记(二:Logistic回归)_第2张图片
分析如下:
第一个图片是欠拟合的例子,偏差过高
第二个图片是恰拟合
第三个是过拟合,过拟合意味着模型方差过大

过拟合的解决方法:

  • 减少特征变量
  • 正则化
    吴恩达老师机器学习笔记(二:Logistic回归)_第3张图片

最小化代价函数,防止过拟合的方法:

  • 梯度下降
  • 正规方程 ——normal equation

即使特征很多,正则化也可以帮助避免过拟合。

吴恩达老师机器学习笔记(二:Logistic回归)_第4张图片
如果样本数量比特征数量少,那么这个X转置 * X 的 矩阵 是 不可逆的

吴恩达老师机器学习笔记(二:Logistic回归)_第5张图片
50 * 50 像素的图片,灰度图片:50 * 50 = 2500 像素点 ,则特征为2500个
RGB图片:50 * 50 * 3 = 7500 像素点 ,则特征为7500 个
如果使用多项式来得到 非线性假设 曲线来进行分类,则特征多达百万,
神经网络被证明 用来学习复杂的非线性假设 (特征个数 n 非常大)是一个好的方法。

你可能感兴趣的:(机器学习笔记)