李宏毅2020机器学习--P11 Logistic Regression

Review of classification

Step 1 function set

在这里插入图片描述
李宏毅2020机器学习--P11 Logistic Regression_第1张图片
李宏毅2020机器学习--P11 Logistic Regression_第2张图片
李宏毅2020机器学习--P11 Logistic Regression_第3张图片

Step 2:Goodeness of function

假定从一组后验概率中产生training data,某一组w和b产生一组N个training data的概率
李宏毅2020机器学习--P11 Logistic Regression_第4张图片
在这里插入图片描述
则最有可能的w和b,就是最大的L,即
在这里插入图片描述
将确定最大转换为求最小,即
在这里插入图片描述
取Ln可以简化计算,在数学求极值中经常见到,此时会将乘法变为加法
李宏毅2020机器学习--P11 Logistic Regression_第5张图片
y hat表示正确分类的结论,1对应class 1 0对应class 2
李宏毅2020机器学习--P11 Logistic Regression_第6张图片
代入上式
李宏毅2020机器学习--P11 Logistic Regression_第7张图片
在这里插入图片描述
李宏毅2020机器学习--P11 Logistic Regression_第8张图片
交叉熵代表两个分布有多接近
比较两种regression,如下
李宏毅2020机器学习--P11 Logistic Regression_第9张图片

Find the best function

用loss function对w和对b的偏微分
李宏毅2020机器学习--P11 Logistic Regression_第10张图片
同理处理第二项
李宏毅2020机器学习--P11 Logistic Regression_第11张图片
对w的偏微分为
李宏毅2020机器学习--P11 Logistic Regression_第12张图片
在更新该参数的时候:
李宏毅2020机器学习--P11 Logistic Regression_第13张图片
和三个参数有关,xi是样本,绿色下划线表示目标和现在的model的output的差距,学习率
larger difference, large update

Limitation of Logistic Regression

李宏毅2020机器学习--P11 Logistic Regression_第14张图片
诸如这样的样本,通过logistic得到的boundary是一条直线,所以很难分出两个类别。
解决问题的方法:Feature Transformation,借助于机器去进行变换的方法是 cascading logistic regression models
李宏毅2020机器学习--P11 Logistic Regression_第15张图片
将原来的特征平面映射到另一个特征平面,这里的调整w和b,方便用一个boundary区分不同类
李宏毅2020机器学习--P11 Logistic Regression_第16张图片

你可能感兴趣的:(李宏毅机器学习,机器学习,人工智能,python)