吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design

吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design

    • 11-1.确定执行的优先级 Prioritizing what to work on: Spam classification example
    • 11-2.误差分析 Error analysis
    • 11-3.不对称性分类的误差评估 Error metrics for skewed classes——Precision/Recall 查准率/召回率
    • 11-4.精确度和召回率的权衡 Trading off precision and recall
    • 11-5.机器学习数据 Data for machine learning

11-1.确定执行的优先级 Prioritizing what to work on: Spam classification example

吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第1张图片
吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第2张图片

11-2.误差分析 Error analysis

判断应采取哪种手段降低错误率的方法:
吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第3张图片
波特词干器(Porter Stemmer):后缀剥离的词干提取算法
数值评价指标:number evaluation metrics
最好在交叉验证集上做误差分析,不要在测试集上

11-3.不对称性分类的误差评估 Error metrics for skewed classes——Precision/Recall 查准率/召回率

sknewed classed : 正样本数量和负样本数量相差很大
吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第4张图片
用y=1表示比较稀少的一类
Precision/Recall 查准率/召回率越高越好
high precision is a better thing.

11-4.精确度和召回率的权衡 Trading off precision and recall

改变threshold
precision :更加精确,尽量减少误判假为真,只要有一点点不可能是癌症就判为不是癌症,阈值大
recall :尽量减少误判真为假,只要有一点点可能是癌症就判为癌症,阈值小
吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第5张图片
吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第6张图片

11-5.机器学习数据 Data for machine learning

吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第7张图片
吴恩达机器学习笔记week11——机器学习系统设计 Machine learning system design_第8张图片

参数多---->低偏差
训练集大----->低方差

你可能感兴趣的:(机器学习)