深度学习一般工作流程

一、定义问题,收集数据集。

注意确保数据集特征丰富程度足以作出预测

二、定义模型预测性能指标

如:平衡分类问题常用精度、接受者操作特征曲线下面积;不平衡分类问题常用精度和召回率;标量回归常用平均绝对误差(MAE)等等。

三、确定模型评估方式

如:留出法、K折交叉验证、乱序重复K折交叉验证

四、数据预处理

预处理目标:

1、特征值为张量数据
2、特征取值较小(0-1区间或正负1区间)
3、特征非异质数据
4、特征缺失处理为0

五、搭建模型

1、确定激活函数、损失函数

问题类型 输出层激活函数 损失函数
二分类 sigmoid binary_crossentropy
多分类单标签 softmax categorical_crossentropy
多分类多标签 softmax binary_crossentropy
标量回归 NONE MAE

2、从简单结构开始逐步扩大模型规模

3、考虑正则化和dropout

六、交叉验证

在验证集上多次训练,找到最佳性能的模型结构

七、测试集验证

注意:测试集性能和验证集性能相差较大,考虑采用更复杂的验证方法,如乱序重复K折交叉验证

你可能感兴趣的:(深度学习)