机器学习在工程中使用要点

机器学习现在有很多分支,大部分使用数据和模型优化入手。在此之前机器学习按照学派划分是有可靠的理论依据的。那么我们使用应该注意以下几点:
1、如何获取训练集,一般我们下载现有的训练集为了学习或者来测试自己的算法泛化能力的表现水平。这时候我们对训练集也要选择一定的特征。特征来自于对我们要达到的结果做初步归一化处理。
2、从特征提取——特征选择——特征降维。这两块的理论依据是信息论和系统工程。做信息熵和基尼系数,参数之间关联程度计算,特征工程包括特征的衍生,尺度量化,特征提取的数据结构,特征选择对参数贡献程度及其对结果的影响。
3、代码及其训练,一般使用两个框架循环训练两个model文件中对比参数和优越性,主要考验泛化能力和最终分类准确率。
4、发现存在问题,深度学习最核心的是两个方面:数据和模型,数据集严格按照要求分为训练集合测试集。模型表示对原始数据的处理方式,caffe不直接处理数据而是采用预处理程序将原始数据转化成存储的LMDB格式,这种方式主要为了高效的IO效率。这样更好的利用数据来对模型参数更新,一般卷积层,全链接层,池化层没有做相关算法去验证变量类型,所以我们需要做对变量求出随机变量换上连续型变量,矩母函数及其随机过程测定尺度。
算法选择,机器学习在工程中使用要点_第1张图片按照SheldonM.Ross《应用随机过程概率模型导论》中提到更新理论及其应用和系统工程学理论选择对结果最需求的算法。

  If you are losing your leisure ,look out! It may be you are losing you soul.
  如果你正在失去你的现象时光,小心!你正在失去你的灵魂。2017-2-12

你可能感兴趣的:(机器学习)