机器学习初探

       在阿里半年多的时间里,从一个机器学习门外汉终于进入到门里面了。下面给大家讲讲现在工业上整个机器学习流程和一些自己的体会。

学习过程:

        1.   理解机器学习的一些基础概念,像auc,梯度.... 大家参考《机器学习》 周志华。

        2.  从基础看起,先学习基础模型,lr模型,gbdt模型,fm模型,ffm模型,现在有很多开源的代码,最好是c++的,并用公开的数据集进行训练,深入理解数学公式的每个细节,多看,多跑。如果有机会,最好你们公司内部有一个很好的项目,你能参与进去,从头到尾搞一下还是不错的,你会发现会受益匪浅,这也是自己,还有包括阿里其他同学写模型的一致感受,条件不够的话,可以先从单机版开始。

        3. 把以上基础都打结实了,就可以学习深度模型了,也就是业界所说的dnn,核心概念主要网络,这个大家基础学习可以看《深度学习》经典数据。

       4. 基于分布式的可以参考开源代码库ps-lite,具体细节就看你的悟性。

 感悟:

         其实写模型还是比较简单的,其实最核心还是数据,数据,数据,数据的理解。

         做机器学习首先必须补充一些基础数学知识,其次不要害怕,工业界的实现的算法都很简单,正所谓仁者见仁,智者见智。共勉哇,大家加油。。。

你可能感兴趣的:(机器学习,源码学习,gtest)