机器学习算法笔记系列博客之开篇

序言

准备写一个机器学习算法笔记系列博客,主要想针对每个算法,在三个层次上进行展开:

  1. 基础理论的推演;
    • 本篇主要想讲述算法的数学详细推演过程,从基础理论上对算法有所了解。
  2. Python的算法实现;
    • 本篇主要想讲述算法的完全自己实现的整个过程,从编程实现算法的角度进行论述。
  3. Spark平台的实践;
    • 本篇主要想在大数据平台上对算法的实现以及Spark算法源码实现的过程,看与自己所编写的源码差别。

系列大纲

具体算法博客大纲如下:

  1. 原理篇

    • 概述(原理流程等概述,是整个算法的精华部分,后面展开细讲)
    • 引言(算法相关准备知识)
    • 原理与流程(主要讲述算法的数学详细推演过程)
    • 算法实例(结合所讲述的数学推导,列举相关的例子以加深对算法推导的理解,这里侧重于数学方面的实例,具体实现方面见第二第三篇)
    • 个人总结(谈谈个人对算法的理解,或者其中遇到的坑等)
    • 致谢文献(对写本算法影响大的参考文献)
  2. Python 实现篇

    • 简介(算法相关简介)
    • 处理流程(详细讲解整个算法编程实现的流程)
    • 源代码(列出实现的源代码,包括注释及实现所用的数据)
    • 结果展示(算法相关结果展示)
    • 个人总结(本篇中个人遇到的困难等总结)
    • 致谢文献(对本篇实现影响较大的参考文献)
  3. Spark 实现篇

    • 简介
    • 处理流程
    • 实例源代码
    • 算法Spark源码剖析
    • 结果展示
    • 个人总结
    • 致谢文献

主要参考文献

  • 周志华-机器学习
  • 李航-统计学习方法
  • Andrew Ng-斯坦福大学公开课 :机器学习课程
  • Andrew Ng-课件
  • Peter Harrington著/李锐译-机器学习实战

IMPORTMENT

一点想法

  • 坚持,贵在坚持,不要虎头蛇尾!依然能看到以前想写个C++相关的系列,最后没开始就结束了,希望这次能坚持下来!!!
  • 把握主线,不要偏离主线,有分支应该先记下来,把主线理清楚后再分支。最近看算法就老犯这个毛病。
  • 希望能保证一个月一个算法这样的进度。一开始肯定比较困难,要学习的工具也很多,进度也慢,一定要有耐心,还是坚持,坚持,坚持,重要的事情说三遍!!!

声明

  • 本系列博客是为了方便自己以后学习之用,当然也欢迎大家转载学习,不过最好注明出处。
  • 由于个人才疏学浅,对算法和实现上有很多理解不到位甚至错误的地方,欢迎大家指正,不甚感激。
  • 本系列博客很多都是来自于网上的资源,本人尽量对所用的注明出处,但是由于种种原因没有注明的,请留言告知。
    • 最后强调本系列博客仅自己学习之用,不负任何其他责任!!!

算法清单

  • 深入理解主成分分析PCA-原理篇:http://blog.csdn.net/ShiZhixin/article/details/51181379

你可能感兴趣的:(spark,python,大数据,机器学习,算法笔记)