改章节是一篇关于数据挖掘分类的帖子
硕士读了快一年了一直专注于系统开发方向,尤其是分布式和数据库这一块,身旁其他很多同寅都是数据发掘这个方向,耳濡目染,最近学习了数据发掘的相干内容,忽然认为还是蛮有意思的货色,在这里对数据发掘领域的相干经典算法做一个综述,日后一一详解。
一、分类算法
#1. C4.5
#2. CART(Classification and Regression Tree)分类和回归树
#3. K Nearest N'ei'ghbours(KNN)K近邻
#4. Naive Bayes 朴实贝叶斯
二、统计学习
#5. SVM(Support Vector Machine) 支撑向量机
#6. EM(Expectation Maximization) 最大期望
三、关联分析
#7. Apriori
#8. FP-Tree(Frequent Pattern Tree) 频繁模式树
四、链接发掘
#9. PageRank
#10. HITS
五、聚类
#11. K-Means
#12. BIRCH
六、Bagging and Boosting
#13. Adaboost
七、Sequential Pattern(序列模式)
#14. GSP(generalized sequential pattern)
#15. PrefixSpan
八、完整性发掘
#16. CBA(Classification Based on Association)关联分类
九、粗糙集
#17. Finding Reduct (知识约简)
十、图发掘
#18. gSpan(频繁子图发掘)
文章结束给大家分享下程序员的一些笑话语录: 刹车失灵
有一个物理学家,工程师和一个程序员驾驶着一辆汽车行驶在阿尔卑斯山脉 上,在下山的时候,忽然,汽车的刹车失灵了,汽车无法控制地向下冲去, 眼看前面就是一个悬崖峭壁,但是很幸运的是在这个悬崖的前面有一些小树 让他们的汽车停了下来, 而没有掉下山去。 三个惊魂未定地从车里爬了出来。
物理学家说, “我觉得我们应该建立一个模型来模拟在下山过程中刹车片在高 温情况下失灵的情形”。
工程师说, “我在车的后备厢来有个扳手, 要不我们把车拆开看看到底是什么 原因”。
程序员说,“为什么我们不找个相同的车再来一次以重现这个问题呢?”