roadmap&资源-林轩田机器学习基石

6、7月份,我在couresa上学习了台大林轩田老师的《机器学习基石》课程和吴恩达老师的《机器学习》课程。两门课都不错,林更注重基础,吴更注重实践,也更简单一些。

温故而知新,我近期打算将笔记重新整理一遍,笔记专辑地址为:林轩田机器学习基石笔记,不定期更新...


以下是提炼的主要思路:

1、什么是机器学习?

利用 算法 从  数据 中学习以 提升预测能力。

2、什么时候会用到机器学习?

有足够多的数据;有一定的规律/目标/模式 可以去学习;人很难去定义规则

3、为什么机器可以学习?

� 输入样本N足够大(根据霍夫丁不等式,有Ein=Eout)

� 好的假设空间(坏样本概率减小,演算法可以自由做选择,此时Ein=Eout)(好的假设空间会有一个突破点,其本身是有限的,并非人为所限制)

� 好的演算法(能够找出使Ein足够小的g,此时Ein=0)

4、机器怎样学习?

二分类算法:PLA/Pocket、Linear Regression、Logistic Regression。

当代价函数最小时,效果最好。

可以利用特征转换来减少欠拟合,利用正则化来减小过拟合,利用验证数据来检测Ein。


主要资源链接:

课程视频1、课程视频2

课程讲义

详细参考笔记、简略参考笔记

作业题目

作业答案(供参考)

参考阅读

你可能感兴趣的:(roadmap&资源-林轩田机器学习基石)