机器学习(一)--新加坡国立大学寒假学习项目总结

机器学习(一)
这里我想来分享我上课的一些笔记和心得,我感觉在这个课程中学到了很多,特别是建立起一个机器学习的基本体系和自己去探索的求知欲,接下来我想建立一个学习体系来讲解,这里面补充并且扩展了其他的资料,分几篇博文完成:
1.机器学习概论
2.线性回归
3.K最近邻算法
4.朴素贝叶斯算法
5.决策树与随机森林
6.向量机
7.模型的性能
8.神经网络

1.机器学习是什么
如果是想要了解官方的定义,这里有一个百度词条的提供参考
链接: link.
这里我也有一个小故事来说明。比如说你想要追求一个女孩子,很多时候都会陷入‘异性在想什么’的烦恼。如果用上机器学习就很不一样了。你想加看看的她的朋友圈,发现她喜欢发美食、看书,那么通过把她喜欢的美食和特征(feture)保存电脑上汇聚成数据集(data),用算法(algorithm)建立了一个模型(model,这个模型就预测出了她下次生日的时候想要收到什么书,出去逛街的想吃什么。
用周星弛的一句话说:一切尽在我掌握之中~

2.机器学习的应用
这是一道我们的思考题,列举机器学习在这些领域的详细例子。
零售 时尚 智能家居
银行 教育 社交媒体
医疗保健 电信 运输

我就来个串烧来举例,(智能家居)每天早上你的智能家居根据你智能手环上的数据和往常作息,推测你什么时候会起床,所以提前热好的洗漱的水和烤好面包。(时尚)你起床开始穿衣了,你的衣柜会根据你每天的穿衣风格来为你推荐这个风格最新的style。(社交媒体)你做上了地铁,打开手机刷抖音,软件的后台根据你每天的喜好用算法预测你喜欢的内容并推送给你。(零售)期间你打开某宝,立刻后台就根据你平时的喜好给你推送商品。(银行)你付款的时候钱不够要用某蚁,他会根据你的数据推算出你的最大额度。(运输)你下地铁后离单位还有一段时间,你用滴滴打了台车,这是后台根据每天车平时的到点速度和你的速度给你匹配最快的车。

3.编程语言–这里我推荐python,因为课程都是用这个语言,后期方便讲解。

4.基本概念
有监督学习和无监督学习
**有监督学习:**根据给出的一些特征变量和分类标签,用过算法推出分类的方法,并且用于新的样本中
监督学习的例子:
邮件垃圾邮件过滤
•谷歌照片的面部识别
•指纹识别
•Siri /谷歌助手/ Alexa / Cortana
•Facebook赞助内容
•股票市场预测
•推荐系统?

**无监督学习:**给机器大量的数据不给分类,让它自己在众多数据中找到分类的标准,去除无关的变量。
无监督学习的例子是聚类和降维。

用聚类查找子组
该图说明了如何应用聚类来根据特征x1和x2的相似性将未标记的数据组织成三个不同的组。
例如,集群可以让营销人员根据他们的兴趣发现客户群体,以便开发有针对性的活动。
机器学习(一)--新加坡国立大学寒假学习项目总结_第1张图片

数据压缩的降维
数据可以是高维的。通常我们可以通过压缩数据而不丢失ML任务所需的相关信息来减少数据维数。这种情况的典型算法是主成分分析(PCA)。
机器学习(一)--新加坡国立大学寒假学习项目总结_第2张图片

分类和回归
分类机器学习的目标是对样本进行预测和分类,判断样本的属性。
比如说女朋友喜欢的看书就是可以学术书和娱乐书,这就是二元分类;如果她喜欢言情、动漫、论文周刊、时尚杂志就属于多元分类
回归在回归分析中,我们得到了一些预测变量(解释变量)和一个连续响应变量(结果),我们试图找到这些变量之间的关系,使我们能够预测结果。
比如说女朋友喜欢看动漫书籍的话有多喜欢,一共100分可以打80分

模型的泛化、过拟合与欠拟合
泛化用我们建立好的模型去预测新的数据
过拟合在训练数据集的时候效果好,但是实际测试不行
欠拟合在训练数据集时都不行了

参考文献
深入浅出 python机器学习–段小手著
Introduction to Internet ofLearning Machine–Mehul Motani from National University of Singapore

你可能感兴趣的:(笔记,机器学习,人工智能,python,深度学习,百度)