00002机器学习导论:Introduction to machine Learning第二版:绪论

绪论

什么是机器学习?
00002机器学习导论:Introduction to machine Learning第二版:绪论_第1张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第2张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第3张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第4张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第5张图片




00002机器学习导论:Introduction to machine Learning第二版:绪论_第6张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第7张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第8张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第9张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第10张图片

00002机器学习导论:Introduction to machine Learning第二版:绪论_第11张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第12张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第13张图片
正如那些电子书城、抖音等软件的推荐算法一样,要么我们给某一本书加上标签:例如,《三体》是一本科幻类的小说、是刘慈欣写的,这时,三体的标签就是“科幻”、“刘慈欣”,当书城给我们推荐小说时,肯定优先推荐科幻类题材的书籍,当然这些书籍也是被加过标签的,而我们的用户画像也是“科幻”。还有一种是我们不知道《三体》《流浪地球》的任何信息,当有很多用户将这两本书放在书架时,我们有理由相信这两本书大概率是同一类型的书籍。00002机器学习导论:Introduction to machine Learning第二版:绪论_第14张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第15张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第16张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第17张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第18张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第19张图片
还是很有用的
00002机器学习导论:Introduction to machine Learning第二版:绪论_第20张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第21张图片
例如我们使用的蚂蚁花呗、借呗、京东白条等产品。
对于判别性条件语句,我们通常需要建立分段函数,其中的阈值才是我们需要关注的点,这些也是机器学习所要做到的。
在这里插入图片描述
00002机器学习导论:Introduction to machine Learning第二版:绪论_第22张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第23张图片
在这个问题中,只有两个因素影响,我们可以建立一个方程,来判定相应的区域。我们也不会将某一个问题绝对化,可以使用概率的方法来评估。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第24张图片
这一问题在LeNet5手写数字识别中有所提到。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第25张图片
在这里插入图片描述
00002机器学习导论:Introduction to machine Learning第二版:绪论_第26张图片
在人脸识别领域已经有了较大的发展,在疫情时,需要佩戴口罩,这一问题就被凸显,现在已有一些解决方案。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第27张图片
在这里插入图片描述
指出了一些现存的问题。00002机器学习导论:Introduction to machine Learning第二版:绪论_第28张图片
谷歌翻译谷歌翻译
00002机器学习导论:Introduction to machine Learning第二版:绪论_第29张图片
生理特征:面部图像(人脸识别)、指纹、虹膜、手掌。
行为特征:签字的力度(字迹识别)、嗓音、步态、击键。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第30张图片
在这里插入图片描述
在这里插入图片描述
00002机器学习导论:Introduction to machine Learning第二版:绪论_第31张图片
x为一个向量,
00002机器学习导论:Introduction to machine Learning第二版:绪论_第32张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第33张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第34张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第35张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第36张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第37张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第38张图片
有关于遗传算法的内容好像也是关于碱基序列的变化的。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第39张图片
感觉写的现在好多都在使用增强学习的,之前有看到中科院大学的协同机器人。
在这里插入图片描述
00002机器学习导论:Introduction to machine Learning第二版:绪论_第40张图片
机器学习的目标并不是理解人类和动物学习的过程,而是像任何的工程领域一样,机器学习旨在构建一个有用的系统。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第41张图片
科学领域的模型:归纳与演绎。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第42张图片

模式识别;非参数的(如果一个估计问题所涉及的分布未知或不能用有穷参数来刻画,称这种估计为非参数估计,一般由样本估计未知分布函数或未知概率密度,由样本估计某一对称分布的分布中心都是非参数估计。常被应用于测验分数统计中);凭借经验的。
00002机器学习导论:Introduction to machine Learning第二版:绪论_第43张图片
VLSI(Very Large Scale Integration,超大规模集成电路)
在这里插入图片描述
00002机器学习导论:Introduction to machine Learning第二版:绪论_第44张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第45张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第46张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第47张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第48张图片
00002机器学习导论:Introduction to machine Learning第二版:绪论_第49张图片
答:当我们使用传真一份文档时,即传送图像,最大的优点就是能够快速完成任务,确保文档在传输过程中的安全性,不被修改性,缺点:我们不能对文档进行修改,如果需要进行错误修改,就需要在写一份文档,而且图片在传输过程中,可能会被压缩,图像质量会被降低。
当我们使用光学字符阅读器(OCR),然后再传送相应的文本文件,它的最大优点是不会在传输中失真,也可以在文档中进行修改,节省时间。
缺点:需要进行OCR识别,速度、精确性等都取决于技术水平,安全性有所下降。
传送图像:
优点:内容完整(颜色,格式,大小),无偏差。
缺点:当传送图片分辨率高或者文档内容多时,传送数据量大。传真无法变成电子版,电子版方便分享。
经过OCR(optical character recognization)
优点:经过OCR转换为电子版之后,分享传送的速度都很快(数据量也被压缩了–图像到字符)。
缺点:会存在识别误差,跟具体OCR的软件有关。
当传送图片除了文字还有很多格式,排版的时候推荐使用传真。
当内容基本为文字的时候,且内容很多,推荐走OCR软件。
在这里插入图片描述
根据baidu资料了解OCR失败的原因有如下:
手写内容,许多排版格式和图片内容不完整,扫描时断句(可容错)。

而条码读取器则遵循统一的标准,不会有多个格式的问题,这也是条码读取器目前仍在使用的原因。
在这里插入图片描述
邮件过滤的技术分为三大类:
a)基于特征过滤
b)基于改进的SMTP协议
c)应用知识体系
1)邮件发送的ip,邮件标题,邮件内容;
2)涉及到自然语言处理,现在世界通用的统计学模型,贝叶斯分类器;
3)发现的放到一个文件夹并且进行高亮提醒。
在这里插入图片描述
输入:目的地,人数;中途停靠点,停靠时间(是否有中途上车,上车多少人);输出:费用。
出租车之间需要有种语言–用协议的方式实现
在这里插入图片描述
X和Y的关系影响因素:
a)商品状态:被浏览,被购买。(时间间隔 可能也是个考虑因素)
b)商品的先后:X–>Y or Y–>X
根据这些因素计算权重,找到X,Y之间的关系函数。用机器学习的回归算法计算新输入的训练数据(X1,Y1)的结果(依赖关系)。
回归,增强学习
在这里插入图片描述
1)这个和自然语言处理有点类似(数学之美里面提到语法分析使用概率关系是3个词之间的关系,现在工程上面是表示统计用户连续两个命令使用的频率。通过概率给出预测。(这里简单的使用了频率,可能还要考虑到当前时
间,当前打开的应用等)。
2)简单实现方式:当前页面被访问链接的概率,做个排行榜,返回概率最大的页面链接;
页面的访问链接的概率。分类,增强学习
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
每一行都会向右移动一个像素,但是排列成行,它们的相对位置是不变的,例如,2–>3,102–>103。距离是没有变的。
在这里插入图片描述
在这里插入图片描述
因为二手车的价格就是要参考他的原价,不然,你买到一个比原价还贵的普通二手车(不考虑那些珍藏版的),你的感觉是什么样的?
00002机器学习导论:Introduction to machine Learning第二版:绪论_第50张图片

你可能感兴趣的:(机器学习导论,机器学习,python,人工智能,深度学习)