吴恩达机器学习_1

NLP学习_Day1

  • NLP学习_吴恩达机器学习_1
    • 机械学习定义
    • 机械学习分类
    • 监督学习(Spervised learning)
    • 无监督学习(Unsupervised learning)

NLP学习_吴恩达机器学习_1

目前是大一的小白,在学长的指引下选择了NLP这一条路,又根据学长的推荐开始啃B站上吴恩达机械学习系列课程,以下是为了加深记忆的笔记。

机械学习定义

一个适当的学习问题定义如下:在一个适当的学习问题定义如下:计算机程序从经验E中学习解决某一任务T进行某一性能度量T,通过P测定在T上的表现因经验E而提高。
(Well-posed Leaning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P ,if its performance on T,as measured by P,improves with experience E.)
吴恩达机器学习_1_第1张图片
答案:A
实际上T,E,P,已经都给出定义。
给邮件分类是T 即选项A,观察你是否把邮件标记为垃圾邮件是E 即选项B,正确归类邮件的比例是P 即选项C。

机械学习分类

1.监督学习(Supervised learning)
简单的来说,就是教会计算机学会一些东西。
2.无监督学习(Unsupervised learning)
简单的来说,就是让计算机自己学习一些东西

监督学习(Spervised learning)

先来看一个例子,下面是房子价格和大小的数据集,假如一个房子1500平米,那么它的价值是多少?
吴恩达机器学习_1_第2张图片
当然,我们可以选择直线拟合数据或者用二次函数来拟合曲线,显然会得到不同的答案。

而监督学习就是说,我们给它一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案(在例子中我们给出数据集,让算法计算1500平米房子的总价值)。
这也就是回归问题(regression problem)。
在回归问题中我们想要预测连续数值的输出。

另一个例子,下图是一个乳腺肿瘤大小和是否为恶性的关系图。
吴恩达机器学习_1_第3张图片
很显然,在这个例子里输出的值并非连续,而是割裂的(0 or 1)。这也就是分类问题(Classification problem)

在实际的例子里也有可能输出两个以上的结果(例如输出结果有良性,恶性1,恶性2,恶性3)。
在例子里我们我们只使用了一个属性来预测肿瘤的属性,我们可以使用更多的属性去预测。

例如下图使用两个属性。
吴恩达机器学习_1_第4张图片

无监督学习(Unsupervised learning)

吴恩达机器学习_1_第5张图片
在无监督学习中,我们提供给算法的数据是没有标签的(或者说有同样的标签),我们不知道要拿他来干什么,也不知道有什么意义,我们只是知道这有一些数据,你能在数据里面有什么特殊结构吗?因为我们没有把正确答案给算法,所以是无监督学习。
上图中,算法可能会分析出数据中分为连两个簇。

视频中,推荐使用Octave,因为我已经下载过Matlab,暂时我先使用Matlab

你可能感兴趣的:(笔记,机器学习)