我在b站学ML(一)

对,就是吴恩达老师的machine learning的公开课,在我大b站有中文简体字幕版而且不会像在coursera上那么卡。

课程链接:https://www.bilibili.com/video/av9912938/

区分监督学习和无监督学习:

一、监督学习:教计算机如何去完成任务(告诉计算机这个该怎么做,那个该怎么做的基础上让计算机学会这些操作,或者说给计算机具有特征的数据让它学习,然后对未知特征的数据做预测),还有一种说法:通过海量的标记过的数据,就相当于人类在学习中通过大量的做题,然后每做一个题都知道对错,没有错的话就加强这个过程,有错的话就反向改进。

回归问题:

有一堆货物的清单,假设一些货物有几千件可卖,预测出在未来三个月能卖出多少货物。有几千件货物,只好把它当作一个实际的值,一个连续的值,也把卖出的数量当作连续值。

分类问题:

有很多用户,写个程序来检测每个用户的账目,对每个用户的账目判断这个账目是否被黑过。可以把想预测的一个值设为0,表示账目没被入侵过,另一个设为1,表示被入侵过,类似癌症例子,0表示良性,1表示恶性,通过算法预测出是两个值中的哪个。

二、无监督学习:让计算机自己去学习(给计算机的数据都是一样的,没有特征或者标签,我们也不知道该怎么处理,没有给算法一个正确答案),还有一种说法:不需要人为的标签数据,它是监督式和强化学习等策略之外的一个选择。典型的非监督学习有聚类等,它是直接从数据中寻找相似性,即规律。

聚类:谷歌新闻收集成千上万的新闻再将其分为不同的板块的内容,基因个体聚类、社交网络等等。

非聚类:鸡尾酒宴上分离不同人的声音。

 

你可能感兴趣的:(机器学习)