【原】机器学习——入门篇

【说明】

来自慕课网机器学习基础课程的学习笔记,扫盲基本概念。

一、什么是机器学习

定义:利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。
分类:
离线机器学习:如每晚定时任务建模分析数据进行学习。
在线机器学习:实时的进行建模分析数据学习,来一条分析一条,学习一条。如购物节等。

二、典型案例

关联规则算法

场景:购物篮分析,根据购物篮分析哪些商品是被同时购买的。

聚类算法

场景:用户细分精准营销。

朴素贝叶斯算法

场景:垃圾邮件识别。

决策树算法

场景:信用卡欺骗,银行风险识别。

CTR 预估算法(背后算法是线性逻辑回归算法)

场景:百度的搜索结果,会在竞价排名的基础上,优先显示用户最可能点击的一条结果,这个结果是结合用户之前的行为习惯排序展示的。

协同过滤算法

场景:购物组合推荐。

三、机器学习算法分类

算法分类1

有监督学习、无监督学习、半监督学习

有监督学习

分类算法、回归算法,明确给出学习算法中的Y值


image.png

无监督学习

聚类:没有给出算法中的Y值,需要把用户分成几类自己提前都不知道,根据结果去看Y应该是什么样子,典型的场景比如电信的用户分类。

半监督学习(强化学习)

开始有Y值,但是Y值的数据样本不好,随着数据越来越好,样本越来越好,结果越来越好。

算法分类2

分类与回归、聚类、标注

算法分类3(重要)

生成模型、判别模型
生成模型:告诉你某个数据30%可能是模型中的A类,30%可能是模型中的B类,50%是模型中的C类,是一种推断。
判别模型:告诉你某个数据是模型中的某一类,是一种结果。

四、常见算法

image.png
image.png

你可能感兴趣的:(【原】机器学习——入门篇)