(3)机器学习入门

1 理解机器学习

1.1机器学习的基本思路

从语义层次看,机器学习是指计算机能模拟人的学习行为,通过学习获取知识和技能 ,不断改善性能,实现自我完善。

(3)机器学习入门_第1张图片

 三个关键要素:

如果一个计算机系统在完成某一类任务T的性能P能够随着经验E而改进,则 称该系统在从经验E中学习,并将此系统称为一个学习系统

(3)机器学习入门_第2张图片

 1.2常见应用

(3)机器学习入门_第3张图片

 1.3基本类型

(3)机器学习入门_第4张图片

 分为:有监督学习、无监督学习、强化学习

(3)机器学习入门_第5张图片

 有监督学习:有具体的目标任务,比如过滤垃圾邮件,将y分为两类0或1,表示是否为垃圾文件,预测直接将其进行标记分类。

(3)机器学习入门_第6张图片

 

无监督学习:无具体的目标任务,比如主成分分析,聚类分析。

(28条消息) 机器学习两种方法——监督学习和无监督学习(通俗理解)_风翼冰舟的博客-CSDN博客

2机器学习流程

2.1流程

0.收集数据

1.对数据集进行预处理

包含数据预处理及特征提取

2.划分数据集(训练集、测试集、验证集)

3.训练测试模型

4.评估模型

5 优化模型

(3)机器学习入门_第7张图片

 

2.2模型选择

(3)机器学习入门_第8张图片

 

•如果目标变量是数值型变量,建立回归方程(多变量数学表达式)

•如果目标变量是类别型变量,建立分类模型(类概率估计模型)

3初步了解sklearn库

•Sklearn是Python提供的非常强大的机器学习库,节省编写代码的时间减少代码量 •Sklearn 提供监督和无监督学习的方法

scikit-learn中文社区

•Sklearn 包含两大类函数:估计器(Estimator)和转化器(Transformer)

估计器(estimator)是⼀个重要的⾓⾊,分类和回归模型都属于estimator,是实现算法的API,使用时调用。

估计器的流程:数据划分为训练集和测试集。训练集包括x_train、y_train, 调⽤fit传⼊x_train、y_train,;模型建⽴好之后查看预测数据准确与否,输⼊测试集的数据x_test、y_test, 调⽤predict(x_test), 每个算法都包括score⽅法,查看预测的准确性 score(x_test,y_test),

(3)机器学习入门_第9张图片

(3)机器学习入门_第10张图片

(3)机器学习入门_第11张图片

 

你可能感兴趣的:(人工智能,python)