Python数据挖掘与机器学习实战读书笔记—机器学习基础

几个概念:
人工智能:智能机器,如计算机做识别、判断、证明、学习和问题求解等思维活动。
机器学习:人工智能的分支、核心。科学成分重。
数据挖掘:从海量数据中获取有用数据。技术成分重。

-机器学习概述
什么是机器学习?
通过历史数据的训练产生模型,输入新的数据到模型中,模型可以预测出未知的属性。

-机器学习发展历程
第一阶段:通过软件编程操控计算机完成逻辑推理功能,机器未能智能。缺乏大量先验知识。
第二阶段:利用自身思维提取的规则教计算机执行决策,如专家系统。缺乏知识。
第三阶段:热门学科并被应用,算法涌现,其他分支:模式识别、数据挖掘、生物信息学和自动驾驶。

-机器学习分类及其应用
机器学习的分类
1.监督学习
什么是监督学习?
监督学习是指通过大量标记数据训练机器,修改模型中的参数,使其达到要求的过程。
常见的监督学习算法:分类和回归。
分类:将数据分类别。预测结果是离散的。
回归:将数据归到一条线上,即离散数据拟合成曲线。预测结果是连续的。
2.无监督学习
什么是无监督学习?
无监督学习是指通过没有标记的数据训练机器,机器从数据中探索并推断出潜在联系的过程。
常见无监督学习:聚类和降维。
聚类:事先不知数据类别,通过分析数据特征将不同数据分开,把相似数据聚为一类。
3.强化学习
机器行动正确,给予正激励;机器行动错误,给予惩罚。强化学习,就是指机器在这种情况下学习如何达到激励最大化的过程,即错误中学习,找规律,学会达到目的的过程。
4.深度学习
什么是深度学习?
是一种实现机器学习的技术,人工智能的核心。旨在研究如何从数据中自动地提取多层特征表示。

机器学习的应用;
1.图像识别
2.语音识别
3.自然语言处理
4.医疗保健

开发机器学习步骤
1.收集数据:如爬虫
2.准备输入数据:格式符合要求
3.分析输入数据:异常值,降维
4.训练算法:使用有监督还是无监督
5.测试算法:
监督学习:知用于评估算法的目标变量值
无监督学习:通过评测手段检测算法成功率
6.使用算法:算法转应用

-python常用开发工具
1.IDLE
2.IPython
3.PyCharm
4.Jupyter Notebook
5.Anaconda&Spyder

你可能感兴趣的:(机器学习与数据挖掘)