python机器学习(一)——机器学习的含义以及数据集的构成

本文内容根据黑马程序员3天快速入门python机器学习所写,详情点击链接,可观看相关视频

1.什么是机器学习

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

例如我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。

从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的规律),从而使机器拥有识别猫和狗的能力。

从数据(房屋的各种信息)中自动分析获得模型(判断房屋价格的规律),从而使机器拥有预测房屋价格的能力。

从历史数据当中获得规律?那这些历史数据应该采用怎样的格式?

2.数据集的构成

数据集 = 特征值+目标值

(例如下图数据集的特征值为房子面积、房子位置、房子楼层、房子朝向这三列)

房子面积 房子位置 房子楼层 房子朝向 目标值
数据1 80 9 3 0 80
数据2 100 9 5 1 120
数据3 80 10 3 0 100

注:对于每一行数据我们可以称之为样本

       有些数据集可以没有目标值

而如上文的分析猫狗的模型,里面数据集的特征值为:猫/狗的图片。特征值为:猫/狗的类型

你可能感兴趣的:(python机器学习,机器学习,人工智能)