2、机器学习基础数据探索

加载并理解您的数据。

本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP

文章目录

  • 1、使用Pandas了解你的数据
  • 2、解释数据描述

1、使用Pandas了解你的数据

任何机器学习项目的第一步都是熟悉数据。您将使用Pandas库进行此操作。Pandas是数据科学家用来探索和操纵数据的主要工具。大多数人在代码中将panda缩写为pd

In [1]:

import pandas as pd

Pandas库中最重要的部分是DataFrame。DataFrame包含您可能认为是表的数据类型。这类似于Excel中的工作表或SQL数据库中的表。

Pandas有强大的方法来处理你想用这种类型的数据做的大多数事情。

举个例子,我们来看看澳大利亚墨尔本的房价数据。在实践练习中,您将把同样的过程应用于一个新的数据集,该数据集包含爱荷华州的房价。

示例(墨尔本)数据位于文件路径melbourne housing snapshot/melb_data.csv

我们使用以下命令加载和浏览数据:

In [2]:

#将文

你可能感兴趣的:(从零开始的机器学习导论,机器学习,人工智能)