3、建立你的第一个机器学习模型

建造你的第一个模型,万岁!

本课程所需数据集夸克网盘下载链接:https://pan.quark.cn/s/9b4e9a1246b2
提取码:uDzP

文章目录

  • 1、为建模选择数据
    • 1.1选择预测目标
  • 2、选择“特征”
  • 3、构建模型

1、为建模选择数据

您的数据集中有太多的变量,以至于您无法理解,甚至无法很好地打印出来。你怎样才能把这么庞大的数据压缩成你能理解的东西呢?

我们先用我们的直觉挑选一些变量。稍后的课程将向您展示数据统计技术,以自动排列变量的优先级。

要选择变量/列,我们需要查看数据集中所有列的列表。这是通过 DataFramecolumn 属性完成的(下面的代码底线)

In [1]:

import pandas as pd

melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
melbourne_data = pd.read_csv(melbourne_file_path) 
melbourne_data.columns

Out[1]:

Index(['Suburb', 'Address', 'Rooms', 'Type', 'Price', 'Method', 'SellerG',
       'Date', 'Distance', 'Postcode', 'Bedroom2', 'Bathroom', 'Car',
       'Landsize', 'BuildingArea', 'YearBuilt', 'CouncilArea', 

你可能感兴趣的:(从零开始的机器学习导论,机器学习,人工智能)