Python Pandas库的学习(一)

今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习

接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要

Pandas库是在Numpy库上进行了封装,相当于高级Numpy库

在数据处理方面,运用Pandas库,也是非常多的,废话不多说

先说第一个函数,read_csv,读取CSV数据文件

import pandas
food = pandas.read_csv("food_info.csv")
print(type(food))
print(food.dtypes)

Python Pandas库的学习(一)_第1张图片

这里我打印了一下Type,可以看到类型为DataFrame,这个类型也是Pandas中,的核心类型

 下面我打印了一下,dtypes。可以看到,下面也是在pandas中非常常用的几种类型。

int64,float64这两种就不用多说了。但是会发现一个新的类型。object类型

这个类型就相当于str类型,也就是字符串类型值。

然后接着,我们在运行一个函数

food.head()

这个函数的作用是,将我们数据中的,前5行打印出来。结果如下,

Python Pandas库的学习(一)_第2张图片

那么如果我们想让数据显示多条怎么处理呢?

food.head(8),只需要在这个函数中添加参数即可

Python Pandas库的学习(一)_第3张图片

可以显示前面的,那么肯定可以显示后面的,

food.tail(4)

这个方法相当于显示最后面的4条数据

Python Pandas库的学习(一)_第4张图片

如图所示,显示出最后的4行数据,可以看到跟数据中的数据做下对比,是一样的

那么如果获取到数据表中,每一列的列名指标呢?

print(food.columns)

使用这个方便,可以或得到每个列表示的列名,结果是一个list,如下图

Python Pandas库的学习(一)_第5张图片

还有一个要说的就是,如果看这个表的维度呢?我们直接在讲Numpy的时候讲过,如果查看矩阵的维度,用法一样,shape方法

print(food.shape)

可以看到如下结果,表示,当前数据,有8618 个样本,36个指标,36列

我们如何从pandas中获取到某个数据呢?使用如下方法

print(food.loc[0])

Python Pandas库的学习(一)_第6张图片

这里我们可以看到,我们将第一个样本的全部值取出来了。对比结果。

那么如果我们想去单独某条数据,那么只需要修改[0]到你需要的数据上即可。这里下标从0开始。

大小超过数据的样本集,会直接报错。

pandas中常用的数据类型如下

object 就是我们常说的字符串类型

int 整型

float 浮点型

bool 布尔型

今天就先讲到这里我,感谢大家的阅读,谢谢!!

 

你可能感兴趣的:(Python,Pandas)