Python之pandas库用法

Pandas是一个流行的Python数据分析库,用于处理和操作数据。Pandas提供了一组灵活且高效的数据结构,使得数据操作变得更加简单和快速。下面将介绍一些常见的Pandas库用法。

1. 创建DataFrame
Pandas中最基本的数据结构是DataFrame,它类似于电子表格或SQL表,具有行和列的结构,每个列可以包含不同类型的数据。要创建DataFrame,可以使用Pandas中的read_csv或read_excel函数,或手动创建DataFrame。
例如,以下代码可以从一个名为“data.csv”的CSV文件中读取数据,并将其保存在一个名为“df”的变量里:

```
import pandas as pd
df = pd.read_csv('data.csv')
```

2. 查看数据
要查看DataFrame中的数据,可以使用head()或tail() 函数来查看前几行或后几行数据。默认情况下,head 和 tail 函数会显示前5行或后5行数据。
例如,以下代码将打印DataFrame“df”的前5行数据:

```
print(df.head())
```

3. 数据选择和筛选
可以通过使用 [] 或 loc 和 iloc 函数来选择和筛选DataFrame中的数据,其中 [] 适用于列筛选,loc 和 iloc 适用于行或列筛选。以下是一些例子:

- 使用[]来选择特定列的数据:

```
df['column_name']
```<

你可能感兴趣的:(python库用法与实践,python)