Pandas 是 Python 语言的一个扩展程序库,用于数据分析。下面将针对该模块进行讲解。
导入pandas模块
import pandas as pd
常见用法
# 创建数据框
pd.DataFrame()
# 从CSV⽂件导⼊数据
pd.read_csv()
# 从excel⽂件导⼊数据
pd.read_excel()
# 从html⽂件导⼊数据
pd.read_html()
# 从json⽂件导⼊数据
pd.read_json()
# 从sql数据库⽂件导⼊数据
pd.read_sql()
# 从table⽂件导⼊数据
pd.read_table()
# 从xml⽂件导⼊数据
pd.read_xml()
常见用法
# 查看表格头部的数据,默认是5,可设置参数n
data.head(n)
# 查看表格尾部的数据,默认是5,可设置参数n
data.tail(n)
# 查看⾏数和列数
data.shape()
# 查看索引、数据类型和内存信息
data.info()
# 查看字段(⾸⾏)名称
data.columns()
# 查看数值型列的汇总统计
data.describe()
# 查看Series对象的唯⼀值和计数
data.value_counts()
# 查看DataFrame对象中每⼀列的唯⼀值和计数
data.apply(pd.Series.value_counts)
# 查看是否有缺失值
data.isnull().any()