pandas-新手使用教程

Pandas 是 Python 语言的一个扩展程序库,用于数据分析。下面将针对该模块进行讲解。

一、导入模块

导入pandas模块

import pandas as pd

二、导入数据

常见用法

# 创建数据框
pd.DataFrame()
# 从CSV⽂件导⼊数据
pd.read_csv()
# 从excel⽂件导⼊数据
pd.read_excel()
# 从html⽂件导⼊数据
pd.read_html()
# 从json⽂件导⼊数据
pd.read_json()
# 从sql数据库⽂件导⼊数据
pd.read_sql()
# 从table⽂件导⼊数据
pd.read_table()
# 从xml⽂件导⼊数据
pd.read_xml()

三、查看数据

常见用法

# 查看表格头部的数据,默认是5,可设置参数n
data.head(n) 
# 查看表格尾部的数据,默认是5,可设置参数n
data.tail(n) 
# 查看⾏数和列数
data.shape() 
# 查看索引、数据类型和内存信息
data.info() 
# 查看字段(⾸⾏)名称
data.columns() 
# 查看数值型列的汇总统计
data.describe() 
# 查看Series对象的唯⼀值和计数
data.value_counts() 
# 查看DataFrame对象中每⼀列的唯⼀值和计数
data.apply(pd.Series.value_counts) 
# 查看是否有缺失值
data.isnull().any() 

你可能感兴趣的:(python数据分析,python,数据分析,数据挖掘)