Pandas做数据分析

《pandas 教程》

入门 pandas

pandas 中文简介

安装及环境搭建

快速入门

数据结构

Numpy 基础用法

生成数据对象

序列 Series

数据框 DataFrame

数据类型 dtypes

基础功能

pandas 功能介绍

文件读取和导出

索引 Indexing

数据的信息

数学统计

求值计算

查询筛选数据

数据类型转换

数据排序

数据添加修改

删除数据

数据迭代

函数应用

多层索引 MultiIndex

多层次索引 MultiIndex

创建分层索引对象

多层索引对象的操作

多层索引数据查询

多层索引的分组

数据合并

数据合并场景和操作

数据连接 concat

多文件数据合并

数据追加 df.append

连接数据 pd.merge

时序数据合并

逐元素合并

数据对比

数据清洗

数据清洗操作

缺失值的判定

缺失值参与计算

缺失值填充

缺失值删除

插值填充

数据替换

缺失值 NA 标量

重复值

分组聚合

pandas 的聚合分组

Group By 基础使用

分组对象及创建

分组聚合统计

分组应用函数

分组对象的操作

分组器 Grouper

数据分箱

数据重塑透视

pandas 重塑透视

数据透视 Pivot Table

数据堆叠 Stack

交叉表 Crosstab

数据融合 Melt

虚拟变量/哑变量

数据转置 df.T

因子化(枚举化)值

爆炸序列

转为 NumPy ndarray

时间日期

pandas 时间日期

时间基本概念

时间序列数据类型

固定时间

时间的属性操作

时间类型转换

时间范围

时间序列索引

时序数据方法

时间偏移

时间偏移对象

序列、索引和时间偏移

自定义工作日

时间偏移量别名

锚定偏移

假期日历

时间增量/时长

时长频率单位转换

时长的属性

时长索引

时间跨度

周期的操作

周期类型及转换

周期索引

超出时间戳范围时间

时间重采样

时间类型之间的转换

时区

区间间隔 Interval

文本处理

pandas 文本处理

文本数据类型

字符的操作方法

文本分割

文本替换

文本连接

文本查询匹配

文本常用方法

样式

pandas 样式

内置样式

显示格式

样式配置操作

样式应用函数

带样式文件的导出

可视化

pandas 可视化

Plot 绘图

Plotting 绘图模块

使用 Bokeh 可视化

matplotlib pyplot 绘图功能

使用 Plotly 可视化

Pyecharts 可视化绘图库

分类数据

pandas 分类数据

分类数据创建

分类数据的使用

分类数据的顺序

分类数据的操作

分类数据处理

类别数据的读取

窗口计算

pandas 窗口计算

移动窗口函数 rolling

时间类型移动窗口

扩展窗口函数 expanding

函数 api

pandas.read_csv

pandas.read_excel

方法函数详细介绍

相关配置

异常和警告

函数 api 大全

生成测试数据

附录

超大数据处理

链式方法

pandas 实战案例集

pandas 速查手册

pandas 简明课程

教程更新日志

你可能感兴趣的:(Pandas做数据分析)