Python数据分析——Pandas 入门

该部分为学习笔记,具体内容详见:《利用Python进行数据分析》一书

import pandas as pd
from pandas import Series, DataFrame

Python数据分析——Pandas 入门

  • 一、Pandas数据结构介绍
    • 1. Series
    • 2. DataFrame
    • 3. 索引对象
  • 二、基本功能
    • 1. 重建索引
    • 2. 轴向上删除条目
    • 3. 索引、选择与过滤
    • 4. 整数索引
    • 5. 算数和数据对齐
    • 6. 函数应用和映射
    • 7. 排序和排名
    • 8. 含有重复标签的轴索引
  • 三、描述性统计的概述与计算
    • 1. 相关性和协方差
    • 2. 唯一值、计数和成员属性

一、Pandas数据结构介绍

1. Series

Series 是一种一维的数组型对象,它包含了一个值序列(与 NumPy 中的类型相似),并且包含了数据标签,称为索引(index)。最简单的序列可以仅仅由一个数组形成:

2. DataFrame

DataFrame 表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame 既有行索引也有列索引,它可以被视为一个共享相同索引的 Series 的字典。在 DataFrame 中,数据呗存储为一个以上的二维块,而不是列表、字典或其他一维数组的集合。

3. 索引对象

Pandas 中的索引对象是用于存储轴标签和其他元数据的(例如轴名称或标签)。在构造 Series 或 DataFrame 时,你所使用的任意数组或标签序列都可以在内部转换为索引对象。

二、基本功能

1. 重建索引

reindex 方法

2. 轴向上删除条目

drop 方法会返回一个含有指示值或轴向上删除值的新对象

3. 索引、选择与过滤

4. 整数索引

5. 算数和数据对齐

6. 函数应用和映射

7. 排序和排名

8. 含有重复标签的轴索引

三、描述性统计的概述与计算

1. 相关性和协方差

2. 唯一值、计数和成员属性

你可能感兴趣的:(Python,数据分析,python,数据挖掘,1024程序员节)