Python Pandas用法入门

Pandas入门笔记

  • 简介
  • 数据结构
  • 语法入门
    • 生成对象
      • 生成一维数组series
      • 生成二维DataFrame
    • 探索数据
    • 获取数据

简介

首先pandas是基于numpy进行开发的。

Pandas 的主要数据结构是 Series(一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

学过机器学习和深度学习的小伙伴肯定对它都不陌生,为了加深对pandas库的认识和运用,在这里讲它的一些简单用法阐述,也算是一种笔记吧。

数据结构

首先我们知道pandas的数据结构只有两种:series和dataframe——分别对应一维数组和二维异构表单当然它们都是可以加标签的

注意:我们在使用pandas处理数据的时候,一般pandas都会自动创建一个copy对象,来防止对原对象的直接修改


语法入门

这里列出pandas中最常用的几种方法,来帮助小伙伴们快速上手pandas


生成对象

生成一维数组series

我们可以这样生成一个一维数组:

a = pd.Series([])

我们从jupyter notebook中创建一个一维数组并打印它

Python Pandas用法入门_第1张图片

生成二维DataFrame

与一维数组相同,我们使用DataFrame类来创建对象

df = pd.DataFrame()

这里我们展示两种创建的方法:
通过参数生成、通过series字典对象生成
Python Pandas用法入门_第2张图片

探索数据

一般我们有以下方法:

  • head() : 查看数据的头部
  • tail() : 查看数据的尾部(两个括号中可以指定查看的行数,默认为5)
  • index:查看索引(列标签)
  • colums:查看行标签
  • describe():查看数据的统计摘要(当数据很大时非常管用)
  • T:转置
  • sort_index():按照索引排序
  • sort_values():按照值排序

获取数据

  • [ ]:通过columns选择单列(b.A等价于b[‘A’])

示例:
Python Pandas用法入门_第3张图片


  • [ : ]:使用切片引用行

示例:
Python Pandas用法入门_第4张图片


  • loc[ , ]:通过指定行列来指定输出

示例:
Python Pandas用法入门_第5张图片


  • isin():筛选指定值
  • isna():筛选空值

##未完待续

你可能感兴趣的:(python,学习笔记,python,数据分析,pandas)