量化交易平台Quantopian讲座(4)—pandas之DataFrame

这篇我们继续来介绍pandas的数据结构,上篇里提到的Series为一维数组,而此篇的主角DataFrame则为二维数组,它也同样可以存放多种类型的数据。

创建DataFrame

pandas提供了两种创建DataFrame的途径

  1. pandas.DataFrame()函数
    可以由Python字典或NumPy的ndarray创建DataFrame


    量化交易平台Quantopian讲座(4)—pandas之DataFrame_第1张图片
    DataFrame函数
  2. pandas.concat() 函数
    可以将一组Series组合为一个DataFrame,也支持多个DataFrame组合。


    量化交易平台Quantopian讲座(4)—pandas之DataFrame_第2张图片
    Concat函数

DataFrame有两个重要属性

  1. index 属性
    索引值,与Series的index属性类似
  2. columns属性
    列名,纵向Series的名称,为DataFrame提供了第二个维度


    量化交易平台Quantopian讲座(4)—pandas之DataFrame_第3张图片
    index与columns属性

获取DataFrame中元素

获取元素方式与Series基本一致,但有一点你必须时刻牢记于心,DataFrame是二维的。


量化交易平台Quantopian讲座(4)—pandas之DataFrame_第4张图片
获取DataFrame元素

过滤DataFrame中元素

使用loc函数加上普通比较符就可以方便的对DataFrame中的元素进行过滤


量化交易平台Quantopian讲座(4)—pandas之DataFrame_第5张图片
过滤元素

列操作

DataFrame支持列的新增与删除


量化交易平台Quantopian讲座(4)—pandas之DataFrame_第6张图片
列操作

DataFrame组合

可以使用concat()函数,组合两个DataFrame


量化交易平台Quantopian讲座(4)—pandas之DataFrame_第7张图片
组合DataFrame

绘图

使用matplotlib可进行方便的绘图


量化交易平台Quantopian讲座(4)—pandas之DataFrame_第8张图片
绘图

统计方法

DataFrame已经内置了统计学方法,可以方便地获取统计数据,但与Series不同,需要指定统计的维度,通过行还是列进行统计。

量化交易平台Quantopian讲座(4)—pandas之DataFrame_第9张图片
Paste_Image.png

标量运算

DataFrame支持标量,我们可以对其中所有元素进行等比例放大或同时加减某值。


量化交易平台Quantopian讲座(4)—pandas之DataFrame_第10张图片
支持标量运算

到这里,pandas中Series和DataFrame这两个数据结构就已经介绍完了,只是介绍了常见的一些用法,更高级的应用大家可以自行去查官网的文档。

谢谢阅读,欢迎订阅!

你可能感兴趣的:(量化交易平台Quantopian讲座(4)—pandas之DataFrame)