pandas中文文档之十分钟入门pandas

pandas 是基于Numpy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。(摘自百度百科)
由于pandas的中文文档还在翻译中,因此写了此篇博客方便大家学习
参考文档:https://www.pypandas.cn/document/10min.html
1,导入相关模块

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

2,对象创建
通过一个列表创建一个Series(一维数组)
s = pd.Series([1,3,5,np.nan,6,8])
通过numpy数组,日期做索引以及标签列建立DataFrame

dates = pd.date_range('20130101', periods=6)
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))
df2 = pd.DataFrame({ 'A' : 1.,
                              'B' : pd.Timestamp('20130102'),
                              'C' : pd.Series(1,index=list(range(4)),dtype='float32'),
                              'D' : np.array([3] * 4,dtype='int32'),
                              'E' : pd.Categorical(["test","train","test","train"]),
                              'F' : 'foo' })

你可能感兴趣的:(pandas中文文档之十分钟入门pandas)