pandas数据结构

文章目录

    • Series
      • 创建series对象
      • Series对象的属性
    • DataFrame
      • 创建DataFrame对象

Python 在数据处理上独步天下:代码灵活、开发快速;尤其是 Python 的 Pandas 包,无论是在数据分析领域、还是大数据开发场景,都具有显著的优势。

Series

Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。
Series 由索引(index)和列组成,函数如下:

pandas.Series(data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)。

  • index:数据索引标签,如果不指定,默认从 0 开始。

  • dtype:数据类型,默认会自己判断。

  • name:设置名称。

  • copy:拷贝数据,默认为 False。

创建series对象

# 创建series对象
import pandas as pd
ser_obj = pd.Series([1,2,3,4,5])
print(ser_obj)
'''
0    1
1    2
2    3
3    4
4    5
dtype: int64'''
# 创建series对象指定索引
ser_obj = pd.Series([1,2,3,4,5],index=(['a','b','c','d','e']))
print(ser_obj)
'''
a    1
b    2
c    3
d    4
e    5
dtype: int64
'''

# 通过字典创建series对象
year_data = {2001:17,2002:14,2003:12}
ser_obj2 = pd.Series(year_data)
print(ser_obj2)
'''
2001    17
2002    14
2003    12
dtype: int64
''' 

Series对象的属性

print(ser_obj2.index)
'''
Int64Index([2001, 2002, 2003], dtype='int64')
'''
print(ser_obj2.values)
'''
[17 14 12]
'''
print(ser_obj2[2001])
'''
17
'''

DataFrame

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
pandas数据结构_第1张图片
DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。

  • index:索引值,或者可以称为行标签。

  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。

  • dtype:数据类型。

  • copy:拷贝数据,默认为 False。

  • Pandas DataFrame 是一个二维的数组结构,类似二维数组。

创建DataFrame对象

Pandas的DataFrame类对象可以使用以下构造方法创建:
pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)

import numpy as np
import pandas as pd
demo_arr = np.array([['a','b','c'],['d','e','f']]) # 创建数组
df_obj = pd.DataFrame(demo_arr) # 基于数组创建DataFrame对象
print(df_obj)
''' 
	0	1	2
0	a	b	c
1	d	e	f
''' 
df_obj = pd.DataFrame(demo_arr,index=['小明','小红'],columns=['No1','No2','No3'])

你可能感兴趣的:(数据分析,pandas,数据结构,python)