1.1 初始Series

1.1 什么是Series?

​ 基本pandas的常用的基本数据结构有两种:Series与DataFrame。

​ Series对象的本质是由两个数组构成的,一个数组构成对象的键(index),一个数组构成对象的值(value);采用index:value的方式组织数据。

1.2 创建一个Series

import pandas as pd

series = pd.Series([1, 2, 3, 4])
print(type(series))

# 

print(series)

"""
0    1
1    2
2    3
3    4
dtype: int64
"""

1.3 指定series的索引,指定index,若无指定则默认采用正序的索引

import pandas as pd

series01 = pd.Series(data=[1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
print(series01)

"""
a    1
b    2
c    3
d    4
dtype: int64
"""

1.3 通过字典来创建series,key为索引,value为值

import pandas as pd

series02 = pd.Series({
     'name': 'lily', 'age': 18, 'sex': 'man'})

# print(series02)

"""
name    lily
age       18
sex      man
dtype: object
"""

1.4 关于数据类型的问题

import pandas as pd

series03 = pd.Series(data={
     'a': 1}, index=['a', 'b', 'c'])

# print(series03)

"""
a    1.0
b    NaN
c    NaN
dtype: float64
"""
# numpy和pandas中的NaN为float类型,pandas会根据数据类型更改series的dtype类型

1.5 Series的切片与索引

series02.get('age')  	# 根据索引或者位置来取数据
series03[:2]  			# 切片取数据
series[series >= 2] 	# 布尔索引,查找一维数组中大于等于1的值<只适用于数值型数组>
series02.keys()  		# 返回series的所有索引
series02.index  		# 获取series的所有索引
series02.values  		# 获取所有series中的所有值

你可能感兴趣的:(基于python的数据分析,python,pandas,数据分析)