大家好,这里是为代码封神的封神榜(有点吹牛皮了,哈哈)。还是新人初来乍到,希望大家多多指教。
本系列呢,是为大家带来的是Python数据分析,希望大家能够喜欢,多多支持。
从PyPi安装:
pip install Pandas
复制代码
Pandas 适用于处理与Excel表类似的二维表格数据
堆数 | 名称 | 描述 |
---|---|---|
1 | Series | 代表钱的数据类型相同的数组 |
2 | DataFrame | 带标签的大小可变的不同数据类型的表格 |
Pandas 的主要数据结构是 Series(一维数据,类似Python中的数组)与 DataFrame(二维数据,类似excel表)。
维数 | 名称 | 描述 |
---|---|---|
1 | Series | 带标签的数据类型相同的数组 |
2 | DataFrame | 带标签的大小可变的不同数据类型的表格 |
Series是带标签的一维数组。标签统称为索引。
pd.Series(data, index=index)
复制代码
data可以是字典、数组、字面量。
>>>import pandas as pd
# data为字典
>>>data = {"name": "ridingroad", "age": 21}
>>>pd.Series(data)
name ridingroad
age 21
dtype: object
# 字典为数组
>>>data = [1,2,3,4]
>>>pd.Series(data)
0 1
1 2
2 3
3 4
dtype: int64
# data为字面量
>>>data = 5
>>>pd.Series(data)
0 5
dtype: int64
# data为字面量,Series按索引(轴标签重复该字面量)
>>>pd.Series(data, index=['a', 'b', 'c'])
a 5
b 5
c 5
dtype: int64
复制代码
>>>data = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
>>>data
a 1
b 2
c 3
d 4
dtype: int64
# 按索引取值
>>>data[0]
1
>>>data[2]
3
# 按标签取值
>>>data['a']
1
>>>'a' in data
True
# Series.get(key) 当key不存在,返回None
>>>data.get('5')
# 支持大多数Numpy的数组的方法
>>>data + data
a 2
b 4
c 6
d 8
dtype: int64
# 支持大多数Numpy的数组的方法
>>>data[data > data.median()]
c 3
d 4
dtype: int64
复制代码
在生成DataFrame的时候可以指定列标签(columns)和行索引(idnex)。 用字典生成DataFrame:
>>>pd.DataFrame({"0": [1, 2, 3, 4], "1": [5, 6, 7, 8]})
0 1
0 1 5
1 2 6
2 3 7
3 4 8
# 指定行索引
>>>pd.DataFrame({"0": [1, 2, 3, 4], "1": [5, 6, 7, 8]}, index=['first', 'second', 'third', 'fourth'])
0 1
first 1 5
second 2 6
third 3 7
fourth 4 8
复制代码
DataFrame.index和DataFrame.columns用来分别访问DataFrame的行和列的标签。
>>>data = pd.DataFrame({"0": [1, 2, 3, 4], "1": [5, 6, 7, 8]}, index=['first', 'second', 'third', 'fourth'])
>>>data.index
Index(['first', 'second', 'third', 'fourth'], dtype='object')
>>>data.columns
Index(['0', '1'], dtype='object')