Pandas学习

Pandas学习

一.Series序列及索引

1.1位置索引

索引范围为0-n-1

import pandas as pd
data =['李广地', '张蕴訇', '王鹏']
s = pd.Series(data=data, index=[0, 1, 2])
print(s)
print(type(s))
print(s[0])

结果为

0    李广地
1    张蕴訇
2     王鹏
dtype: object
<class 'pandas.core.series.Series'>
李广地

1.2标签索引

import pandas as pd
data =[90, 95, 97]
index = ['李广地', '张蕴訇', '王鹏']
s =pd.Series(data=data,index=index)
print(s)
print(s['李广地'])
print(s[['李广地', '张蕴訇']])

输出结果为:

李广地    90
张蕴訇    95
王鹏     97
dtype: int64
90
李广地    90
张蕴訇    95
dtype: int64

1.3 切片索引

1.3.1位置索引含头不含尾

import pandas as pd
data =['李广地', '张蕴訇', '王鹏']
s = pd.Series(data=data, index=[0, 1, 2])
print(s)
print(s[0:2:1])#【】中第一位表开头,第二位结尾,第三位表示步长

结果为:

0    李广地
1    张蕴訇
2     王鹏
dtype: object
0    李广地
1    张蕴訇
dtype: object

1.3.2标签索引含头含尾

import pandas as pd
data =[90, 95, 97]
index = ['李广地', '张蕴訇', '王鹏']
s =pd.Series(data=data,index=index)
print(s)
print(s['李广地':'王鹏'])

结果为:

李广地    90
张蕴訇    95
王鹏     97
dtype: int64
李广地    90
张蕴訇    95
王鹏     97
dtype: int64

1.4获取Series的索引和值

  • 获取索引s.index
  • 获取值s.values
import pandas as pd
data =[90, 95, 97]
index = ['李广地', '张蕴訇', '王鹏']
s =pd.Series(data=data,index=index)
print(s.index)
print(list(s.index))
print(s.values)

输出结果为:

Index(['李广地', '张蕴訇', '王鹏'], dtype='object')
['李广地', '张蕴訇', '王鹏']
[90 95 97]

二.DataFrame对象

  1. DataFrame对象是Pandas库中的一种数据结构,类似于二维表,由行和列组成
  2. 与Series一样支持多种数据类型
  3. 创建Dataframe对象
  4. pd.DataFrame(data,index,columns,dtype)
    index 行索引
    columns 列索引
    dtype是数据类型

2.1以列表方式创建

import pandas as pd
data =[['小太阳',320.4,100], ['鼠标', 150.2,60],['小刀',1.2,5200]]
columns =['名称','单价','数量']
df=pd.DataFrame(data=data,columns=columns)
print(df)
print(type(df))

结果

    名称     单价    数量
0  小太阳  320.4   100
1   鼠标  150.2    60
2   小刀    1.2  5200
<class 'pandas.core.frame.DataFrame'>

2.2以字典方式创建

import pandas as pd
data ={'名称':['小太阳',320.4,100],'单价': ['鼠标', 150.2,60],'数量':['小刀',1.2,5200],'公司名称':'超市'}
df=pd.DataFrame(data=data)
print(df)
print(type(df))

结果为:

      名称     单价    数量 公司名称
0    小太阳     鼠标    小刀   超市
1  320.4  150.2   1.2   超市
2    100     60  5200   超市
<class 'pandas.core.frame.DataFrame'>

注:列表长度要一致

import pandas as pd
data =[['小太阳',320.4,100], ['鼠标', 150.2,60],['小刀',1.2,5200]]
columns =['名称','单价','数量']
df=pd.DataFrame(data=data,columns=columns)
print(df)
print('查看所有元素的值\n', df.values)
print('查看所有元素的类型\n', df.dtypes)
print('查看所有行名称\n',list(df.index))
#修改行索引的值
df.index=[1,2,3]
print(df)
print('查看列索引', df.columns)
#修改列索引
df.columns=['商品名称','最新单价','实时数量']
#行列数据的转换
pd.set_option('display.unicode.east_asian_width', True)#规整 格式
new = df.T
print(new)
print('查看前n条数据\n',df.head(1))
print('查看后n条数据',df.tail(1))
#查看行和列shape[0]表示行shape[1]表示列
print('行', df.shape[0], '列', df.shape[1])
print('查看索引、数据类型、内存信息', df.info)

结果

    名称     单价    数量
0  小太阳  320.4   100
1   鼠标  150.2    60
2   小刀    1.2  5200
查看所有元素的值
 [['小太阳' 320.4 100]
 ['鼠标' 150.2 60]
 ['小刀' 1.2 5200]]
查看所有元素的类型
 名称     object
单价    float64
数量      int64
dtype: object
查看所有行名称
 [0, 1, 2]
    名称     单价    数量
1  小太阳  320.4   100
2   鼠标  150.2    60
3   小刀    1.2  5200
查看列索引 Index(['名称', '单价', '数量'], dtype='object')
               1      2     3
商品名称  小太阳   鼠标  小刀
最新单价   320.4  150.2   1.2
实时数量     100     60  5200
查看前n条数据
   商品名称  最新单价  实时数量
1   小太阳     320.4       100
查看后n条数据   商品名称  最新单价  实时数量
3     小刀       1.2      520033
查看索引、数据类型、内存信息 <bound method DataFrame.info of   商品名称  最新单价  实时数量
1   小太阳     320.4       100
2     鼠标     150.2        60
3     小刀       1.2      5200>

Pandas学习_第1张图片
未完待续~

你可能感兴趣的:(pandas,学习,python)