anaconda环境(自带pandas)。如果是pycharm,在命令窗口输入 pip install pandas 自动安装。
(1) Series, 是一种类似于一维数组的对象,由一组数据和一组数据标签(索引值)组成。
(2)DataFrame,是由一组数据和一对索引(行索引和列索引)组成的表格型数据结构,常用于表达二维数据,同时也可以表达多维数据,行列索引有自动索引和自定义索引。
pandas.read_excel( ' 文件路径 ',sheet_name = ' 指定工作表名称或索引,默认第一个工作表 ' )
注:注意绝对路径和相对路径的区别。相对路径:基于 .ipynb_checkpoints 文件所在为相对 路径起始点。 必要时加上 r ,路径则不会报错。
pandas.DataFrame()
eg:pandas.DataFrame({'a':[1,2,3],'b':[4,5,6]} , index = [101,102,103] )
使用index改变索引序列
(1)查看形状
sheet1_data.shape --> 返回一个行列数组
(2)查看 DataFrame 数据类型中的 列 的数据
sheet1_data.dtypes
(3) 查看 行索引
sheet1_data.index
(4) 查看 列索引
sheet1_data.columns
(5) 查看 每一行对应的数值
sheet1_data.values
(6) 查看 一共有多少个数据
sheet1_data.size --> 返回 行数*列数
(7)查看 前五项
sheet1_data.head() --> 后面可以添加参数,显示想要展示多少行
(8) 查看 部分列数据
sheet1_data[ ' 列参数 ' ]
sheet1_data[ ' 列参数 ' ] .head()
(9)查看 多列数据访问
sheet1_data[ [ ' 列参数 ' ,' 列参数 ' ] ] .head()
注: 此时必须是二维的列表才能运行
(10) 通过 布尔类型 控制显示(默认行显示)
sheet1_data [ [ True , False , True ] ] --> True 显示
(11)筛选出符合参数的行信息
sheet1_data [ sheet1_data [ ' 参数 ' ] == 参数 ] .head()
(12) 行和列数据 的访问
<1> 使用 loc 函数(二维列表作为参数,字段名称进行访问)
sheet1_data.loc[ [ 数字参数 , 数字参数 , 数字参数 ] , [ 名称参数 , 名称参数 ] ]
<2> 使用 iloc 函数(索引数字进行访问)
sheet1_data.iloc [ [ 0 , 1 , 2 , 3 ] , [ 1 , 2 ] ]
注: 可以使用 :(冒号) 表示一个范围类的数据,此时不用加中括号
<3> 直接访问
sheet1_data [ 列参数 , 列参数 ] [ 行参数 , 行参数 ]
(13)多个表格的数据合并(数据格式保证一致)
fianl_data = pandas.concat( [ 表格数据来源,表格数据来源 ] )
(14)统计每一列数据的总数
final_data.count()
(15) 查看数据详情
final_data.info()
(16) 写入数据excel(默认相对路径)
final_data.to_excel('文件名 ' , sheet_name = ' 表格名称 ' )
(17)新增行数据(赋值)
sheet1_data.loc [ 数字参数] = [ 参数 ]
(18) 新增列参数(赋值)
sheet1_data[ 参数 ] = [ 参数 ]
(19) 删除数据(默认删除行数据,不会作用于原数据)
sheet1_data.drop(参数,inplace = True , axis = 0)
注:
参数:为横轴直接为数字,竖轴为中文需要添加 [ ] 中括号
inplace 默认为Fales
axis默认为0 ——>作用于横轴。等于1,作用于竖轴