pandas操作excel

pandas操作excel

引入包

import numpy
import pandas

1、创建写入对象

writer = pandas.ExcelWriter(os.path.join(tar_path, file_name + '.xlsx'))

2、转化为dataframe对象

 f = pandas.DataFrame(numpy.array(列表), columns=['指定列'])

3、读取excel对象

pandas.DataFrame(pandas.read_excel(src_path, sheet_name=sheetname, usecols=[0, 1, 2], keep_default_na=False, header=1))
  • src_path:excel路径
  • sheetname:excel的sheet页名称
  • usecols:需要读取的列编号
  • keep_default_na:空白单元格显示为空
  • header:表头位置
  • skip_rows:需要跳过的行数(从首行开始)

4、插入列到dataframe对象

table_frame.insert(loc=1, column='表中文名', value='表的中文名')
  • loc:插位置列编号从0开始
  • column:列名
  • value:插入列的值

5、dataframe对象转换为list

 l = numpy.array(dataframe).tolist()

6、获取某个单元格的值

table_data_frame.iloc[[2], [1]].values[0][0]

获取第三行,第二列的值

7、按照某列的值筛选数据内容

group = table_data_frame.loc[table_data_frame[5] == 'a']

筛选第五列为 ‘a’的数据内容

group = table_data_frame.loc[table_data_frame['name'] == 'a']

筛选 name 列为 ‘a’的数据内容

8、写入excel

f.to_excel(writer, index=False, sheet_name='指定sheet页')

9、关闭对象

writer.save()
writer.close()

你可能感兴趣的:(python,pandas,python,数据分析)