读写excel、csv文件

一、pycharm中导入包

file—settings–project:项目名–
https://jingyan.baidu.com/article/93f9803f5dababe0e46f55fc.html
pycharm搜索不到可以去下面网址下载https://www.lfd.uci.edu/~gohlke/pythonlibs/
或者cmd安装下载:pip install …
或者cmd离线安装:python -m pip install …whl

二、读写excel、csv

https://blog.csdn.net/yj1556492839/article/details/79170215

1、读

方法一、首先下载安装openpyxl包,方法如上

from openpyxl import load_workbook
workbook_=load_workbook('D:a.xlsx')
ws=workbook_.active #获取活动的sheet页名
aa=ws['A1'].value
print(aa)

https://blog.csdn.net/qq_27631797/article/details/78622645

方法二、import xlrd

https://blog.csdn.net/EB_NUM/article/details/75175143

>>> import xlrd
>>> data=xlrd.open_workbook('D:a.xlsx')
>>> table=data.sheets()[0]
>>> nrows=table.nrows  #获取行数
>>> for i in range(nrows):
    print(table.row_values(i))   #循环行列表数据
#获取单元格数据方法
>>> A1=table.cell(0,0).value     #1.cell(单元格)获取
>>> A2=table.row(0)[1].value   

#2.使用行列索引

方法三、pandas

备注:pandas读取excel文件,需要单独的xlrd模块支持,也就是说还是需要安装xlrd包:

1)excel

>>> import pandas as pd
>>> wb=pd.ExcelFile('D:out.xlsx')  #打开文件
>>> wb_sheet=wb.sheet_names
>>> wb_sheet
['样例数据', '用户画像']
>>> table=wb.parse(sheet_name=0)  
#此处的sheet_name位置从0开始,而不是1,table就是表数据,等价于>>> table=wb.parse('样例数据')
>>> data=pd.read_excel('D:/data/out.xlsx',sheet_name=0,header=0) 

2)csv

a、路径名和文件名没有中文

>>>hua_data = pd.read_csv(data_path,header=None,names=columns)

header=None:指明原始数据没有列索引,read_csv为自动加上列索引,除非你给定列索引的名字。
header=0:表示文件第0行(即第一行)为列索引,若是加names会替换原来的列索引。
header=[0,1,3]:1,2,4行作为多级标题,第3行数据将被丢弃,dataframe的数据从第5行开始
names=columns:指定列名

b、路径名或文件名有中文情况

>>> data=pd.read_csv('D:/10086.csv',engine='python',encoding = 'utf-8',index=False)

备注:csv文件中有中文情况,需要设置encoding = ‘GBK’
index=False:行索引不导入csv中

2、写

1)excel

>>> data_all.to_excel('D:/data/Internet/cust000.xlsx',index=False)
### 2)csv
>>> silent_data.to_csv('D:/data/dst.csv', index=False) # 不要每行的编号

3、在原有的sheet中追加新sheet

>>> work_2=pd.ExcelWriter('D:out.xlsx')  #已有的excel的路径和表名
>>> df.to_excel(work_2,sheet_name='结果')  
>>> work_2.save()  #把原来的文件替换掉新建,此处只是更改了sheet名

你可能感兴趣的:(python)