python中常见关于Excel表格读写操作-----opnepyxl和xlrd/xlwt

关注【软件测试小助手】,知识分享更全哦~

常用知识点:

# 创建一个excel表格
wb = openpyxl.Workbook()
# 给表格添加sheet名称
wb.create_sheet(index=0, title='test1')
# 保存表格
wb.save('test_openpyxl.xlsx')

1、读取微博爬取的内容写到表格

# 获取微博热搜内容
def get_text():
    list_n = ['排行']
    list_r = ['热搜名']
    url = 'https://s.weibo.com/top/summary'
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
    }
    response = requests.get(url=url, headers=header)
    if response.status_code == 200: #判断接口请求是否正确
        html = etree.HTML(requests.get(url, headers=header).text) # 构造XPath解析对象
        hot_search_name = html.xpath('//td[@class="td-02"]/a/text()')  # 热搜名 字符串列表
        hot_search_rank = html.xpath('//td[@class="td-01 ranktop"]/text()')  # 热搜排行
        hot_search_name_true = hot_search_name[1:]  # 只取热搜排行,不取置顶热搜
        for i in range(0, 10):
            s = hot_search_rank[i]  # 排行和热搜组合
            r = hot_search_name_true[i]
            list_n.append(s)
            list_r.append(r)
    else:
        print('wrong')
    return zip(list_n, list_r)

# 将微博文件内容到表格
def get_website_to_excel():
    result = get_text() # 微博内容结果
    wb = openpyxl.Workbook()
    sheet = wb.active  #获取初始的sheet
    count = 1
    for inner in result:
        sheet.cell(row=count, column=1).value = inner[0]
        sheet.cell(row=count, column=2).value = inner[1]
        count += 1
    wb.save('微博.xlsx') # 保存到当前目录下

python中常见关于Excel表格读写操作-----opnepyxl和xlrd/xlwt_第1张图片

2、读取表格内容

def get_excel_content():
    # 打开工作簿
    lw = openpyxl.load_workbook('test_openpyxl.xlsx')
    # 选取表单
    sheet_name = lw.active
    # 获取第一行第一列的数据 A1
    #  ce = sheet_name.cell(row=1, column=1)
    #  print(ce.value)
    # 按行读取数据 去表头
    print(list(sheet_name.rows)[1:])
    for cases in list(sheet_name.rows)[1:]:
        rank = cases[0].value
        name = cases[1].value
        print(rank, name)

xlrd 和 xlwt

1、读取Excel中的数据

import xlrd
import xlwt

def get_excel():
    # 获取数据
    data = xlrd.open_workbook('微博.xlsx')
    # 获取sheet
    # table = data.sheet_by_name('test') # 通过sheet名称获取数据
    table = data.sheet_by_index(0)   # 通过sheet索引获取数据
    # 获取总行数
    rows = table.nrows
    # 获取总列数
    cols = table.ncols
    # 获取某个单元格的数据
    cell_value = table.cell(0, 1).value
    print(cell_value)
    # 获取excel表格所有数据
    for i in range(rows):
        for j in range(cols):
            print(table.cell(i, j).value)

2、写入内容到Excel表格中


def write_excel():
    data = [['title', 'content'], ['test1', 'test2']]
    # 创建excel
    wb = xlwt.Workbook()
    # 创建excel中的sheet
    ws = wb.add_sheet('test')
    for i in range(len(data)):
        for j in range(len(data[i])):
           ws.write(i, j, data[i][j])
    # ws.write(0, 0, 'hahah')
    wb.save('test.xls')

总结要点:

1、读写文件的时候,记得要把文件关掉

2、输入中文时,乱码的话,可以导入codes包,然后设置中文格式为gbk,可以看到不少乱码了。

3、writerow和writerows的区别:writerow写入一行数据,writerows写入多行数据,而且写入多行数据的类型DictWriter字典类型,writer是list类型【有不对的欢迎指出来】

4、xlrd:对xls、xlsx、xlsm文件进行读操作–读操作效率较高

5、xlwt:对xls文件进行写操作–写操作效率较高,但是不能执行xlsx文件

6、openpyxl:对xlsx、xlsm文件进行读、写操作–xlsx写操作推荐使用,不能写xls文件

你可能感兴趣的:(python中常见关于Excel表格读写操作-----opnepyxl和xlrd/xlwt)