nlp-数据集处理,在python中通过自定义路径的方式建表存入数据并换行,以及遇到的一些坑

目录

前言

一、模块的安装

二、建表

三、写入数据

四、表的存储

五、关表、关进程


前言

用的是xlwings模块

一、模块的安装

pip install xlwings

二、建表

1.先判断是否存在同名表,如存在,就先删除再创建,否则,直接创建即可

(这一步不是很有必要,因为xlwings模块中,存表的时候,如果有同名表会直接覆盖)

is_excel = os.path.exists(r'D:\\python-ex\\pythonProject1\\comment-data\\{userID}-comm.xlsx')  # 是否存在
if is_excel:
    os.remove(r'D:\\python-ex\\pythonProject1\\comment-data\\{userID}-comm.xlsx')  # 删除
    app = xw.App(visible=False, add_book=False)  # 创建操作对象 visible是否可见。False表示后台运行
    workbook = app.books.add()  # 创建一个工作簿,即Excel表
    comm_sht = workbook.sheets['sheet1']  # 创建一个sheet工作表
else:
    app = xw.App(visible=False, add_book=False)  # 创建操作对象 visible是否可见。False表示后台运行
    workbook = app.books.add()  # 创建一个工作簿,即Excel表
    comm_sht = workbook.sheets['sheet1']  # 创建一个sheet工作表

参数说明:

【visible】:如果建表个数很多的情况下尽量选择visible=False,如果=Ture,建表过程会在你电脑上弹出来,建一个表弹一次

三、写入数据

workbook.sheets[0][Comm_Row, Comm_col].value = str(comment_user_id)
workbook.sheets[0][Comm_Row, Comm_col + 1].value = str(comment_text)
workbook.sheets[0][Comm_Row, Comm_col + 2].value = str(comment_retweet_count)
workbook.sheets[0][Comm_Row, Comm_col + 3].value = str(comment_favorite_count)
workbook.sheets[0][Comm_Row, Comm_col + 4].value = str(comment_created_at)
workbook.sheets[0][Comm_Row, Comm_col + 5].value = str(comment_place)
Comm_Row += 1

参数说明:

你创建的工作簿.sheets[页][行][列].value=你要存入的值

四、表的存储

注意:

要写入数据之后再存储,也可以【创建-存储-打开-写入-关闭】,只不过需要多写一个打开表的open

{}包着的这部分是可以动态变化的,这样就可以根据不同的userID,存不同的表。如果是固定的,直接去掉这个{}就行

workbook.save(f'D:\\python-ex\\pythonProject1\\comment-data\\{userID}-comm.xlsx')  # save #同名文件会在没有提示的情况下被直接覆盖

五、关表、关进程

注意:

这一步一定要有,且要写对位置,我写的过程中,报的错都是因为这部分没写对

关表:

workbook.close()

关进程:

Python中使用xlwings关闭有两个方法:quit()和kill()
quit()方法仅仅是关闭,但并没有销毁系统进程。所以系统占用还是存在的。会影响系统打开excel文件。
kill()方法是强制关闭,彻底销毁系统进程,释放内存。这种方法关闭彻底。

app.kill()

大概逻辑位置:

写完一个表关一个表,所有表写完之后关进程

nlp-数据集处理,在python中通过自定义路径的方式建表存入数据并换行,以及遇到的一些坑_第1张图片

注意:

如果位置没写对,就会报错

错误1:pywintypes.com_error: (-2147352567, '发生意外。', (0, 'Microsoft Excel', '不能打开文件

原因:你要操作的表在逻辑上还处于打开状态,这就是没关表跟进程出现的问题。如果不关的话,写完之后所有表在你电脑中就是打开状态,电脑会变得巨卡,而且无法再运行,一运行就会报错。直接重启把代码加上重新运行

错误2:pywintypes.com_error: (-2147417848, '被调用的对象已与其客户端断开连接'

原因:表或进程,关早了,比如上面那个代码,如果把app.kill()卸载workbook.close()后面,就会报这个错,相当于,在你想写第二个表时,进程在写第一个表的时候就关闭了,自然就会报错

你可能感兴趣的:(python,python,开发语言)