# 读取Excel文件
df = pd.read_excel('未完工项目收款任务记录表.xlsx', sheet_name='物流项目汇总表')
# 删除符合条件的数据
df = df.drop(df[(df['总收款额'] == df['总合同结算金额']) & (df['总收款额'].isnull()) & (df['总合同结算金额'].isnull())].index)
df = df.drop(df[(df['总收款额'] == df['总合同结算金额']) & (df['总收款额'].notnull()) & (df['总合同结算金额'].notnull())].index)
df = df.drop(df[(df['项目编号'].isnull()) & (df['PO单号'].isnull())].index)
# 新建一个sheet并保存
now = datetime.datetime.now().strftime('%Y%m%d%H%M%S')
writer = pd.ExcelWriter('未完工项目收款任务记录表.xlsx')
df.to_excel(writer, sheet_name='物流项目汇总表' + now, index=False)
writer.save()
好家伙。这个牛。直接把我文档全部清空了。。。
prompt 简单的理解它是给 AI 模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。AI 模型会基于 prompt 所提供的信息,生成对应的文本,亦或者图片。而 Prompt Engineering (中文意思为提示工程,后缩写为 PE)则是:Prompt Engineering 是一种人工智能(AI)技术,它通过设计和改进 AI 的 prompt 来提高 AI 的表现。Prompt Engineering 的目标是创建高度有效和可控的 AI 系统,使其能够准确、可靠地执行特定任务。因为人类的语言从根本上说是不精确的,目前机器还没法很好地理解人类说的话,所以才会出现 PE 这个技术。另外,受制于目前大语言模型 AI 的实现原理,部分逻辑运算问题,需要额外对 AI 进行提示。
# 读取指定的sheet
df = pd.read_excel(file_name, sheet_name=sheet_name)
new_data = [] # 存储符合条件的行
i = 0 # 当前行索引
while i < len(df):
current_percentage = df.loc[i, 'M']
next_percentage = df.loc[i+1, 'M'] if i < len(df)-1 else None
if current_percentage == 1 and pd.isna(next_percentage): # 条件1
while pd.isna(df.loc[i+1, 'M']):
打印输出df.loc[i, ‘M’]的值不对。来回修改几次,还是出错:
这个问题没有得到很好的解决。我调整了一下,改为比较2个货币类型的单元格数据大小。
for ws in [ws_summary, ws_payment]:
rows_to_delete = [] # 存储需要删除的行号
print(f"ws: {ws.title}, max_row: {ws.max_row}")
for row in range(2, ws.max_row+1):
print("ws.cell(row={0}, column=10).value:".format(row), ws.cell(row=row, column=10).value)
print("ws.cell(row={0}, column=11).value:".format(row), ws.cell(row=row, column=11).value)
if ws.cell(row=row, column=10).value is not None and \
ws.cell(row=row, column=11).value is not None and \
abs(ws.cell(row=row, column=10).value - ws.cell(row=row, column=11).value) < 1: #收款金额和合同结算金额相等,一定会删除
rows_to_delete.append(row)
for i in range(1, po_number_max): # 检查该行后面的若干行是否为空
if ws.cell(row=row+i, column=10).value is None and ws.cell(row=row+i, column=11).value is None:
# 后面若干行要删除
rows_to_delete.append(row+i)
else:
break
有一个版本的代码,运行之后,vs code出现无响应,怀疑是出现了死循环。增加打印输出后,果然是这样。说明ChatGPT编写的代码,逻辑漏洞也是有的。
还比如:
有时候还有重复性错误:
def get_value(cell):
if cell.data_type == 'f':
compiler = ModelCompiler()
new_model = compiler.read_and_parse_archive(filename)
evaluator = Evaluator(new_model)
value = evaluator.evaluate(cell)
return value
else:
return cell.value
最后还是没成功,错误大多是库的问题
实际上,我的openpyxl是刚安装的。最后还是在网上查到了一个方案。直接读取单元格中的公式计算值。
2. 删除数据后公式的更新
经过处理后输出的sheet的数据是对了,但公式全没有了。数据之间的引用关系消失了。目前这个问题还在研究中。当然,如果出来的中间数据仅做分析使用,只要数据正确,无公式,也勉强可以接受。
增加图形图表方式的数据分析也是我下一步需要完成的工作。
以下代码其实是可以实现公式更新功能的。如果打开文件的方式是data_only=False的话
for ws in [ws_summary, ws_payment]:
for row in ws.rows:
for cell in row:
if cell.data_type == 'f':
cell.value = cell.value