创建完表格以后一定要保存,否则程序运行结束以后还是最初的模样。
wb1.save(“文件名”)
def preDataSet():
wb1 = load_workbook('E:\My Word\study\RL0314\西瓜.xlsx')
sheet1 = wb1.worksheets[0] # 获取第1张sheet
sheet2 = wb1.create_sheet("预处理数据集") # 新建一个表格默认放在最后
# 迭代读取所有的行
cnt = 0
for row in sheet1.rows:
row_val = [col.value for col in row]
if cnt == 0:
sheet2.append(["C1_L", "C1_N", "C1_H", "C2_L", "C2_N", "C2_H", "D"]) # 表格2写入表头
else:
# 预处理
data1 = get_vtimf(row_val[1], 0.43, 0.53, 0.63)
data2 = get_vtimf(row_val[2], 0.12, 0.22, 0.32)
data = []
data.extend(data1)
data.extend(data2)
print(data)
sheet2.append(data) # 向表格2写入预处理完的数据
cnt = cnt + 1
wb1.save("西瓜.xlsx") # 记得保存
data.extend(另一个数组名)
这里使用了extend的用法,本来想着直接简单粗暴地使用+运算符的,但是报错了,具体原因我也不太清楚。最后参考的是这篇文章python对两个数组进行合并。
data = []
data.extend(data1)
data.extend(data2)
想对西瓜数据集复刻他们常说的模糊决策树算法,现在进展到会对数据进行模糊化处理了,但是构建模糊决策树的时候还是遇到了一点困难,感觉是根节点的数学逻辑还没有很好地理解清楚,大概是因为之前一直依赖于sklearn强大的分类决策树功能,问题不大,知道问题在哪里去学就是了。