VBA与Python删除excel单元格空格与非打印字符

Excel单元格空格的删除是表哥表姐们日常工作中经常遇到的问题,大多数人对这个问题的常规解决方法就是:
1、全选工作表,按ctrl+H键,弹出查找和替换工作框
2、在查找和替换工作框的“查找内容”项,输入“ ”,在“替换为”项,直接空着,什么都不用输入


图片.png

3、点击“全部”替换项,替换完成即可

一般情况下,以上三步即可完成工作表内空格的删除工作,但实际工作中,单元格内存在的换行符,回车符这些无法打印字符是无法通过替换删除的,如果这些字符没有清理干净,又会影响后续数据的处理和运算,严重者,更影响数据的准确与精度,所以在替换完之后,我们需要用left或right公式检查一下单元格内是否存在换行符或打印符;

4、对于不会vba的小伙伴来说,另一种方法是函数结合使用删除空格与无法打印字符:
=CLEAN(SUBSTITUTE(C2," ","")),其中SUBSTITUTE(C2," ","")的作用是删除单元格内所有空格,CLEAN的作用是删除单元格内无法打印字符

5、对于多行多列的表格来说,要一列一列的输入公式来进行空格的清理,效率未免低下,为了提高效率,一次完成目标,可以使用VBA代码一次完美解决这个问题,代码如下:

Sub 删除空格()
Dim arr, brr, crr, i, j
Application.ScreenUpdating = False  '关闭屏幕更新
tm = Timer
arr = Sheets(1).UsedRange.Value     '将第一个工作表的已用区域赋值给数组arr
ReDim brr(1 To UBound(arr), 1 To UBound(arr, 2))   '定义数组brr的行数、列数

For i = 1 To UBound(arr)            'i的值为数组arr的第一维最大下标(即第一个工作表已用区域的行数)
For j = 1 To UBound(arr, 2)         'j的值为数组arr的第二维最大下标(即第一个工作表已用区域的列数)

    a = Replace(arr(i, j), " ", "")    '替换arr(i,j)的所有空格
    brr(i, j) = Application.WorksheetFunction.Clean(a)    '用工作表函数clean处理a,将a的所有非打印字符删除除
    
Next j
    
Next i
    

With Sheets(2):
     .UsedRange.Clear
     .[A1].Resize(UBound(brr), UBound(brr, 2)) = brr     '将数组brr输入到sheet2的左上角为A1的单元格区域内

End With

Application.ScreenUpdating = True    '开启屏幕更新
MsgBox "工作完成!用时" & Timer - tm & "秒", 64, "提示"     '代码运行用时
End Sub

以上,即是vba实现删除空格、非打印字符的vba代码

5、在办公现代化的今日,python的运用越来越广,那么,用python代码应该怎么处理这个问题呢?python代码如下(需要用到的模块为openpyxl,用pip方法即可安装):

#_*_coding:utf-8_*_
from openpyxl import load_workbook


file = "五城网签-200325.xlsx" #要处理的文件路径
wb = load_workbook(file) #加载文件
ws = wb.active
for i in range(2, ws.max_row+1):
  for j in range(3, ws.max_column+1):
     old = str(ws.cell(i, j).value)
     if old is not None:

        ws.cell(i, j).value = old.strip().replace(' ', '').replace("\n", "")
        if str(ws.cell(i, j).value)[0:7] =="_x000D_" or str(ws.cell(i, j).value)[-6:len(str(ws.cell(i, j).value))] == "_x000D_":
          ws.cell(i, j).value = str(ws.cell(i, j).value)[7:len(str(ws.cell(i, j).value))-7]
        elif str(ws.cell(i, j).value)[-7:len(str(ws.cell(i, j).value))] == "_x000D_":
           ws.cell(i, j).value = str(ws.cell(i, j).value)[0:len(str(ws.cell(i, j).value)) - 7]
wb.save(file)
wb.close()
print("处理完成")

核心语句为:

ws.cell(i, j).value = old.strip().replace(' ', '').replace("\n", "")

主要作用是将单元格所有的空格,换行符替换为空,但是这一个语句的不足之处是无法将非打印字符删除,一般情况下,这种非打印字符是回车、换行符,ASCII码是10、13,读者有兴趣可以在单元格内输入=code(A1)这个公式测试一下非打印字符的ASCII码,经调试发现,ASCII码为10、13的字符在python里返回的字符形式为“x000D ”,所以替换掉空格之后,需要在后面加上两句if判断语句,将残留的非打印字符继续删除:

if str(ws.cell(i, j).value)[0:7] =="_x000D_" or str(ws.cell(i, j).value)[-6:len(str(ws.cell(i, j).value))] == "_x000D_":
          ws.cell(i, j).value = str(ws.cell(i, j).value)[7:len(str(ws.cell(i, j).value))-7]
        elif str(ws.cell(i, j).value)[-7:len(str(ws.cell(i, j).value))] == "_x000D_":

           ws.cell(i, j).value = str(ws.cell(i, j).value)[0:len(str(ws.cell(i, j).value)) - 7]

你可能感兴趣的:(VBA与Python删除excel单元格空格与非打印字符)