【背景】
最近有一个需要为图片去水印的需求,于是各种折腾开始。
【背景了解图片标准】
图片使用RGB编码,RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色,RGB即是代表红、绿、蓝三个通道的颜色。
【分析图片】
分析了图片之后,发现规律:
1、图片需要的图形是黑色的
2、水印都是一种颜色:水红
白色对应#FFFFFF就是 255 255 255
黑色对应#000000 就是 0 0 0
我们用rgb取色工具
发现红色的字rgb有以下情况:差不多grb的相加和都在200以上,那么我们写程序的判断基准就产生了:就是找到每个像素,如果像素和大于250,并且小于765(不是白色),就将这个像素点重置为白色:255,255,255。
得到以上逻辑之后,怎样在代码中实现?找了几个python下处理图像的库,最终选择了opencv。于是乎接着就要研究opencv的api了。
具体可以看看opencv的官网:http://opencv.org/
当然一开始你觉得看直接去看手册很苦逼,也可以看看别人的程序找点感觉了。
【安装opencv】
其实安装opencv也是很折腾人的一个事情,mac下安装opencv安装可参考:
sudo brew tap homebrew/science sudo brew install OpenCV
注意安装好了之后,需要将库的地址做说明,具体看上图红框的位置。
有可能还需要
sudo brew update
【具体代码】
__author__ = 'River' # -*- coding: utf-8 -*- import cv2,os,shutil,datetime,re,time from threading import Thread from hashlib import md5 PICHASH= {} def md5_file(name): try: m = md5() a_file = open(name, 'rb') m.update(a_file.read()) a_file.close() return m.hexdigest() except: return None def nowater(dir,newdir,dirlist): global PICHASH for ppicdir in dirlist: if(os.path.isdir(dir+ppicdir)): sortfiles=os.listdir(dir+ppicdir) if '.DS_Store' in sortfiles: sortfiles.remove('.DS_Store') sortfiles.sort() for oldfile in sortfiles: filetype="."+oldfile.split(".")[len(oldfile.split("."))-1] picname_front=oldfile.split(filetype)[0] oldfile=dir+ppicdir+"/"+oldfile jpgname=picname_front+".jpg" jpgname=newdir+ppicdir+"/"+jpgname try: oldfile_hash=md5_file(oldfile) oldfile_tmphashvalue=PICHASH.get(oldfile_hash) file_object = open('pichash.txt', 'a') file_object.write(oldfile+":"+oldfile_hash+'\n') file_object.close() if(oldfile_tmphashvalue==None):#新文件,已经处理过的图片,就不会再次处理了 if not os.path.exists(newdir+ppicdir): os.makedirs(newdir+ppicdir) #print oldfile 哈哈 #print jpgname print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+oldfile+",ing\n" img=cv2.imread(oldfile) x,y,z=img.shape if x < 10:#太小文件不处理 print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+jpgname+"文件太小,跳过" elif x >8000:#太大的文件不处理 print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+jpgname+"文件太大,跳过" elif not os.path.exists(jpgname):#这就是最关键的代码了 for i in xrange(x): for j in xrange(y): varP=img[i,j] if sum(varP)>250 and sum(varP)<765 :#大于250,小于765(sum比白色的小) img[i,j]=[255,255,255] #cv2.imwrite(jpgname,img,[int(cv2.IMWRITE_JPEG_QUALITY),70])#linux跑悲剧了 cv2.imwrite(jpgname,img) print "jpgname:"+jpgname PICHASH[oldfile_hash]=oldfile print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+oldfile+",done\n" else: print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+jpgname+"文件已存在,跳过\n" elif(oldfile_tmphashvalue!=None): if(os.path.exists(jpgname)): print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+jpgname+"文件已存在,跳过\n" else: shutil.copyfile(oldfile_tmphashvalue,oldfile) shutil.copyfile(oldfile,jpgname) print datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")+","+jpgname+"和老文件一样,拷贝旧文件,跳过" except Exception,e: print "Exception:",e continue if __name__=='__main__': dir="pic/" newdir="picnew/" list0=[] list1=[] list2=[] list3=[] list4=[] for ppicdir in os.listdir(dir) :#生成多个list,主要是为了并发处理多个目录的图片 if(os.path.isdir(dir+ppicdir)): if (re.compile(r'^[0-1].*').match(str(ppicdir))): list0.append(ppicdir) elif(re.compile(r'^[2-3].*').match(str(ppicdir))): list1.append(ppicdir) elif(re.compile(r'^[4-5].*').match(str(ppicdir))): list2.append(ppicdir) elif(re.compile(r'^[6-7].*').match(str(ppicdir))): list3.append(ppicdir) elif(re.compile(r'^[8-9].*').match(str(ppicdir))): list4.append(ppicdir) else: continue #启n线程并行处理 Thread(target=nowater,args=(dir,newdir,list0)).start()#这里只有 Thread(target=nowater,args=(dir,newdir,list1,)).start() Thread(target=nowater,args=(dir,newdir,list2,)).start() Thread(target=nowater,args=(dir,newdir,list3,)).start() Thread(target=nowater,args=(dir,newdir,list4,)).start()
【最终效果】
去除水印之后的效果: