把Python的基础知识学习后,尝试一下如何安装、加载、使用非标准库,选择了图像处理模块PIL。
Python Imaging Library (PIL)是PythonWare公司提供的免费的图像处理工具包,是python下的图像处理模块,支持多种格式,并提供强大的图形与图像处理功能。虽然在这个软件包上要实现类似MATLAB中的复杂的图像处理算法并不太适合,但是Python的快速开发能力以及面向对象等等诸多特点使得它非常适合用来进行原型开发。对于简单的图像处理或者大批量的简单图像处理任务,python+PIL是很好的选择。
PIL 具备(但不限于) 以下的能力:
目前PIL的官方最新版本为1.1.7(官方下载地址:这里),支持的版本为python 2.5, 2.6, 2.7,并不支持python3.x,但有高手把它重新编译生成python3下可安装的exe了。这一非官方下载地址:这里。
这里是PIL的使用手册,这里有中文版。
------------------------------------------------------------------------------------------------------------------------------------------
由于目前暂未出支持3.x的PIL版本,所以从上述非官方地址中下载了支持3.3的win32版本。需要注意该地址中有两点说明:
Note: use `from PIL import Image` instead of `import Image`.
Note: this fork contains bug fixes and enhancements.
下载完成后 ,基本一直“next”即可安装。
------------------------------------------------------------------------------------------------------------------------------------------
在PIL中,任何一副图像都是用一个Image对象表示,而这个类由和它同名的模块导出,因此,要加载一副图像,最简单的形式是这样的:
import Image
img = Image.open(“test.jpg”)
由于使用的是非官方的支持3.3版本的PIL,并提示“use `from PIL import Image` instead of `import Image`.”所以本文加载图像是用如下方式:
from PIL import Image
img = Image.open("test.jpg")
PIL提供了丰富的功能模块:Image,ImageDraw,ImageEnhance,ImageFile等等。最常用到的模块是Image,ImageDraw,ImageEnhance这三个模块。
Image模块是PIL最基本的模块,其中导出了Image类,一个Image类实例对象就对应了一副图像。同时,Image模块还提供了很多有用的函数。打开一副图像文件 :
from PIL import Image
img = Image.open("test.jpg")
这将返回一个Image类实例对象,后面的所有的操作都是在img上完成的。
显示一幅已经载入的图片:
img.show()
调整图像大小:
from PIL import Image
img = Image.open("test.jpg")
new_img = img.resize((128, 128), Image.BILINEAR)
new_img.save("new_img.jpg")
原来的图像大小是256x256,现在,保存的new_img.jpg的大小是128x128。如下:
旋转图像:
现在我们把刚才调整过大小的图像旋转45度:
from PIL import Image
img = Image.open("test.jpg")
new_img = img.resize((128, 128), Image.BILINEAR)
rot_img = new_img.rotate(45)
rot_img.save("rot_img.jpg")
格式转换:
假设我们要把上面生成的rot_img.jpg转换成bmp图像,要做到这一点这太简单了:只需要在上面的代码后面添加下面这样一行即可:
rot_img.save("con_img.bmp")
此处save函数只有一个参数,是一个包含文件名和扩展名的字符串。Image类中的save函数在你未指定保存的格式时,自动根据文件名后缀完成格式转换。另外一种调用方式是:
img.save('con_img','bmp')
Image类实例的histogram()方法能够对直方图数据进行统计,并将结果做为一个列表(list)返回。比如,我们对上面的旋转后生成的图像进行直方图统计:
from PIL import Image
img = Image.open("test.jpg")
new_img = img.resize((128, 128), Image.BILINEAR)
rot_img = new_img.rotate(45)
print (rot_img.histogram())
实例化一个Draw类实例很简单:
from PIL import Image, ImageDraw
img = Image.open("test.jpg")
draw = ImageDraw.Draw(img)
#.....
img.save("new.jpg")
绘制直线:
from PIL import Image, ImageDraw
img = Image.open("test.jpg")
draw = ImageDraw.Draw(img)
width, height = img.size
draw.line( ( (0,0), (width-1, height-1)), fill=255)
draw.line( ( (0,height-1), (width-1, 0)), fill=255)
img.save("cross_line.jpg")
绘制圆:
from PIL import Image, ImageDraw
img = Image.open("test.jpg")
draw = ImageDraw.Draw(img)
width, height = img.size
draw.arc( (0, 0, width-1, height-1), 0, 360, fill=255)
img.save("circle.jpg")
这个模块提供了一个常用的图像增强工具箱。可以用来进行色彩增强、亮度增强、对比度增强、图像尖锐化等等增强操作。所有操作都有相同形式的接口——通过相应类的enhance方法实现:色彩增强通过Color类的enhance方法实现;亮度增强通过Brightness类的enhance方法实现;对比度增强通过Contrast类的enhance方法实现;尖锐化通过Sharpness类的enhance方法实现。所有的操作都需要向类的构造函数传递一个Image对象作为参数,这个参数定义了增强作用的对象。同时所有的操作都返回一个新的Image对象。如果传给enhance方法的参数是1.0,则不对原图像做任何改变,直接返回原图像的一个拷贝。
这个模块很容易完全掌握,因为它只有Color、Contrast、Sharpness、Brightness四个类;并且每个类都只有两个函数__init__和enhance函数,并且这四个类的使用方式和成员函数的使用方式也都是一样的(只需要一个factor因子)。
亮度增强:
from PIL import Image, ImageEnhance
img = Image.open("test.jpg")
brightness = ImageEnhance.Brightness(img)
bright_img = brightness.enhance(2.0)
bright_img.save("bright.jpg")
图像尖锐化:
from PIL import Image, ImageEnhance
img = Image.open("test.jpg")
sharpness = ImageEnhance.Sharpness(img)
sharp_img = sharpness.enhance(7.0)
sharp_img.save("sharp.jpg")
对比度增强:
from PIL import Image, ImageEnhance
img = Image.open("test.jpg")
contrast = ImageEnhance.Contrast(img)
contrast_img = contrast.enhance(2.0)
contrast_img.save("contrast.jpg")
色彩增强:
from PIL import Image, ImageEnhance
img = Image.open("test.jpg")
color = ImageEnhance.Color(img)
color_img = color.enhance(3.0)
color_img.save("color.jpg")
图片反色,类似于集合操作中的求补集,最大值为Max,每个像素做减法,取出反色。
公式:out = MAX - image
ImageChops.invert(image)
比较两个图片(逐像素的比较),返回一个新的图片,这个新的图片是将两张图片中的较淡的部分的叠加。也即使说,在某一点上,两张图中,哪个的值小则取之。
公式:out = max(img1, img2)
ImageChops.lighter(image1, image2)
公式:out = min(img1, img2)
ImageChops.darker(image1, image2)
公式:out = abs(img1, img2)
ImageChops.difference(image1, image2)
公式:out = img1 * img2 / MAX (可以看到,如果时白色,MAX和MAX会约去,返回原始图片)
ImageChops.multiply(image1, image2)
公式:out = MAX - ((MAX - image1) * (MAX - image2) / MAX)
ImageChops.screen(image1, image2)
如果尺度和偏移被忽略的化,scale=1.0, offset=0.0,即out = img1 + img2
ImageChops.add(img1, img2, scale, offset)
公式:out = (img1-img2) / scale + offset
ImageChops.subtract(img1, img2, scale, offset)
The ImageColor module contains colour tables and converters from CSS3-style colour specifiers to RGB tuples. This module is used by Image.new and the ImageDraw module, among others.
详见:这里
getrgb(color) ⇒ (red, green, blue)
Convert a colour string to an RGB tuple. If the string cannot be parsed, this function raises a ValueError exception.
详见:这里
ImageFile.Parser() => Parser instance
Creates a parser object. Parsers cannot be reused.
parser.feed(data)
Feed a string of data to the parser. This method may raise an IOError exception.
parser.close() => image or None
Tells the parser to finish decoding. If the parser managed to decode an image, it returns an Image object. Otherwise, this method raises an IOError exception.
Example(Parse An Image):
import ImageFile
fp = open("lena.pgm", "rb")
p = ImageFile.Parser()
while 1:
s = fp.read(1024)
if not s:
break
p.feed(s)
im = p.close()
im.save("copy.jpg")
ImageFilter是PIL的滤镜模块,当前版本支持10种加强滤镜,通过这些预定义的滤镜,可以方便的对图片进行一些过滤操作,从而去掉图片中的噪音(部分的消除),这样可以降低将来处理的复杂度(如模式识别等)。
滤镜名称 | 含义 |
ImageFilter.BLUR | 模糊滤镜 |
ImageFilter.CONTOUR | 轮廓 |
ImageFilter.DETAIL ImageFilter.EDGE_ENHANCE |
边界加强 |
ImageFilter.EDGE_ENHANCE_MORE | 边界加强(阀值更大) |
ImageFilter.EMBOSS | 浮雕滤镜 |
ImageFilter.FIND_EDGES | 边界滤镜 |
ImageFilter.SMOOTH | 平滑滤镜 |
ImageFilter.SMOOTH_MORE | 平滑滤镜(阀值更大) |
ImageFilter.SHARPEN | 锐化滤镜 |
要使用PIL的滤镜功能,需要引入ImageFilter模块。
import Image, ImageFilter
def filterDemo():
img = Image.open("test.jpg")
imgfilted = img.filter(ImageFilter.SHARPEN)
#imgfilted.show()
imgfilted.save("sharpen.jpg")
if __name__ == "__main__":
filterDemo()
The ImageFont module defines a class with the same name. Instances of this class store bitmap fonts, and are used with the text method of the ImageDraw class.
import ImageFont, ImageDraw
draw = ImageDraw.Draw(image)
# use a bitmap font
font = ImageFont.load("arial.pil")
draw.text((10, 10), "hello", font=font)
# use a truetype font
font = ImageFont.truetype("arial.ttf", 15)
draw.text((10, 25), "world", font=font)
The ImageGrab module can be used to copy the contents of the screen or the clipboard to a PIL image memory.
The current version works on Windows only.
ImageGrab.grab() => image
ImageGrab.grab(bbox) => image
Take a snapshot of the screen, and return an "RGB" image. The bounding box argument can be used to copy only a part of the screen.
ImageGrab.grabclipboard() => image or list of strings or None
Take a snapshot of the clipboard contents, and return an image object or a list of file names. If the clipboard doesn't contain image data, this function returns None.
You can use isinstance to check if the function returned a valid image object, or something else:
im = ImageGrab.grabclipboard()
if isinstance(im, Image.Image):
... got an image ...
elif im:
for filename in im:
try:
im = Image.open(filename)
except IOError:
pass # ignore this file
else:
... got an image ...
else:
... clipboard empty ...
ImageMath 模块可以用来计算"图像表达式"。这个模块仅提供一个eval函数,它带一个表达式串以及一幅或多幅图像作参数。这个模块仅在 PIL Plus 包中可用。
详见:这里
import Image, ImageMath
im1 = Image.open("image1.jpg")
im2 = Image.open("image2.jpg")
out = ImageMath.eval("convert(min(a, b), 'L')", a=im1, b=im2)
out.save("result.png")
The ImageOps module contains a number of 'ready-made' image processing operations. This module is somewhat experimental, and most operators only work on L and RGB images.
详见:这里
要使用ImagePalette 类和相关的函数,要导入ImagePalette 模块。
详见:这里
#1. 将调色板添加到图像 (Sequence Syntax)
palette = []
for i in range(256):
palette.extend((i, i, i)) # grayscale wedge
assert len(palette) == 768
im.putpalette(palette)
#2. 将调色板添加到图像 (Not Yet Supported)
import ImagePalette
palette = ImagePalette.ImagePalette("RGB")
palette.putdata(...)
im.putpalette(palette)
#3. Getting the Palette Contents Using Resize/Convert
assert im.mode == "P"
lut = im.resize((256, 1))
lut.putdata(range(256))
lut = lut.convert("RGB").getdata()
# lut now contains a sequence of (r, g, b) tuples
ImagePath 模块用来存储和操作二维向量数据。路径对象可以被传到ImageDraw模块中的方法中。
详见:这里
ImagePath.Path(coordinates) => Path instance
创建一个路径对象。坐标表coordinates可以是任何包含2元组 [ (x, y), ... ] 或者数字值 [ x, y, ... ]的序列对象。
The ImageQt module contains support to create PyQt4 QImage objects from PIL images.
详见:这里
ImageQt.ImageQt(image)
Creates an ImageQt object from a PIL image object.
ImageSequence 模块包含让你能够跌代一个图像序列的包装类。
详见:这里
ImageSequence.Iterator(image) => Iterator instance
创建一个Iterator 对象让你可以循环遍历一个序列中的所有帧。
Iterator 类实现 [] 运算符(Operator [] )
你可以用大于等于0的整数作参数调用这个运算符。如果没有足够的帧,跌代子会抛出一个IndexError异常。
import Image, ImageSequence
im = Image.open("animation.fli")
index = 1
for frame in ImageSequence.Iterator(im):
frame.save("frame%d.png" % index)
index = index + 1
The ImageStat module calculates global statistics for an image, or for a region of an image.
详见:这里
stat.count
stat.sum
stat.mean
stat.stddev
The ImageTk module contains support to create and modify Tkinter BitmapImage and PhotoImage objects from PIL images.
详见:这里
ImageTk.BitmapImage(image, options)
ImageTk.PhotoImage(image)
photo.paste(image, box)
The ImageWin module contains support to create and display images on Windows.
详见:这里
ImageWin can be used with PythonWin and other user interface toolkits that provide access to Windows device contexts or window handles. For example, Tkinter makes the window handle available via the winfo_id method:
dib = ImageWin.Dib(...)
hwnd = ImageWin.HWND(widget.winfo_id())
dib.draw(hwnd, xy)
The PSDraw module provides simple print support for Postscript printers. You can print text, graphics and images through this module.
详见:这里
ps.line(from, to)
ps.rectangle(box)
ps.text(position, text)
ps.image(box, image, dpi=None)
------------------------------------------------------------------------------------------------------------------------------------------
(1). 《在python3下用PIL做图像处理》
(2). 《用Python进行图像处理》
(3).《python图像处理之初窥门径》
(4). PIL的《handbook》