pip install pillow
from PIL import Image, ImageDraw
opencv要比PIL, plt的速度更快一些
但是opencv读入的图片的shape是(h,w,3), 有时候容易出问题
PIL对图片的操作是RGB格式
1、读取一张图片:
img=Image.open('C:/Users/admin/Desktop/WallPaper/d.png')
得到的img是一个类
注意得到的img的size是(w,h),没有channel维, 而如果用cv2.imread得到的是(h,w,3)的
此时如果用np.asarray()转成numpy array, 就是(h,w,3)的shape
可以查看图片的大小size,mode,format
得到的img的size是(w,h)
查看图片像素值
稍微麻烦一点
img.getdata()是获取整个图片的像素值,但是是1D的,即len为h*w
from PIL import Image from torchvision import transforms import numpy as np img = Image.open('1.jpg') x = list(img.getdata()) #len为h*w的list x = np.stack(x) #[h*w,3] x = x.reshape(img.size[0], img.size[1], -1) #[h,w,3]
获取某个位置的像素值可以用
可以用
img.getpixel(x,y)
2、显示一张图片:
img.show()
并列显示多张图片
from PIL import Image from torchvision import transforms import numpy as np import cv2 img = Image.open('1.jpg') transform_1 = transforms.FiveCrop(100) img_1 = transform_1(img) #此时img_1是len为5的tuple,每个元素是一个PIL.Image img_new = np.hstack(img_1) img_new = cv2.cvtColor(img_new, cv2.COLOR_RGB2BGR) cv2.imwrite('test_1.jpg', img_new)
3. 保存图片:
img.save("save.gif","GIF") #保存图像为gif格式 img.save("newImg.png","PNG")
4、创建新图片:
img = Image.new(mode, size) img = Image.new(mode, size, color)
如果color不赋值,就默认为0
举例:
img_b = Image.new("RGB",(32,32))#不指定color,则为黑色#000000 img_r = Image.new("RGB",(32,32),"red") img_g = Image.new("RGB",(32,32),"#00FF00")
5、图片缩放 Image.resize()
img.resize((width, height),Image.ANTIALIAS)
第二个参数:
Image.NEAREST :低质量
Image.BILINEAR:双线性
Image.BICUBIC :三次样条插值
Image.ANTIALIAS:高质量6、img.paste() 图片贴图/图片合并
img.paste(img2,(x,y))
将img2图片贴到img上面,x,y是粘贴起始点的横纵坐标
7. 绘制矩形
ImageDraw
模块为Image对象提供简单的2D图形。可以使用该模块来创建新图像,注释或修饰现有图像PIL.ImageDraw.Draw.rectangle(xy, fill=None, outline=None)
需要新建一个Draw对象,用这个对象在img上绘图
# importing image object from PIL import math from PIL import Image, ImageDraw img = Image.open('abc.jpg') # create rectangle image imgdraw = ImageDraw.Draw(img) x1,y1,x2,y2 = 220, 190 ,300,250 # imgdraw.rectangle(xy=(x1,y1,x2,y2), fill ="# ffff33", outline ="red") imgdraw.rectangle(xy=(x1,y1,x2,y2), outline ="red", width=2) img.save('1.jpg')
imgdraw.rectangle(xy=(x1,y1,x2,y2), outline ="red", width=2) 或 imgdraw.rectangle(xy=((x1,y1),(x2,y2)), outline ="red", width=2)
8.
绘制多边形polygon
多边形轮廓由给定坐标之间的直线以及最后一个坐标与第一个坐标之间的直线组成。
ImageDraw.Draw.polygon(xy, fill=None, outline=None)
参数:
xy –由[[x,y),(x,y),…]等2元组或[x,y,x,y,…]等数值组成的序列。
轮廓–轮廓使用的颜色。
fill –用于填充的颜色。
9. ImageDraw.textsize() 获取文字的大小
image_draw = ImageDraw.Draw(im)
text_size_x, text_size_y = image_draw.textsize(text, font=font)ImageDraw.text() 绘制文字
image_draw.text(text_xy, text, font=font, fill=(225, 225, 225, 225))
- text_xy – 文字的左上角位置
- text – 文本. 如果包含换行符需将文本传递给 multiline_text()
- fill – 文字颜色
- font – 字体,需要时 ImageFont 实例。
from PIL import Image from PIL import ImageDraw img = Image.open('cat.jpg') # Call draw Method to add 2D graphics in an image draw = ImageDraw.Draw(img) # Add Text to an image draw.text((28, 36), "nice Cat", fill=(255, 0, 0)) # Save the edited image img.save("cat2.jpg")
原图
10. 两张图片相加
Image.blend(img1, img2, alpha) # 这里alpha表示img1和img2的比例参数
11. 图像类型转换
im=im.convert("RGBA")
12. 图片裁剪
box = (100,100,500,500) #设置要裁剪的区域
region = im.crop(box) #此时,region是一个新的图像对象。
13. 旋转图像:
out = img.rotate(45) #逆时针旋转45度
有更方便的:
region = region.transpose(Image.ROTATE_180)14、 convert()函数 & PIL的mode
image.convert()
用于不同模式图像之间的转换
image.convert('RGBA')就是把图像转换成RGBA模式
PIL中有九种不同模式,分别为1,L,P,RGB,RGBA,CMYK,YCbCr,I,F
- 模式“1”为二值图像,每个像素用8bit表示,0表示黑,255表示白c
- 模式L为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度c
- 模式“P”为8位彩色图像,它的每个像素用8个bit表示,其对应的彩色值是按照调色板查询出来的
- 模式“RGBA”为32位彩色图像,它的每个像素用32个bit表示,其中24bit表示红色、绿色和蓝色三个通道,另外8bit表示alpha通道,即透明通道。
- 模式“CMYK”为32位彩色图像,它的每个像素用32个bit表示。模式“CMYK”就是印刷四分色模式,它是彩色印刷时采用的一种套色模式。四种标准颜色是:C:Cyan = 青色,又称为‘天蓝色’或是‘湛蓝’M:Magenta = 品红色,又称为‘洋红色’;Y:Yellow = 黄色;K:Key Plate(blacK) = 定位套版色(黑色)。
- 模式“YCbCr”为24位彩色图像,它的每个像素用24个bit表示。其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化。
- 模式“I”为32位整型灰色图像,它的每个像素用32个bit表示,0表示黑,255表示白,(0,255)之间的数字表示不同的灰度
- 模式“F”为32位浮点灰色图像,它的每个像素用32个bit表示,0表示黑,255表示白,(0,255)之间的数字表示不同的灰度
对于彩色图像,不管其图像格式是PNG,还是BMP,或者JPG,在PIL中,使用Image模块的open()函数打开后,返回的图像对象的模式都是“RGB”
对于灰度图像,不管其图像格式是PNG,还是BMP,或者JPG,打开后,其模式为“L”。
查看当前图像的模式
im.mode
11、Image.alpha_composite()函数
im = Image.alpha_composite(im1,im2)
将im2复合到im1上,返回一个Image对象
注意:im1和im2的size要相同。且im1和im2的mode都必须是RGBA
12、img.putalpha() 函数
im.putalpha(alpha)
图像 im 必须是 "RGBA",alpha 必须是 "L" 或 "1".
可以将一张与原图尺寸相同的图片写入到原图片的透明通道之中,但不会影响原图片的正常显示. 可用于信息隐藏
如果原图没有透明通道,可以采用 PIL 的 im.convert 函数,转换为 "RGBA" 模式;同时确保要隐藏的信息图像为 "L" 或 "1" 模式.
13、img.point() 函数
通过一个函数或者查询表对图像中的像素点进行处理(例如对比度操作)
如 out = im.point(lambda i: i * 1.2)
11. 通道分离:
r,g,b = im.split()#分割成三个通道 ,此时r,g,b分别为三个图像对象。12. 通道合并:
im = Image.merge("RGB", (b, g, r))#将b,r两个通道进行翻转。15. 图像转换:
out = im.transpose(Image.FLIP_LEFT_RIGHT)#左右对换。out= im.transpose(Image.FLIP_TOP_BOTTOM)#上下对换
17. 获取某个像素位置的值:
im.getpixel((4,4))18. 写某个像素位置的值:
img.putpixel((4,4),(255,0,0))