链接:《我在Vscode学OpenCV 处理图像》
属性— API
形状 img.shape
图像大小 img.size
数据类型 img.dtype
shape:如果是彩色图像,则返回包含行数、列数、通道数的数组;如果是二值图像或者灰度图像,则仅返回行数和列数。通过该属性的返回值是否包含通道数,可以判断一幅图像是灰度图像(或二值图像)还是彩色图像。
size:返回图像的像素数目。其值为“行×列×通道数”,灰度图像或者二值图像的通道数为 1。
# 用shape()属性
# shape[0]是宽度
# shape[1]是高度
# shape[2]是通道数(深度)
newimg.size
newimg.shape # (1280, 1706, 3)
# print(1280*1706*3)
dtype:返回图像的数据类型
需要两个图像相同大小
你可以使用OpenCV的cv.add0函数把两幅图像相加,或者可以简单地通过numpy操作添加两个图像,如res= img1 + img2。两个图像应该具有相同的大小和类型,或者第二个图像可以是标量值(即:可以是一个数值)。
注意:OpenCV加法和Numpy加法之间存在差异。OpenCV的加法是饱和操作,而Numpy添加是模运算。
x=np.uint8([250])
y=np.uint8([10])
print(cv.add(x,y))# [[255]]
#原因: (250+10)=260 =>255
print(x+y)# [4]
#原因: (250+10)=260%256=4
import numpy as np
import cv2 as cv
a=1,123,123
b=2333
print(cv.add(a, b))
print(np.add(a, b))
在Python中,逗号(,)用于分隔多个数值,但它不会像小数点(.)一样表示小数。所以在你的例子中,a被解释为一个整数1,以及两个整数123和123。而b仍然是一个整数2333。
当你使用np.add(a, b)
时,Numpy会将a和b作为两个独立的元素进行相加运算。在这种情况下,由于a实际上表示的是3个元素,所以Numpy会将b重复3次,然后进行逐个元素相加的运算。
所以,结果是array([[2334, 2356, 2356]])
,每个元素分别是1+2333,123+2333,123+2333。请注意,这与你之前提供的期望结果(array([[2334.],[2456.],[2456.123]]))
不同。如果你想得到相同的结果,应该将a定义为一个包含一个元素的列表或数组,即a=[1, 123, 123.123]。
这是为了在输出时节省空间,并使结果更易读。例如,对于一个很大的数字2334,OpenCV可能会以2.334e+03的形式进行表示,其中e+03表示10的3次方,即1000。这种表示方法可以更简洁地表示大数字,并且更容易读取和理解。
NumPy的加法是模运算,即当像素值溢出时,会对结果进行取模操作。
mod()是取模运算,“mod(a+b, 256)”表示计算“a+b 的和除以 256 取余数”
需要注意,这是由数组的类型 dtype=np.uint8 所规定的。
使用函数 cv2.add()对像素值 a 和像素值 b 进行求和运算时,会得到像素值对应图像的饱和值(最大值)。
形式 1:计算结果=cv2.add(图像 1,图像 2),两个参数都是图像,此时参与运算的图像大小和类型必须保持一致。
形式 2:计算结果=cv2.add(数值,图像),第 1 个参数是数值,第 2 个参数是图像,此时
将超过图像饱和值的数值处理为饱和值(最大值)。
形式 3:计算结果=cv2.add(图像,数值),第 1 个参数是图像,第 2 个参数是数值,此时
将超过图像饱和值的数值处理为饱和值(最大值)。
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 读取图像
img1 = cv.imread("./Pic/test_img.jpg")
img2 = cv.imread("./Pic/test_img.jpg")
# 2 加法操作
img3 = cv.add(img1,img2) # cv中的加法
img4 = img1+img2 # 直接相加
# 3 图像显示
fig,axes=plt.subplots(nrows=1,ncols=5,figsize=(10,8),dpi=100)
axes[0].imshow(img3[:,:,::-1])
axes[0].set_title("cv中的加法")
axes[1].imshow(img4[:,:,::-1])
axes[1].set_title("直接相加")
axes[2].imshow(img1-img2)
axes[3].imshow(img1*img2)
axes[4].imshow(img1/img2)
plt.show()
没问题!以下是代码中每个参数和函数的解释:
```python
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
:导入NumPy库,并将其别名设置为np
。NumPy提供了高效的数值运算支持。
import cv2 as cv
:导入OpenCV库,并将其别名设置为cv
。OpenCV是一种常用的计算机视觉库,提供各种图像处理功能。
import matplotlib.pyplot as plt
:从Matplotlib库中导入pyplot模块,并将其别名设置为plt
。Matplotlib是一个用于在Python中可视化数据的绘图库。
img1 = cv.imread("./Pic/test_img.jpg")
img2 = cv.imread("./Pic/test_img.jpg")
cv.imread("./Pic/test_img.jpg")
:使用OpenCV的imread()
函数从"./Pic/"目录中读取名为"test_img.jpg"的图像文件。图像数据存储在变量img1
和img2
中。img3 = cv.add(img1, img2) # cv中的加法
img4 = img1 + img2 # 直接相加
cv.add(img1, img2)
:使用OpenCV的add()
函数对img1
和img2
进行逐元素相加操作。该函数将两幅图像对应位置的像素值相加,并返回结果图像,存储在变量img3
中。
img1 + img2
:使用NumPy的加法运算符对img1
和img2
进行逐元素相加操作。它直接相加两幅图像对应位置的像素值,没有限制或约束,并将结果存储在变量img4
中。
fig, axes = plt.subplots(nrows=1, ncols=5, figsize=(10, 8), dpi=100)
axes[0].imshow(img3[:, :, ::-1])
axes[0].set_title("cv中的加法")
axes[1].imshow(img4[:, :, ::-1])
axes[1].set_title("直接相加")
axes[2].imshow(img1 - img2)
axes[3].imshow(img1 * img2)
axes[4].imshow(img1 / img2)
plt.show()
plt.subplots(nrows=1, ncols=5, figsize=(10, 8), dpi=100)
:创建一个包含多个子图的图形对象。它创建了一个拥有1行5列的子图网格,指定了大小为(10, 8)英寸和分辨率为100点每英寸(dpi)。生成的图形对象和子图对象分别存储在变量fig
和axes
中。
axes[0].imshow(img3[:, :, ::-1])
:在第一个子图(axes[0])中显示图像img3
。img3[:, :, ::-1]
用于将OpenCV的BGR颜色格式转换为RGB格式,以便与Matplotlib的imshow()
函数显示。
axes[0].set_title("cv中的加法")
:将第一个子图的标题设置为"cv中的加法"。
类似地,后续的代码行使用不同的图像操作(如减法img1 - img2
、乘法img1 * img2
和除法img1 / img2
)显示并设置其他子图的标题。
这个错误是由于在代码中进行图像除法操作时出现了无效值(invalid value)导致的。具体而言,被除数img2中存在某些像素值为零,从而导致了除以零的情况。
要解决这个问题,你可以添加一些额外的处理来处理除以零的情况,例如将零值像素替换为一个非零值或者跳过除以零的计算。
# 处理除以零的情况
with np.errstate(divide='ignore', invalid='ignore'):
img_divide = np.true_divide(img1, img2)
img_divide[~np.isfinite(img_divide)] = 0 # 将无限或无效值替换为零
axes[4].imshow(img_divide)
plt.show()
np.errstate()
上下文管理器来忽略除法操作中的无效值警告,并使用np.true_divide()
进行图像的除法操作。然后,通过使用np.isfinite()
函数找到无限或无效值,并将它们替换为零。
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
img1=np.random.randint(0,256,size=[3,3],dtype=np.uint8)
img2=np.random.randint(0,256,size=[3,3],dtype=np.uint8)
print("+")
print("img1=\n" ,img1)
print("img2=\n",img2)
print("img1+img2=\n",img1+img2)
print("\ncv2.add")
print("cv.add(img1,img2)=\n",cv.add(img1,img2))
print("cv.add(1,img2)=\n",cv.add(1,img2))
当使用加号运算符进行图像像素值相加时,如果和大于255(图像最大像素值),则会对结果进行取模处理。这可能导致本应更亮的像素变暗,因为对于超出255的像素,取模后的值会重新从较小的范围开始。
而使用cv2.add()
函数计算图像像素值的和时,将和大于255的值截断为饱和值255。这种饱和操作使得图像像素值增大,整体上图像会变得更亮。
选择使用哪种方法取决于具体的需求和预期效果。如果希望保留图像的动态范围,可以使用加号运算符;如果想要增强图像的亮度,可以使用cv2.add()
函数。
该函数的作用是创建一个包含多个子图的图像,并返回一个包含子图的figure对象和一个包含每个子图的axes对象的numpy数组。
参数的作用如下:
fig是一个变量,它接收了函数plt.subplots的返回值,即包含子图的figure对象。你可以使用fig变量来对整个图像进行进一步的操作,例如保存图像、设置标题等。
axes是用于绘制子图的对象,可以在一个figure对象中包含多个axes对象来绘制不同的子图。axes的个数没有特定限制,可以根据需要添加任意数量的子图。
将排列方式更改为5行,每一行一个子图,可以调整
plt.subplots()
函数的nrows
参数为 5,ncols
参数为 1。# 创建一个具有5行1列的axes子图网格 fig, axes = plt.subplots(nrows=5, ncols=1) # 在每个子图中绘制不同的内容 axes[0].plot([1, 2, 3], [4, 5, 6]) axes[1].scatter([1, 2, 3], [4, 5, 6]) axes[2].bar([1, 2, 3], [4, 5, 6]) axes[3].hist([1, 2, 3]) axes[4].plot([3, 2, 1], [6, 5, 4]) # 调整子图的间距 plt.tight_layout() # 显示图像 plt.show() ``` 在这个示例中,我们在每个子图中绘制了不同类型的图表,例如折线图、散点图、柱状图和直方图。要访问每个子图,可以使用 `axes` 对象和索引。最后,我们使用 `plt.tight_layout()` 函数来调整子图的间距,以便更好地展示各个子图。
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 读取图像
img1 = cv.imread("./Pic/test_img.jpg")
img2 = cv.imread("./Pic/test_img.jpg")
# 2 加法操作
img3 = cv.add(img1,img2) # cv中的加法
img4 = img1+img2 # 直接相加
# 3 图像显示
fig, axes = plt.subplots(nrows=5, ncols=1, figsize=(10, 8), dpi=100)
axes[0].imshow(img3[:, :, ::-1])
axes[0].set_title("cv中的加法")
axes[1].imshow(img4[:, :, ::-1])
axes[1].set_title("直接相加")
axes[2].imshow(img1 - img2)
axes[3].imshow(img1 * img2)
# 处理除以零的情况
with np.errstate(divide='ignore', invalid='ignore'):
img_divide = np.true_divide(img1, img2)
img_divide[~np.isfinite(img_divide)] = 0 # 将无限或无效值替换为零
axes[4].imshow(img_divide)
plt.show()
# 用shape()属性
# shape[0]是宽度
# shape[1]是高度
# shape[2]是通道数(深度)
newimg.size # print(1280*1706*3)
newimg.shape # (1280, 1706, 3)
在Python中,shape()
是一个NumPy数组对象的方法,可以用于获取数组的形状信息。因此,如果你将图像数据转换为NumPy数组,就可以使用shape()
函数来获取其形状信息。
示例代码如下:
import numpy as np
from PIL import Image
# 加载图像
img = Image.open('image.jpg')
# 将图像转换为NumPy数组
img_array = np.array(img)
# 获取图像数组的形状信息
img_shape = img_array.shape
# 打印图像数组的形状信息
print(img_shape)
这样,你就可以通过shape()
函数获得图像数组的形状信息,其中==img_shape
将是一个元组==,包含图像的宽度、高度和通道数。
>>> x = np.array([1, 2, 3, 4])
>>> x.shape
(4,)
>>> y = np.zeros((2, 3, 4))
>>> y.shape
(2, 3, 4)
>>> y.shape = (3, 8)
>>> y
array([[ 0., 0., 0., 0., 0., 0., 0., 0.],
[ 0., 0., 0., 0., 0., 0., 0., 0.],
[ 0., 0., 0., 0., 0., 0., 0., 0.]])
>>> y.shape = (3, 6)
Traceback (most recent call last):
File "" , line 1, in <module>
ValueError: total size of new array must be unchanged
>>> np.zeros((4,2))[::2].shape = (-1,)
Traceback (most recent call last):
File "" , line 1, in <module>
AttributeError: Incompatible shape for in-place modification. Use
`.reshape()` to make a copy with the desired shape.
首先,创建一个包含四个元素的一维数组
x
,然后通过x.shape
获取其形状,结果是(4,)
,表示这是一个长度为4的一维数组。接着,创建一个由0填充的三维数组
y
,其形状是(2, 3, 4)
,表示这是一个2x3x4的三维数组。使用
y.shape = (3, 8)
,将y
的形状更改为(3, 8)
,这意味着它现在是一个3x8的三维数组。原始数据保持不变,但形状改变了。接下来,尝试将
y
的形状更改为(3, 6)
,但这会引发一个ValueError
,因为新的形状要求数组的总大小必须保持不变。在这种情况下,新形状(3, 6)
的总大小(18)与原始形状(3, 8)
的总大小(24)不同,所以抛出了异常。最后一个示例尝试将形状应用于使用切片的数组
np.zeros((4, 2))[::2]
,它会引发AttributeError
,因为这种情况下的切片不允许原地修改形状。提示建议使用.reshape()
方法,以便创建一个具有所需形状的副本。总之,
shape
属性允许你更改NumPy数组的形状,但要确保新形状的总大小与原始形状的总大小一致。如果无法在原地修改形状,则需要使用.reshape()
方法来创建一个新数组。
**