MMagicLoren

Opencv-Python学习笔记（八）：图像金字塔

本篇博客记录学习OpenCV中的图像金字塔。

使用图像金字塔创建一个新的水果“ 橘子苹果”。
将要学习的函数为：cv2.pyrUp（），cv2.pyrDown（）。

一般情况下，我们要处理的是一副具有固定分辨率的图像。但是有些情况下，我们需要对同一图像的不同分辨率的子图像进行处理。比如，我们要在一幅图像中查找某个目标，比如脸，我们不知道目标在图像中的尺寸大小。这种情况下，我们需要创建一组具有不同分辨率的图像，我们把这组图像叫做图像金字塔（简单来说就是同一图像的不同分辨率的子图集合）。如果我们把最大的图像放在底部，最小的放在顶部，看起来就像一座金字塔，故而得名图像金字塔。
图像金字塔有两类：高斯金字塔和拉普拉斯金字塔。
高斯金字塔的顶部是通过将底部图像中连续的行和列去除得到的。顶部图像中的每个像素值等于下一层图像中 5 个像素的高斯加权平均值。这样操作一次一个 MxN 的图像就变成了一个 M/2xN/2 的图像。所以这幅图像的面积就变为原来图像面积的四分之一。这被称为 Octave。连续进行这样的操作我们就会得到一个分辨率不断下降的图像金字塔。我们可以使用函cv2.pyrDown() 和 cv2.pyrUp() 构建图像金字塔。函数 cv2.pyrDown() 从一个高分辨率大尺寸的图像向上构建一个金子塔（尺寸变小，分辨率降低）。

高斯金字塔：向下采样方法（缩小）（等于 高斯模糊+降采样）

操作分为两步：

将Gi与高斯内核卷积，例如：
将所有偶数行和列去除

高斯金字塔：向上采样方法（放大）（等于 扩大+卷积）

操作同样分为两步：

例如：

$\begin{bmatrix} 10 &30 \\ 59 & 96 \end{bmatrix}\Rightarrow \begin{bmatrix} 10 & 0 & 30 &0 \\ 0& 0 & 0 & 0\\ 56&0 & 96&0 \\ 0& 0& 0& 0 \end{bmatrix}$

将图像在每个方向扩大为原来的两倍，新增的行和列用0填充。
使用先前同样的内核（乘以四）与放大后的图像卷积，得到近似值。

接下来我们看一下各自的效果：

上采样：

代码：

# -*- coding: utf-8 -*-
# @Time    : 2019/10/19 21:32
# @Author  : MMagicLoren
# @Email   : [email protected]
# @File    : 图像金字塔.py
# @Software: PyCharm
import cv2 as cv
import numpy as np


if __name__ == '__main__':
    src = cv.imread("F:/Pycharm/opencv_exercises-master/images/CrystalLiu4.jpg")  # 读入图片放进src中
    cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)  # 创建窗口, 窗口尺寸自动调整
    cv.imshow("input image", src)
    print(src.shape)  # 原始图像大小
    up = cv.pyrUp(src)
    cv.imshow("up image", up)
    print(up.shape)

    cv.waitKey(0)  # 等有键输入或者1000ms后自动将窗口消除，0表示只用键输入结束窗口
    cv.destroyAllWindows()

下采样：

代码：

# -*- coding: utf-8 -*-
# @Time    : 2019/10/19 21:32
# @Author  : MMagicLoren
# @Email   : [email protected]
# @File    : 图像金字塔.py
# @Software: PyCharm
import cv2 as cv
import numpy as np


if __name__ == '__main__':
    src = cv.imread("F:/Pycharm/opencv_exercises-master/images/CrystalLiu4.jpg")  # 读入图片放进src中
    cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)  # 创建窗口, 窗口尺寸自动调整
    cv.imshow("input image", src)
    print(src.shape)  # 原始图像大小
    # up = cv.pyrUp(src)
    # cv.imshow("up image", up)
    # print(up.shape)
    down = cv.pyrDown(src)
    cv.imshow("down image", down)
    print(down.shape)
    cv.waitKey(0)  # 等有键输入或者1000ms后自动将窗口消除，0表示只用键输入结束窗口
    cv.destroyAllWindows()

我们再用更形象的一种方法进行展示。

# -*- coding: utf-8 -*-
# @Time    : 2019/10/19 21:32
# @Author  : MMagicLoren
# @Email   : [email protected]
# @File    : 图像金字塔.py
# @Software: PyCharm
import cv2 as cv
import numpy as np


def pyramids_demo(image):
    level = 3
    temp = image.copy()
    pyramid_images = []  # 定义一个图像list

    for i in range(level):
        dst = cv.pyrDown(temp)
        pyramid_images.append(dst)
        cv.imshow("pyramid_down_"+str(i+1), dst)
        temp = dst.copy()
    return pyramid_images


if __name__ == '__main__':
    src = cv.imread("F:/Pycharm/opencv_exercises-master/images/CrystalLiu4.jpg")  # 读入图片放进src中
    cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)  # 创建窗口, 窗口尺寸自动调整
    cv.imshow("input image", src)
    print(src.shape)  # 原始图像大小
    # up = cv.pyrUp(src)
    # cv.imshow("up image", up)
    # print(up.shape)
    # down = cv.pyrDown(src)
    # cv.imshow("down image", down)
    # print(down.shape)
    pyramids_demo(src)
    cv.waitKey(0)  # 等有键输入或者1000ms后自动将窗口消除，0表示只用键输入结束窗口
    cv.destroyAllWindows()

同理，我们也可以得到上采样的图像。

注意，当我们对一幅图像先做上采样再做下采样（或者先做下采样后做上采样）后得到的图像与原图像是不相等的。

接下来我们再看拉普拉斯金字塔：

拉普拉斯金字塔由高斯金字塔形成。没有专用功能。拉普拉斯金字塔图像仅像边缘图像。它的大部分元素为零。它们用于图像压缩。拉普拉斯金字塔的层由高斯金字塔的层与高斯金字塔的上层的扩展版本之间的差形成。计算公式为：

$L_{i}=G_{i}-PyrUp(PyrDown(G_{i}))$

# -*- coding: utf-8 -*-
# @Time    : 2019/10/19 21:32
# @Author  : MMagicLoren
# @Email   : [email protected]
# @File    : 图像金字塔.py
# @Software: PyCharm
import cv2 as cv
import numpy as np


def laplace_demo(image):  # 注意：图片必须是满足2^n这种分辨率
    down = cv.pyrDown(image)
    down_up = cv.pyrUp(down)
    lpls = image - down_up
    cv.imshow("lpls image", lpls)


if __name__ == '__main__':
    src = cv.imread("F:/Pycharm/opencv_exercises-master/images/messi5.jpg")  # 读入图片放进src中
    cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)  # 创建窗口, 窗口尺寸自动调整
    cv.imshow("input image", src)
    print(src.shape)  # 原始图像大小
    # up = cv.pyrUp(src)
    # cv.imshow("up image", up)
    # print(up.shape)
    # down = cv.pyrDown(src)
    # cv.imshow("down image", down)
    # print(down.shape)
    # pyramids_demo(src)
    laplace_demo(src)
    cv.waitKey(0)  # 等有键输入或者1000ms后自动将窗口消除，0表示只用键输入结束窗口
    cv.destroyAllWindows()

# -*- coding: utf-8 -*-
# @Time    : 2019/10/19 21:32
# @Author  : MMagicLoren
# @Email   : [email protected]
# @File    : 图像金字塔.py
# @Software: PyCharm
import cv2 as cv
import numpy as np


def laplace_demo(image):  # 注意：图片必须是满足2^n这种分辨率
    pyramid_images = pyramids_demo(image)
    level = len(pyramid_images)

    for i in range(level-1, -1, -1):
        if i-1 < 0:
            expand = cv.pyrUp(pyramid_images[i], dstsize=image.shape[:2])
            lpls = cv.subtract(image, expand)
            cv.imshow("laplace_demo"+str(i), lpls)
        else:
            expand = cv.pyrUp(pyramid_images[i], dstsize=pyramid_images[i-1].shape[:2])
            lpls = cv.subtract(pyramid_images[i-1], expand)
            cv.imshow("laplace_demo"+str(i), lpls)


if __name__ == '__main__':
    src = cv.imread("F:/Pycharm/opencv_exercises-master/images/lena.jpg")  # 读入图片放进src中
    cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)  # 创建窗口, 窗口尺寸自动调整
    cv.imshow("input image", src)
    print(src.shape)  # 原始图像大小
    # up = cv.pyrUp(src)
    # cv.imshow("up image", up)
    # print(up.shape)
    # down = cv.pyrDown(src)
    # cv.imshow("down image", down)
    # print(down.shape)
    # pyramids_demo(src)
    laplace_demo(src)
    cv.waitKey(0)  # 等有键输入或者1000ms后自动将窗口消除，0表示只用键输入结束窗口
    cv.destroyAllWindows()

完整工程代码：

# -*- coding: utf-8 -*-
# @Time    : 2019/10/19 21:32
# @Author  : MMagicLoren
# @Email   : [email protected]
# @File    : 图像金字塔.py
# @Software: PyCharm
import cv2 as cv
import numpy as np


def pyramids_demo(image):
    level = 3
    temp = image.copy()
    pyramid_images = []  # 定义一个图像list

    for i in range(level):
        dst = cv.pyrDown(temp)
        pyramid_images.append(dst)
        cv.imshow("pyramid_down_"+str(i+1), dst)
        temp = dst.copy()
    return pyramid_images


def laplace_demo(image):  # 注意：图片必须是满足2^n这种分辨率
    pyramid_images = pyramids_demo(image)
    level = len(pyramid_images)

    for i in range(level-1, -1, -1):
        if i-1 < 0:
            expand = cv.pyrUp(pyramid_images[i], dstsize=image.shape[:2])
            lpls = cv.subtract(image, expand)
            cv.imshow("laplace_demo"+str(i), lpls)
        else:
            expand = cv.pyrUp(pyramid_images[i], dstsize=pyramid_images[i-1].shape[:2])
            lpls = cv.subtract(pyramid_images[i-1], expand)
            cv.imshow("laplace_demo"+str(i), lpls)


if __name__ == '__main__':
    src = cv.imread("F:/Pycharm/opencv_exercises-master/images/lena.jpg")  # 读入图片放进src中
    cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)  # 创建窗口, 窗口尺寸自动调整
    cv.imshow("input image", src)
    print(src.shape)  # 原始图像大小
    # up = cv.pyrUp(src)
    # cv.imshow("up image", up)
    # print(up.shape)
    # down = cv.pyrDown(src)
    # cv.imshow("down image", down)
    # print(down.shape)
    # pyramids_demo(src)
    laplace_demo(src)
    cv.waitKey(0)  # 等有键输入或者1000ms后自动将窗口消除，0表示只用键输入结束窗口
    cv.destroyAllWindows()

Python+openCV4:AttributeError: ‘NoneType‘ object has no attribute ‘shape‘ xxyAI openCV opencv
详细解决方案参考下方链接https://www.pyimagesearch.com/2016/12/26/opencv-resolving-nonetype-errors/
Python+Opencv4点仿射变换技术挖掘者 opencv python
目录一、场景需求解读二、算法原理简介三、算法实现步骤四、算法代码实现五、算法效果展示与分析六、思维拓展参考资料注意事项一、场景需求解读在处理现实生活中的图像处理问题时，我们经常会遇到一种情况-即我们将要处理的目标的位置是斜的，我们需要使用仿射变换进行矫正。当你做了很多现实场景中的案例之后，你就会发现这是一个非常通用的模块，因而本篇博客针对这个问题进行了详细的论述，具体的案例如下图所示，左边表示
学习python imutils透视变换缘梦逍遥
pythonimutils透视变换将梯形校正为方形Python+Opencv4点仿射变换imutils--图像处理工具包在opencv基础上对一些方法进行了再次加工，使这些方法更加简单易用，包括translation,rotation,resizing,skeletonization,anddisplayingMatplotlibimages等。github主页:https://github.co
Python+OpenCV4：读写输入和输出的简单实践（图片、视频、摄像头）雨先生
典型的文件处理流程如下：利用命令行参数sys.argv命令行参数是读取文件时常用的方式。命令行参数保存在sys.argv的列表中，列表的第一个元素是脚本名称，后面的元素是命令行参数：通过以下脚本sys_argv.py可以熟悉命令行参数的获取：1importsys23print(f'运行的脚本名是：{sys.argv[0]}')4print(f'sys.argv列表的长度是：{len(sys.arg
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

Opencv-Python学习笔记（八）：图像金字塔

你可能感兴趣的:(Python+opencv4)