有点小意思

直线段检测算法（LSD：a Line Segment Detector）

1 简介

LSD是一种线段检测算法 $^{[1]}$ ，该方法能在较短的时间内获得较高精度的直线段检测结果。

LSD直线检测算法首先计算图像中所有点的梯度大小和方向，然后将梯度方向变化小且相邻的点作为一个连通域，接着根据每一个域的矩形度判断是否需要按照规则将其断开以形成多个矩形度较大的域，最后对生成的所有的域做改善和筛选，保留其中满足条件的域，即为最后的直线检测结果。该算法的优点在于检测速度快，而且无需参数调节，利用错误控制的方法，提高直线检测的准确度。

2 算法介绍

LSD直线检测方法首先计算每个像素点的水平线（Level-Line）角度，从而形成了一个水平线场（Level-Line Field），即单位矢量场。这里像素点的水平线角度就是该点梯度方向的垂直角度，如图2-1所示，而水平线场就是一个与图像中的点一一对应的矩阵，矩阵中元素的值即为对应到图像中点的水平线角度，如图2-2中间图所示。

获得水平线场后，依据水平线角度用区域生长的方法将其切割成若干个连通域，每个连通域中所有像素点的水平线角度变化不能超过容忍值 $\tau$ ，这样的连通域称为线支持区域（Line Support Regions），每个线支持区域都是线段检测的候选对象。如图2所示，绿色区域、橙色区域和蓝色区域各是一个线支持区域。

获得线支持区域后，把线支持区域的主惯性轴方向作为矩形方向，构造一个包含区域中所有点的矩形，如图2-3所示构造方式在3.6节中详细说明。然后将矩形中所有水平线方向角度与矩形方向角度偏差小于 $\tau$ 的点叫做对齐点（Aligned Point）如图2-4所示，设一个矩形内总的点数为，其中对齐点点数为，这将用于之后验证矩形是否能作为线段检测结果。

矩形的验证方法是基于Desolneux, Moisan, and Morel提出的contrario方法和Helmholtz法则 $^{[2,3]}$ ，所谓的亥姆霍兹原理指出，不应在噪声图像上产生感知（或检测），因此，相反的方法提出定义噪声或相反的模型 $H_{0}$ ，其中不存在期望的结构。在含有线段的情况下，我们对对齐点的数量感兴趣，因此考虑噪声模型中的虚警线段具有与所观测的真实线段一样多或更多对齐点的事件。给定图像和矩形，定义表示矩形中对齐点的数量，表示矩形中像素点的总数，这样上述事件发生的次数即为

$N{_{test}}\cdot P_{H_{0}}[k(r,I)\geq k(r,i)]$

也就是说这种事件发生即表示产生一个直线段检测的虚警。其中 $N{_{test}}$ 表示被考虑到的矩形总数， $P_{H_{0}}$ 表示一个矩形对应的噪声模型中对齐点数量不小于实际模型中对齐点数量的概率。是模型 $H_{0}$ 对应的噪声图像，即为一个各个元素独立同分布的的矩阵，其尺寸与真实图像一致，每一个元素是在 $\left [ 0,2\pi \right ]$ 上服从均匀分布的独立随机变量。

任意一个像素点属于对齐点的概率为

$p=\frac{\tau}{\pi}$

于是矩形对应的噪声模型中对齐点数量不小于实际模型中对齐点数量的概率为

$P_{H_{0}}[k(r,I)\geq k(r,i)]=B(n(r),k(r,i),p)$

$B(n,k,p)=\sum\limits_{j=k}^{n}{\left( \begin{matrix} n \\ j \\ \end{matrix} \right)}{{p}^{j}}{{(1-p)}^{n-j}}$

设图像的尺寸为 $M\times N$ ，矩形的宽度最大为 $\sqrt{MN}$ ，因此所有可能的矩形个数为 $(NM)^{\frac{5}{2}}$ ,考虑到后续对于值还有其他的测试值而不仅仅是 $\tau /\pi$ ，设为 $\gamma$ 个，因此测试矩形总数 $N{_{test}}$ 为

$N{_{test}}=\gamma (NM)^ {\frac{5}{2}}$

最后定义虚警的个数（the Number of False Alarms）为

$NFA(r)={{(NM)}^{5/2}}\gamma \sum\limits_{j=k}^{n}{\left( \begin{matrix} n \\ j \\ \end{matrix} \right)}{{p}^{j}}{{(1-p)}^{n-j}}$

$\begin{pmatrix} n\\ j \end{pmatrix}=\frac{\Gamma (n+1)}{\Gamma (k+1)\cdot \Gamma (n-k+1)}$

设置一个NFA的阈值 $\varepsilon$ ，如果一个矩形满足 $NFA(r,i)\leqslant \varepsilon$ ，那么就可以将其保留为一个直线段检测结果。

整体算法的过程图如图2-5所示。

3 详细论述

3.1 图像缩放

为了解决数字离散图像的阶梯效应，如图3-1所示，两种情况的直线段检测结果是合情合理的，但是并非我们所希望看到的结果。图3-2给出了缩小至原图的80%后再进行直线段检测的结果，两个边缘都被检测出来。

论文给出的缩放比例是原图像的80%，即缩放后是尺寸是 $N\times M$ ，则缩放前是 $1.25N\times 1.25M$ ，缩放的方法用的是高斯降采样，而高斯核的标准差 $\sigma=\Sigma /S$ ，这里 $\Sigma$ 取值0.6，而S取值0.8，可以在避免混叠和避免图像模糊之间获得良好的平衡。

3.2 梯度计算

图像梯度是按照 $2\times 2$ 的掩膜计算的，给出图像的局部灰度值如图3-3所示。

那么梯度计算如下

$g_{x}=\frac{i(x+1,y)+i(x+1,y+1)-i(x,y)-i(x,y+1)}{2}$

$g_{y}=\frac{i(x,y+1)+i(x+1,y+1)-i(x,y)-i(x+1,y)}{2}$

于是水平线角度为

$\arctan (\frac{g_{x}(x,y)}{-g_{y}(x,y)})$

那么梯度幅值为

$G(x,y)=\sqrt{g_{x}^{2}(x,y)+g_{y}^{2}(x,y)}$

3.3 梯度伪排序（Pseudo-Ordering）

一般的排序算法需要 $n\cdot \log n$ 次操作，而伪排序只要线性的时间即可完成，即与排序的点数n呈线性关系。

首先构建1024个bins，然后把图像中所有点根据梯度值分到这些bins中，然后从大到小逐个生长，也就是获得了线支持区域，这里需要说明的是，从不同的点开始生长，得到的线支持区域结果也不一样。

3.4 梯度阈值

梯度值小的像素对应于图像中平滑或者变化较缓的区域，而它们在量化时将会引起更大的梯度计算误差。在LSD算法中，通过设置梯度阈值 $\rho$ ，梯度值小于 $\rho$ 的点不会在线支持区域和矩形中使用。

假设量化噪声为，一个图像为，那么就有观测值

$\tilde{i}=i+n$ $\triangledown \tilde{i}=\triangledown i+\triangledown n$

于是误差角度，如图3-4

$\left | angle\, error \right |\leqslant \arcsin (\frac{q}{\left | \triangledown i \right |})$

要使 $\left | angle\, error \right |\leqslant \tau$ ，所以应有

$\rho=\frac{q}{\sin \tau}$

这里取经验值2。

3.5 区域生长

LSD算法的区域生长跟我们以往所了解的区域生长算法原理大致相同，它利用伪排序得到的排序列表中梯度幅值大的点作为种子点，以该点的水平线角度作为区域的初始角度 $\theta _{region}$ ，然后在八邻域中寻找与 $\theta _{region}$ 的偏差小于容忍值 $\tau$ 的点，然后将该点加入到区域中并更新 $\theta _{region}$ ，更新方式为

$\theta _{region}=\arctan (\frac{\Sigma _{j}\sin (levellineangle_{j})}{\Sigma _{j}\cos(levellineangle_{j})})$

上式中遍历区域中的所有点。当区域中所有点的八邻域中都不满足与 $\theta _{region}$ 的偏差小于容忍值 $\tau$ 时，此时停止生长，算法的处理过程如图3-5所示。

3.6 矩形逼近

对每一个线支持区域在验证之前，需要先进行一次矩形逼近，构造一个特定的包含区域中所有点的矩形。构造的原理如下。

首先把整个区域当做一个实体，而区域中每个像素点的梯度大小为点的质量，这样整个实体就有一个质心，将质心作为矩形的中心点。假设区域中点的坐标为，对应的质量为，那么矩形的中心 $(c_{x},c_{y})$ 为

$c_{x}=\frac{\Sigma _{j\in region}G(j)\cdot x(j)}{\Sigma _{j\in region}G(j)}$ ， $c_{y}=\frac{\Sigma _{j\in region}G(j)\cdot y(j)}{\Sigma _{j\in region}G(j)}$

然后确定矩形的朝向角度，其角度设置为与矩阵M的最小特征值相关联的特征向量的角度。

$M=\begin{bmatrix} m^{xx} &m^{xy} \\ m^{xy} & m^{yy} \end{bmatrix}$

其中 $m^{xx}$ ， $m^{yy}$ ， $m^{xy}$ 的值分别为

$m^{xx}=\frac{\Sigma _{j\in region}G(j)\cdot (x(j)-c_{x})^{2}}{\Sigma _{j\in region}G(j)}$

$m^{yy}=\frac{\Sigma _{j\in region}G(j)\cdot (y(j)-c_{y})^{2}}{\Sigma _{j\in region}G(j)}$

$m^{xy}=\frac{\Sigma _{j\in region}G(j)\cdot (x(j)-c_{x})(y(j)-c_{y})}{\Sigma _{j\in region}G(j)}$

确定了矩形的中心和矩形的朝向后，包含区域所有点的最小矩形即为逼近得到的矩形。

3.7 对齐点密度（Aligned Points Density）

对于一个线支持区域和对应的逼近矩形，区域中对齐点的数量为，那么该矩形的对齐点密度为

$D(r)=\frac{k}{length(r)\cdot width(r)}$

如果矩形的对齐点密度 $D(r)\geqslant D_{0}$ ，则可以接受该矩形检测结果，如果不满足要求，则对矩形做两种处理：减少角度容忍值 $\tau$ ，根据设置半径对矩形裁剪。

3.8 矩形改善

为了获得更准确的矩形检测结果，需要改善所有的矩形，这也包括 $NFA\geqslant \epsilon$ 的矩形，改善分为以下五个步骤。

尝试较小的值，设初始值为，分别取， $\frac{p}{2}$ ， $\frac{p}{4}$ ， $\frac{p}{8}$ ， $\frac{p}{16}$ ， $\frac{p}{32}$ ；
尝试同时减少矩形的两边，设初始值为，分别取，，，，，；
尝试只减少矩形的长边，设初始值为，分别取，，，，，；
尝试只减少矩形的短边，设初始值为，分别取，，，，，；
尝试更小的值，包括 $\widehat{p}$ ， $\frac{\widehat{p}}{2}$ ， $\frac{\widehat{p}}{4}$ ， $\frac{\widehat{p}}{8}$ ， $\frac{\widehat{p}}{16}$ ， $\frac{\widehat{p}}{32}$ ，其中 $\widehat{p}$ 为第一步中最小的NFA值对应的值。

以上五个步骤最后只保留最小的NFA所对应的变量值。

从上述可知，对的取值共有11个，因此第2节中计算NFA时， $\gamma =11$ 。

4 示例

这节给出了一些图片以及相应的直线段检测结果。

5 参考文献

[1] Rafael Grompone von Gioi, Jérémie Jakubowicz, Jean-Michel Morel, Gregory Randall. LSD: a Line Segment Detector[J]. Image Processing On Line, 2012(2): 35–55.

[2] Agn`es Desolneux, Lionel Moisan, Jean-Michel Morel, Meaningful Alignments, International Journal of Computer Vision, vol. 40, no. 1, pp. 7-23, 2000.

[3] Agn`es Desolneux, Lionel Moisan, Jean-Michel Morel, From Gestalt Theory to Image Analysis, a Probabilistic Approach, Springer 2008. ISBN: 0387726357

原创性声明：本文属于作者原创性文章，小弟码字辛苦，转载还请注明出处。谢谢~

代码下载请到https://download.csdn.net/download/weixin_42647783/11094711。

小编初次写博文，可能有些地方表述的不够得体和清晰，有存在的任何问题，欢迎评论和指正，谢谢各路大佬。

有需要图像处理相关技术支持的可咨询QQ：297461921

你可能感兴趣的:(图像处理)

【图像处理基石】如何检测到画面中的ppt并对其进行增强？
1.入门版ppt检测增强工具我们介绍一个使用Python进行PPT检测并校正画面的实现方案。这个方案主要利用OpenCV进行图像处理，通过边缘检测和透视变换技术来识别并校正PPT画面。importcv2importnumpyasnpfromPILimportImageimportmatplotlib.pyplotaspltclassPPTDetector:def__init__(self):#初始
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
基于FPGA的二维FFT实现廉连曼
基于FPGA的二维FFT实现【下载地址】基于FPGA的二维FFT实现本项目提供了一种基于FPGA的高效二维FFT实现方案，专为数字信号处理和图像处理领域设计。通过并行使用两个一维FFT单元，本方案显著提升了二维FFT变换的计算效率，并基于Xilinx的FFTIP核，确保易于集成到其他FPGA设计中。该方案适用于各类频谱分析场景，尤其适合图像处理系统。经过Verilog编程和Modelsim仿真测试
基于FPGA的快速傅里叶变换（FFT）设计在嵌入式系统中的应用风吹麦很 fpga开发嵌入式
基于FPGA的快速傅里叶变换（FFT）设计在嵌入式系统中的应用快速傅里叶变换（FastFourierTransform，FFT）是一种重要的信号处理算法，在许多领域中都得到广泛的应用，例如通信系统、雷达技术、图像处理等。为了提高FFT的计算性能和实时性，将其设计为硬件加速器常常是一个明智的选择。本文将介绍基于现场可编程门阵列（Field-ProgrammableGateArray，FPGA）的FF
OpenCvSharp 实现环形文字识别OCR实例（C#） XisVisual_Basic ocr c#计算机视觉 C#
近年来，随着计算机视觉和图像处理的不断发展，光学字符识别（OCR）技术也变得愈发成熟。OCR技术可以将图像中的文字转换为可编辑和可搜索的文本，为人们带来了极大的便利。在本篇文章中，我们将介绍如何使用OpenCvSharp库来实现环形文字的识别。首先，在使用OpenCvSharp之前，我们需要确保已经在项目中引用了该库，并添加相应的命名空间。usingOpenCvSharp;接下来，我们需要准备一张
基于小样本的高光谱图像分类任务：CMFSL方法及Python实现 pk_xz123456 仿真模型算法深度学习分类 python 人工智能深度学习机器学习
基于小样本的高光谱图像分类任务：CMFSL方法及Python实现1.引言高光谱图像分类是遥感图像处理领域的重要研究方向，它在农业监测、环境评估、军事侦察等领域有着广泛的应用。与传统RGB图像不同，高光谱图像包含数百个连续的光谱波段，能够提供丰富的光谱信息。然而，高光谱图像分类面临着维度灾难、样本获取困难等挑战，特别是在小样本条件下，传统分类方法往往表现不佳。针对这一问题，本文介绍一种基于小样本的高
位运算符详解
在C语言中，位运算符（BitwiseOperators）用于对整数类型（如int,unsignedint,long,char等）的二进制位进行操作。这些操作比算术运算更底层，常用于嵌入式开发、驱动开发、图像处理、网络协议、加密等场景。下面是C语言中所有的位运算符及其详解：一、位运算符列表运算符名称功能说明&位与（AND）两个二进制位都为1，结果才为1``位或（OR）^位异或（XOR）两个二进制位不
FDMA读写AXI BRAM交互：FPGA高速数据传输的核心技术芯作者 D1：ZYNQ设计 fpga开发
在图像处理系统中，当1080P视频流以每秒60帧的速度传输时，传统DMA每帧会浪费27%的带宽在地址管理上——而FDMA技术能将这些损失降至3%以内现代FPGA系统中，高效数据搬运往往是性能瓶颈的关键所在。当你在手机上流畅播放4K视频、在自动驾驶系统中实时处理激光雷达点云时，背后都依赖于FDMA（FlexibleDirectMemoryAccess）与AXIBRAM的高效交互技术。本文将深入探讨这
NumPy：科学计算的超能引擎[特殊字符]（深入剖析+实战技巧）码海漫游者8 numpy 其他
文章目录为什么NumPy是Python科学计算的绝对核心？三维痛点直击ndarray：NumPy的核武器剖析内存布局揭秘（超级重要‼️）维度操作黑科技广播机制（Broadcasting）性能屠杀现场️高级技巧武装包️内存映射大文件爱因斯坦求和约定结构化数组真实世界应用场景图像处理机器学习数据预处理踩坑预警⚠️视图vs副本整数溢出性能压榨终极指南避免复制四法则终极加速方案你知道吗？就在你刷短视频的几
opencv初步学习——图像处理2
这一部分主要讲解如何初步地创建一个图像，以及彩色图像我们的一些基本处理方法一、创建一个灰度图像1-1、zeros()函数[NumPy库]要用到这一个函数，首先我们需要调用我们的NumPy库，这一个函数的作用是可以帮助我们生成一个元素值都是0的二维数组，如果我们把这些数据放到一张图片里面去，那么就对应着我们的一个黑色图像。当然我们也可以通过修改数组中的数字大小来改变图像的颜色（但还是灰度图像）（1）
20.XLD轮廓 Echo`` Halcon系统化学习计算机视觉人工智能算法
目录1.xld概念2.画轮廓3.区域转轮廓4.边缘提取算子5.xld特征提取6.提取任意线条7.提取最长的线条8.xld分割10.xld合并11.xld拟合12.xld几何变换13.xld变换14.xld集合运算15.区域和轮廓精度16.轮廓的保存读取17.halcon操作CAD文件18.轮廓测量算子19.同心度计算1.xld概念*图像处理*1.处理对象HObject*1.图像-image*2.区
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
Pillow 安装使用教程小奇JAVA面试安装使用教程 pillow microsoft 深度学习
一、Pillow简介Pillow是Python图像处理库PIL（PythonImagingLibrary）的友好分支，是图像处理的事实标准。它支持打开、编辑、转换、保存多种图像格式，常用于图像批量处理、验证码识别、缩略图生成等应用场景。二、安装Pillow2.1使用pip安装（推荐）pipinstallPillow2.2验证安装importPILprint(PIL.__version__)若无报错
Coze智能体开发：如何批量生成和处理图片王国平 Coze AI Agent智能体开发语言模型人工智能开发语言智能体 Agent
在绘本制作、图片后期制作等场景中，往往需要使用模型来批量生成和处理图片。扣子提供了多个图像处理类节点，支持图像生成、添加水印、画质优化等多种常见的图片处理方式，你可以在批处理节点中嵌套图像生成等图像处理节点，实现图片的批量操作。本文档以绘本制作工作流为例，演示如何通过批处理节点和图像节点实现图像的批量生成和批量处理。效果演示通过绘本制作工作流，你可以批量生成类似以下风格的图片。搭建过程中你也可以根
OpenCV教程——图像模糊。均值模糊，高斯模糊，中值模糊，双边模糊，高斯分布
1.图像模糊图像模糊是图像处理中最简单和常用的操作之一。⚠️使用该操作的原因之一是为了给图像预处理时降低噪声。图像模糊操作背后是数学的卷积计算。卷积操作的原理：常用的图像模糊的方法：均值模糊高斯模糊中值模糊双边模糊这四种模糊方式有时也被称为：均值滤波、高斯滤波、中值滤波和双边滤波。因为模糊属于一种滤波操作，具体关系可参照下图：其中，均值滤波、高斯滤波和中值滤波属于线性滤波；而双边滤波属于非线性滤波
线性代数在图像处理中的应用 --- 纳尼? 2D的高斯核可以通过1D的高斯核直接生成？（秩为1的矩阵）松下J27 Linear Algebra 线性代数图像处理人工智能
二维高斯核，Rank秩等于一的矩阵之前，我在学习图像处理的时候，会经常用到Gaussianblur，也就是二维高斯低通滤波。当时用的都是Matlab中，现成的图像处理库。只需要输入sigma和kernelsize这些参数就行了，完全不需要考虑高斯核中的每个点长啥样。虽然教科书里面也会有一些配图，例如：直到后来，我学习高斯图像金字塔的时候发现，在别人的代码里面，他在生成二维高斯核的时候，并不是直接写
Apple SoC 图像 ISP 与 Neural Engine 联合优化案例分析：性能与质量平衡的实战经验观熵影像技术全景图谱：架构调优与实战接口隔离原则影像 Camera
AppleSoC图像ISP与NeuralEngine联合优化案例分析：性能与质量平衡的实战经验关键词：AppleSoC、ISP优化、NeuralEngine协同、图像处理性能、DeepFusion、SmartHDR、实时推理、多核异构计算、功耗管理摘要：随着图像计算复杂度的不断提升，AppleSoC中的ISP与NeuralEngine（NE）联合优化成为提升拍照性能和图像质量的关键路径。本文结合最
Chapter6: ISP架构和处理模块-之-ISP模块 ifuleyou1668 Camera QC android
高通（Qualcomm）图像信号处理器（ISP）是摄像头系统中的核心组件，用于实时处理从摄像头传感器获取的图像数据。高通ISP包含多个模块，每个模块负责一部分图像处理任务。以下是高通CameraISP中常见的一些关键模块：1.RawDataInputInterfaceSensorInterface:接受来自摄像头传感器的原始数据，一般通过MIPICSI-2接口。2.LensShadingCorre
内嵌式触摸显示器在工业视觉设备中的应用 Jwest2021 计算机外设
内嵌式触摸显示器在工业视觉设备中的应用日益广泛，其重要性不容忽视。以下是对内嵌式触摸显示器在工业视觉设备中应用的具体分析：一、应用背景工业视觉设备是智能制造的重要组成部分，它依赖于先进的图像处理和机器视觉技术，实现对生产线上产品质量的自动化检测和控制。随着工业4.0和智能制造的推进，工业视觉设备在生产线上的作用愈发关键。而内嵌式触摸显示器作为人机交互的重要界面，为工业视觉设备提供了直观、便捷的操作
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
验证码破解的可能与不可能：用Python处理图片验证码的原理与限制程序员威哥 python 开发语言
前言验证码（CAPTCHA）是当前互联网防护机制中的重要组成部分，用于区分真人与自动程序。近年来，随着自动化技术发展，验证码破解成为自动化测试、爬虫及安全研究领域的热点。然而，从技术层面来看，验证码破解既有可行之处，也存在根本限制。本文将结合Python图像处理与机器学习技术，深度剖析图片验证码破解的原理、实践与瓶颈。一、验证码的分类及破解难点1.验证码类型字符型验证码纯数字、字母或混合，最常见。
数字图像处理学习笔记 andwhataboutit? 学习笔记
1-图像处理基础_哔哩哔哩_bilibili输出图像像素点需要将图象值要作类型转换，转成Int图像仿射变换线性变换+平移线性变换：1，变换前直线，变换后仍然直线2，直线比例不变3，直线到远点的距离不变仿射变换计算：常见变换：恒等变换：变换前后一致尺度变换：对尺寸作放大或缩小旋转变换：图像旋转但是尺寸不变平移：：位置移动尺寸不变偏移（垂直、水平）：垂直或者水平方向变化代码示例：importcv2im
数字图像处理第二次实验愚戏师数字图像处理 python 图像处理
实验三技术点分析根据实验要求，需要实现以下图像空间域滤波技术：噪声生成：高斯噪声椒盐噪声空间域滤波：均值滤波（3×3,5×5,7×7）中值滤波（3×3,5×5,7×7）最大值滤波最小值滤波图像处理流程：读取原始图像添加噪声（高斯/椒盐）应用各种滤波器可视化对比结果完整示例代码importcv2importnumpyasnpimportmatplotlib.pyplotaspltfrommatplo
FPGA实现JPEG编码器的完整项目指南
本文还有配套的精品资源，点击获取简介：JPEG编码是一种广泛使用的数字图像压缩技术，通过在FPGA上实现该编码器，可以为嵌入式系统提供高效的图像处理。FPGA的可编程逻辑单元使其成为实现JPEG编码的理想平台。实现过程包括颜色空间转换、分块、离散余弦变换（DCT）、量化和熵编码等关键步骤。此外，testbench仿真用于验证设计的功能和性能，而资源优化确保了设计的高效性和低功耗。该实现过程需要深入
python 中值滤波 search7 python
中值滤波是数字信号处理和数字图像处理领域使用较多的预处理技术，使用邻域内所有信号的中位数替换中心像素的值，可以在滤除异常值的情况下较好地保留纹理信息。该技术会在一定程度上造成图像模糊和失真，滤波窗口变大时会非常明显。importnumpyasnpfromPILimportImageimportscipy.signalassignalim=Image.open('lena.jpg')data=[]w
蚁群算法原理与应用详解
本文还有配套的精品资源，点击获取简介：蚁群算法是一种基于蚂蚁寻找食物路径行为的优化算法，它能够有效解决包括旅行商问题、网络路由和多目标优化在内的复杂问题。该算法模拟蚂蚁释放信息素来找到最短路径的过程，通过模拟蚂蚁的行为，算法逐步优化选择路径。蚁群算法具有并行性和全局优化能力，但也面临早熟收敛和参数调整的挑战。它已成功应用于物流优化、通信网络、任务调度、机器学习、图像处理和生物医学等众多领域。1.蚁
Python 开发证件照抠图程序：从零到完整应用 winfredzhang python regm 证件照背景图颜色
在这个数字化时代，证件照的需求无处不在——求职简历、证件申请、网站注册等都需要规范的证件照。传统的方法是去照相馆拍摄或使用复杂的图像处理软件，但作为程序员，我们可以开发一个简单易用的证件照抠图工具。本文将详细介绍如何使用Python的wxPython框架和AI抠图技术，开发一个功能完整的证件照处理程序。C:\pythoncode\new\compressedjpeg30times.py项目概述我们
从0到1掌握OpenCV！Python图像处理实战全解析（附代码+案例）小张在编程 Python学习 opencv python 图像处理
引言你有没有想过，手机里的美颜滤镜如何精准识别五官？监控摄像头如何在人流中锁定可疑目标？医学影像软件如何从CT片中快速标注病灶？这些“神奇操作”的背后，往往藏着一个低调的“图像处理神器”——OpenCV。作为Python生态中最受欢迎的计算机视觉库，它用一行行代码将抽象的像素点变成可操作的“数字画布”。今天，我们就从最基础的图像读写开始，手把手带你解锁OpenCV的“十八般武艺”，从图像处理小白变
2025系统架构师---管道/过滤器架构风格喜欢猪猪 java 开发语言
引言在分布式系统与数据密集型应用主导技术演进的今天，‌管道/过滤器架构风格‌（PipesandFiltersArchitectureStyle）凭借其‌数据流驱动‌、‌组件解耦‌与‌并行处理能力‌，成为处理复杂数据转换任务的核心范式。从Unix命令行工具到实时金融交易引擎，从图像处理流水线到物联网边缘计算，管道/过滤器架构通过将系统拆分为独立处理单元（过滤器）与数据传递通道（管道），实现了功能模块
Python机器学习实战——逻辑回归（附完整代码和结果）小白熊XBX 机器学习机器学习 python 逻辑回归
Python机器学习实战——逻辑回归（附完整代码和结果）关于作者作者：小白熊作者简介：精通c#、Halcon、Python、Matlab，擅长机器视觉、机器学习、深度学习、数字图像处理、工业检测识别定位、用户界面设计、目标检测、图像分类、姿态识别、人脸识别、语义分割、路径规划、智能优化算法、大数据分析、各类算法融合创新等等。联系邮箱：[email protected]科研辅导、知识付费答疑、个性化定制
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他