O zil

图像处理知识点

对比度、亮度、饱和度

对于一张数字图像来说，将灰度跨越的值域称为动态范围。图像系统的动态范围定义为系统中最大可度量灰度与最小可检测灰度之比，上限取决于饱和度，下限取决于噪声。基本上，动态范围由系统能表示的最低和最高灰度级来确定，因此也是图像具有的动态范围。与这一概念紧密联系的是图像对比度。对比度就是一幅图像中最高和最低灰度级间的灰度差，当一幅图像中像素的数值有高的动态范围时，认为该图像具有高的对比度。亮度就是像素值。

8 bit 图像的解释

当一幅图像有 $2^k$ 个灰度级时，实际上通常称该图像为一幅"k 比特图像"。这跟图像的宽高没有关系。8 bit图像中每个像素点都是用的 8 位二进制数存的。

空间分辨率和灰度分辨率

空间分辨率：图像中可以辨别的最小细节的度量，或者说空间分辨率是指图像中可辨认的临界物体空间几何长度的最小极限，即对细微结构的分辨率。是每英寸图像内，有多少个像素, 分辨率单位为：横向像素点 x 纵向像素点，屏幕像素密度单位为PPI(Pixels Per Inch)，通常叫做：像素每英寸。屏幕像素密度，分辨率，屏幕尺寸的关系如下：

（1）分辨率和屏幕尺寸的关系？
首先屏幕尺寸可以认为是由一个个最小的单位像素块来表示的，比如下面这张图.。

所以分辨率 1024 $\times$ 768 的意思即是在竖向的高度上有1024个像素块，在横向的宽度上有768个像素块，如果屏幕尺寸为 5.7英寸的时候，就说明这个5.7英寸的屏幕上，竖向的高度上有1024个像素块，在横向的宽度上有768个像素块。如果屏幕尺寸为 15.6英寸的时候，就说明就说明这个 15.6 英寸的屏幕上，竖向的高度上有1024个像素块，在横向的宽度上有 768 个像素块。所以分辨率和尺寸之间其实是没什么关系的，就是指在这个尺寸下塞下了多少个像素块，像素块越多表示画面越细腻。比如我们看电视的时候如果用 50 寸的屏幕显示 1920 $\times$ 1080 的图像和用 70 寸的屏幕全屏显示1920 $\times$ 1080 的图像会发现 70英寸的屏幕的颗粒感会强很多。所以，屏幕尺寸一样大的2k的屏幕和1080p的，差距就在2k的屏幕像素块多，也就是每英寸可显示的像素点多，所以更清晰。

灰度分辨率也叫幅度分辨率：是指在幅度值是离散的时候，每个像素都有一个对应的强度值，一般量化时采样8位的，也就是幅度分辨率为 256

图像内插

图像内插就是用已知数据来估计未知位置的数值的处理。在诸如放大、收缩、旋转和几何校正等任务中广泛应用的基本工具。也是一种基本的图像重取样的方法

最近邻内插：
最近临插值算法优点是算法简单，易于实现，但是缺点是由于相邻像素点的像素值相同，容易出现色块现象。
最近邻内插遵循以下公式：
$dstX \times (\frac{srcWidth} {dstWidth}) = srcX$
$dstY \times (\frac{srcHeight} {dstHeight}) = srcY$
比如一张 3 $\times$ 3 的图像需要放大为 4 $\times$ 4的图像时，对于目标图的(0,3)位置处的像素，即第一行第四列的坐标的像素值：
$(0\times(3/4),3\times(3/4))=>(0\times0.75,3\times0.75)四舍五入后——>(0,2)$
即目标图的(0, 3)的像素值，等于源图像的(0, 2)的像素值。由目标图的坐标反推得到的源图的的坐标是一个浮点数的时候，采用了四舍五入的方法，直接采用了和这个浮点数最接近的象素的值。
双线性内插（并不是线性的内插）：用 4 个最近邻的像素去估计给定位置的灰度。令 $(x, y)$ 为我们想要赋以灰度值的位置的坐标，并令 $v (x, y)$ 表示灰度值。对于双线性内插来说，赋值是由下面的公式得到的：
$v (x, y) = a x + b y + c x y + d$
其中，4 个系数可以用 $(x, y)$ 最近邻的 4 个最近邻点确定。双线性插值虽然比最近邻插值效果好，但是带来了更多的计算量
双三次内插

三种内插方法后的放大图像的清晰度排行：
双三次内插 > 双线性插值 >> 最近邻插值

图像集合空间变换

仿射变换：仿射变换的一般形式如下：

仿射变换可根据矩阵 T 中元素所选择的值，对一组坐标点做尺度（即放缩）、旋转、平移或偏移。而且可以组合形成多个变换。

图像配准 calibration

图像配准是数字图像处理的一种重要应用，用于对齐两幅或者多幅相同场景的图像。我们已经知道了将图像与一些仿射变换的矩阵相乘可以对图像做几何变换。在图像配准中，我们有可用的输入图像和输出图像，但是，从输入图像产生输出图像的特定变换通常是不知道的，此时问题就是估计变换函数，然后用它配准两幅图像。从图像配准的角度来讲，输入图像是我们希望变换的图像，而我们所谓的参考图像是我们想要配准输入图像的图像。

像素间的关系

4邻接、8邻接、m邻接
（1）邻域
某一坐标(x, y)处的像素 p 有 4 个水平和垂直的相邻像素，其坐标由下式给出：
$(x + 1, y), (x - 1, y), (x, y - 1), (x, y + 1)$
这组像素称为 p 的 4 邻域，用 $N_4(p)$ 表示。如果(x, y) 位于图像的边界上，则 p 的某些相邻像素位于数字图像的外部。

p 的 4 个对角相邻像素的坐标如下：
$(x + 1, y + 1) ， (x + 1, y - 1), (x - 1, y + 1), (x - 1, y - 1)$
这组像素用 $N_D(p)$ 表示，这 4 个点和 4 个邻点一起称为 p 的 8 邻域，用 $N_8(p)$ 表示。

（2）4 邻接、 8 邻接、 m 邻接
邻接啥的都是要自己定义一个灰度值的，所以满足这个灰度值的位置才能有资格说邻接。所以该像素值的集合称为 V

4 邻接：如果q和p的像素值都是集合V的元素，并且q在黄色区域，那么就说p和q是4邻接的。

8 邻接：如果q和p的像素值都是集合V的元素，并且q在黄色区域，那么就说p和q是8邻接的。
m 邻接：p和q是4邻接的或者 p和q是8邻接且p的四邻域和q的四邻域的交集中没有 V 中的元素
4 连通：对于在像素点p的4邻域内的像素均与像素点p形成4连通
8 连通：对于在像素点p的8邻域内的像素均与像素点p形成8连通

像素间的距离度量

对于像素 p， q 和 z，他们的坐标分别为 (x, y), (s, t) 和 (v, w)。则 p 与 q 之间的距离有如下计算方法

欧氏距离
$D_e(p, q) = [(x - s) ^ 2 + (y - t) ^2]^{ \frac{ 1 } { 2}}$
这种情况下，距 $(x, y)$ 的距离 $D_e$ 小于等于某个值 r 的像素形成一个中心在 $(x, y)$ 且半径为 $r$ 的圆平面。
城区距离
$D_4(p, q) = |x - s| + |y - t|$
这种情况下，距 $(x, y)$ 的距离 $D_4$ 小于等于某个值 r 的像素形成一个中心在 $(x, y)$ 的菱形。
棋盘距离
$D_8(p, q) = max(|x - s|,|y - t|)$
这种情况下，距 $(x, y)$ 的距离 $D_8$ 小于等于某个值 r 的像素形成一个中心在 $(x, y)$ 的方形。 $D_8 = 1$ 的像素就是 $(x, y)$ 的 8 邻域。

灰度、像素、RGB之间的关系

灰度：灰度就是亮度，一般一个像素点的灰度用 8 bit来存储，也就是 256 个灰度，从 0-255 图像由黑色过渡到白色。
像素：像素是针对彩色图像来说的，如果是一副 2D 的图像，它记录了明亮信息，也就是灰度信息的话，那么这个图像的灰度值就是对应位置的像素值。对于彩色图像来说，它的像素点的灰度值就要经过RBG三个通道的映射函数得到，一般按照加权的方式得到灰度值：即R, G, B三个通道的加权为 3 ： 6： 1。

彩色图像的形成过程，彩色图像如何变成灰度图像

三原色 R, G, B可以组合成任意我们想要的颜色，对于每个通道来说，可以认为是一个2D的灰度图。三个通道分别控制三种颜色的明暗，也就是三原色每个颜色的灰度都是 256 个，然后通过三种灰度的叠加从而使显像管显示不同的颜色。人为已经定好了 256 $\times$ 256 $\times$ 256 = 16 兆个色阶了，通过设置不同的三个通道的叠加从而使显像管显示不同的颜色。

彩色图像要变成灰度图像，只需要将三个通道的值设为相等就行了，比如 R = G = B = 0 就是个黑色的灰度图。

图像的空间域操作

空间域指图像平面本身，这类图像处理方法直接以图像中的像素操作为基础。而不把图像变换到其他变换域，在变换域操作完后在转换到空间域。空间域操作主要包括灰度变换和空间滤波两类

图像的灰度变换域空间滤波

灰度变换在单个图像的单个像素上操作，主要以对比度和阈值处理为目的。
空间滤波设计改善性能的操作，如通过图像中每一个像素的邻域处理来锐化图像。

一些基本的灰度变换函数

假设 r 和 s 分别代表变换前后的像素值
1、图像反转。可以得到灰度级范围为 $[0, L - 1]$ 的一幅图像的反转图像
$s = L - 1 - r$
反转一幅图像的灰度级，可得到等效的照片底片。
2、对数变换
对数变换得通用形式为：
$s = c l o g (1 + r)$
由下图对数曲线的形状看出，该变换将输入中范围较窄的低灰度值映射为输出中较宽范围的灰度值。对数变换可以扩展图像中的暗像素的值，同时压缩更高灰度级的值。

3、幂律（伽马）变换
伽马变换的基本形式为：
$cr^\gamma$
其中， $c$ 和 $\gamma$ 为正的常数。又是考虑到偏移量，上式也写为 $\epsilon)^\gamma$
对于不同的 $\gamma$ 值， $s$ 与 $r$ 的关系曲线如下图所示：

与对数变换的情况类似，部分 $\gamma$ 值的幂律曲线将较窄范围的暗色输入值映射为较宽范围的输出值，相反地，对于输入高灰度级值时也成立。然而，与对数函数不同的是，随着 $\gamma$ 值的变换，将简单地得到一簇可能的变换曲线， $\gamma > 1$ 时生成的曲线和 $\gamma < 1$ 时生成的曲线效果完全相反， $\gamma = 1$ 时成了恒等变换。
4、分段线性变换
主要应用：

对比度拉伸：对于一些图像的灰度级动态范围太小导致情况，可以用分段线性变换来实现图像灰度级的拉伸。
灰度级分层：也就是将某一个范围内的灰度突出出来。
比特平面分层

直方图均衡化，直方图规定化

1、均衡化：当一幅图像的对比度比较小的时候，比如灰度范围聚集在坐标轴左边、右边、或者集中等情况是，就可以用直方图均衡化。直方图均衡化(Histogram Equalization)是一种增强图像对比度(Image Contrast)的方法，其主要思想是将一副图像的直方图分布通过累积分布函数变成近似均匀分布，从而增强图像的对比度。为了将原图像的亮度范围进行扩展，需要一个映射函数，将原图像的像素值均衡映射到新直方图中，这个映射函数有两个条件：
（1）不能打乱原有的像素值大小顺序，映射后亮、暗的大小关系不能改变；
（2）映射后必须在原有的范围内，即像素映射函数的值域应在0和255之间；
综合以上两个条件，累积分布函数是个好的选择，因为累积分布函数是单调增函数（控制大小关系），并且值域是0到1（控制越界问题），所以直方图均衡化中使用的是累积分布函数。

均衡化的过程
（1）依次扫描原始灰度图像的每一个像素，得到每个像素的灰度直方图
（2）计算灰度直方图的累计分布函数
（3）根据累计分布函数和直方图均衡化原理得到输入和输出之间的映射关系
（4）最后根据映射关系得到结果进行图像变换

均衡化可以用一个公式来表示：
$\cdot x$ ，其中 $G (x)$ 是映射函数，即累计分布函数。
均衡化一般用的场景，暗图像(灰度聚集在坐标轴左边），亮图像(灰度聚集在坐标轴右边)，低对比度的图像(灰度级的动态范围小)，高对比度的图像(灰度级的动态范围很大，布满整个坐标轴)

2、直方图规定化：所谓直方图规定化，就是通过一个灰度映像函数，将原灰度直方图改造成所希望的直方图。所以，直方图修正的关键就是灰度映像函数。直方图规定化是用于产生处理后有特殊直方图的图像方法。理想情况下，直方图均衡化实现了图像灰度的均衡分布，对提高图像对比度、提升图像亮度具有明显的作用。在实际应用中，有时并不需要图像的直方图具有整体的均匀分布，而希望直方图与规定要求的直方图一致，这就是直方图规定化。它可以人为地改变原始图像直方图的形状，使其成为某个特定的形状，即增强特定灰度级分布范围内的图像。图像直方图是图像处理中一种十分重要的分析工具，它描述了一幅图像的灰度级内容。可以说，直方图均衡化是直方图规定化的一个特例。

3、局部直方图均衡
有时候不需要对整个图片做直方图均衡，可以采用局部直方图均衡的方法。

图像滤波

几种滤波方法

线性滤波

（1）高斯滤波
高斯滤波是最常用的图像去噪方法之一，它能很好地滤除掉图像中随机出现的高斯噪声，但是高斯滤波是一种低通滤波（可以看看高斯滤波核的频率响应图），它在滤除图像中噪声信号的同时，也会对图像中的边缘信息进行平滑，表现出来的结果就是图像变得模糊。高斯滤波之所以会导致图像变得模糊，是因为它在滤波过程中只关注了位置信息；

高斯滤波会导致图像变得模糊，是因为它在滤波过程中只关注了位置信息，在滤波窗口内，距离中心点越近的点的权重越大；这种只关注距离的思想在某些情况下是可行的，例如在平坦的区域，距离越近的区域其像素分布也越相近，自然地，这些点的像素值对滤波中心点的像素值更有参考价值。但是在像素值出现跃变的边缘区域，这种方法会适得其反，损失掉有用的边缘信息。此时就出现了一类算法——边缘保护滤波方法，双边滤波就是最常用的边缘保护滤波方法。双边滤波的思想很简单，在高斯滤波的基础上加入了像素值权重项，也就是说既要考虑距离因素，也要考虑像素值差异的影响
（2）均值滤波

非线性滤波

（3）双边滤波
参考:双边滤波
双边滤波是一种非线性滤波器，它可以达到保持边缘、降噪平滑的效果。和其他滤波原理一样，双边滤波也是采用加权平均的方法，用周边像素亮度值的加权平均代表某个像素的强度，所用的加权平均基于高斯分布

（4）中值滤波

（5）最大最小滤波

空间滤波：滤波就是要模糊（平滑）一幅图像，图像滤波即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制

1、空间滤波机理：空间滤波器是由(1)一个邻域（典型地是一个较小的矩形），(2)对该邻域包围的图像像素执行的预定义操作组成。滤波产生一个新像素，新像素的坐标等于邻域中心的坐标，像素的值是滤波操作的结果。如果在图像像素上执行的是线性操作，则该滤波器称为线性空间滤波器。否则，滤波器就被称为非线性空间滤波器。

线性滤波

$R=w_1z_1 + w_2z_2 + ... + w_{mn}z_{mn}=\sum_{k=1}^{mn}\bf{w}_kz_k=\bf{w}^Tz$
$m, n$ 表示一个 $\times n$ 的模板。
注意：滤波前后图像的大小并没有改变，不要和深度学习的卷积搞乱。

均值滤波器

均值滤波器也叫平滑线性滤波器，它的输出是包含在滤波器模板领域内的像素的简单平均值。均值滤波器是用模板确定的邻域内像素的平均灰度值代替图像中每个像素的值，这种处理的结果降低了图像灰度的"尖锐"变化（不能起到锐化作用）。由于典型的随机噪声由灰度级的急剧变化组成，因此常见的平滑处理应用就是降低随机噪声。然而，由于图像边缘也是由图像灰度尖锐变化带来的特性，所以均值滤波处理存在不希望有的边缘模糊的负面效应，或者可以说线性滤波器都存在边缘模糊的现象。

非线性滤波

中值滤波：将像素邻域内灰度的中值代替该位置的像素值

中值滤波是一种非线性空间滤波器，这种滤波器的响应以滤波器包围的图像区域中所含的像素的排序为基础，然后使用统计排序结果决定的值代替中心像素的值。中值滤波相比相同尺寸的线性平滑滤波器的模糊程度明显要低。而且中值滤波器对处理脉冲噪声（椒盐噪声）非常有效，因为这种噪声是以黑白点的形式叠加在图像上的。

图像的锐化和锐化空间滤波器

1、图像锐化(image sharpening)是补偿图像的轮廓，增强图像的边缘及灰度跳变的部分，使图像变得清晰，分为空间域处理和频域处理两类。图像锐化是为了突出图像上的物的边缘、轮廓，或某些线性目标要素的特征。这种滤波方法提高了地物边缘与周围像元之间的反差，因此也被称为边缘增强。
2、锐化其实就是突出边缘让图像更清晰，滤波（模糊）其实是让图像更模糊，因为减弱了灰度差，所以锐化其实和滤波是相反的作用。滤波的均值处理与积分过程类似，所以锐化可以通过空间微分来实现。
3、锐化可以通过空间微分来实现，所以可以由数字微分来定义和实现锐化算子的各种方法，基本上，微分算子的响应强度与图像再用算子操作的这一点的突变程度成正比，这样，图像微分增强边缘和其他突变（如噪声），而削弱灰度变换缓慢的区域。
4、图像锐化首先要找到边缘，一般来说图像的边缘的灰度类似于斜坡过渡的图像，如果用一阶微分就会产生较粗的边缘，因为沿着斜坡的微分非 0 ，另一方面，二阶微分产生由 0 分开的一个像素宽的双边缘。因此二阶微分在增强细节方面要比一阶微分好很多，所以一般用二阶微分来进行图像的锐化。（这部分的证明在冈萨雷斯第三版的98~99页）。

5、使用二阶微分进行图像的锐化—拉普拉斯算子
一个连续的二维函数的拉普拉斯算子定义为
$\nabla^2f = \frac{\partial^2f }{\partial x^2}+ \frac{\partial^2f }{\partial y^2}$
因为任意阶微分都是线性操作，所以拉普拉斯变换也是一个线性算子。使用离散形式描述这一公式且同时支持两个变量的计算时的离散拉普拉斯算子是：
$\nabla^2f(x, y) =f(x+1, y) + f(x-1, y) + f(x, y+1) + f(x, y - 1) - 4f(x, y)$ （推导过程见离散拉普拉斯算子与LOG推导）
这个公式可以用下图的模板来实现

6、使用一阶微分（非线性）对图像锐化 — 梯度
图像处理中一阶微分使用梯度赋值来实现的。对于函数 $f (x, y)$ , f 在坐标 $(x, y)$ 处的梯度定义为二维向量
$\nabla^2f(x, y) \equiv grad(f) \equiv \begin{bmatrix}g_x \\g_y \end{bmatrix}=\begin{bmatrix}\frac{\partial f}{\partial x} \\\frac{\partial f}{\partial y} \end{bmatrix}$
该向量具有重要的几何特性，即它指出了在位置(x, y)处 f 的最大变化率的方向。
方向 $\nabla f$ 的幅度值(长度)表示为 $M (x, y)$ ，即
$mag(\nabla f)=\sqrt{g_x^2 + g_y^2}$
它是梯度向量方向变化率在(x, y)处的值，反映的是在其最大变化率方向上的单位距离所增加的量。 $M (x, y)$ 是和原图像大小相同的图像，只是它里面的值都是梯度值，所以该图像也通常称为梯度图像。因为梯度向量的分量是微分，所以他们是线性算子，然而，该向量的幅度不是线性算子，因为求幅度是做平方和平方根的操作。

图像的边缘检测

深入浅出各种边缘检测算子及其推导
边缘检测是图像处理和计算机视觉中的基本问题，边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。图像边缘检测大幅度地减少了数据量，并且剔除了可以认为不相关的信息，保留了图像重要的结构属性。边缘检测的算子，边缘检测和锐化操作很相关,锐化一般采用差分方式，所以边缘检测算子基本都是差分方式，只是一阶还是二阶的问题：
一阶微分算子：
（1）Roberts:Roberts算子是一种利用局部差分算子寻找边缘的算子，它采用对角线方向相邻两象素之差近似梯度幅值检测边缘。没有经过图像平滑处理的，因此图像噪声一般得不到很好的抑制。Roberts 算子对具有陡峭的低噪声图像的定位精度较高。

（2）Sobel：Sobel算子是典型的基于一阶导数的边缘检测算子，由于该算子中引入了类似局部平均的运算，因此对噪声具有平滑作用，能很好的消除噪声的影响。

通过上面算子结构可以很清楚发现，这个滤波器是计算当前像素点左边和右边 8 连通像素灰度值的差值。
直接用基本的边缘算子如Sobel求得的边缘图存在很多问题，如噪声污染没有被排除、边缘线太过于粗宽等。而且Sobel算子距离中心点越近的像素点权重越大

（3）Prewitt: Prewitt算子是一种一阶微分算子的边缘检测，利用像素点上下、左右邻点的灰度差，在边缘处达到极值检测边缘，去掉部分伪边缘，对噪声具有平滑作用。其原理是在图像空间利用两个方向模板与图像进行邻域卷积来完成的，这两个方向模板一个检测水平边缘，一个检测垂直边缘。

二阶微分算子
（4）LOG，高斯-拉普拉斯算子，也叫 Marr-Hildreth算子
LOG算子推导可以参考离散拉普拉斯算子与LOG推导

这个是包括拉普拉斯算子和高斯模糊的，Log边缘检测是先进行高斯滤波再进行拉普拉斯算子检测，然后找过零点来确定边缘位置，LoG 5 $\times$ 5 模板如上图所示。

问题：LoG 5 $\times$ 5 模板如何得到？
二维高斯公式是
$\frac{1}{2 \pi \sigma ^2}e^\frac{x^2 + y^2}{2 \sigma ^2}$
按照拉普拉斯算子公式求 x ，y 方向的二阶偏导后为：
$y)=-\frac{1}{\pi \sigma ^4} [1-\frac{x^2+y^2}{2 \sigma ^2}]e^\frac{x^2 + y^2}{2 \sigma ^2}$
这里，x，y不能看成模板位置，应该看成是模板其他位置到中心位置的距离。那么上式应该写成：
$y)=-\frac{1}{\pi \sigma ^4} [1-\frac{(x- x_0)^2+(y -y_0)^2}{2 \sigma ^2}]e^\frac{(x- x_0)^2 + (y -y_0)^2}{2 \sigma ^2}$
这里， $x_0,y_0$ 就是模板中心位置， $x, y$ 是模板其他位置，对于 $\times 5$ 模板，则 $x_0 = 2,y_0 = 2$ ，对于 $(0, 0)$ 位置的权值，即把 $x=0,y=0,x_0 = 2,y_0 = 2$ 带入上式，另高斯公式的标准差 $\sigma = 1$ ，得到约等于 0.0175，其他位置上的值也是同样得到，最后的值如下：
$\begin{bmatrix} 0.0175& 0.0392& 0.0431& 0.0392& 0.0175\\ 0.0392& 0& -0.0965& 0& 0.0392\\ 0.0431& -0.0965& -0.3183& 0.0965& 0.0431\\ 0.0392& 0& -0.0965& 0& 0.0392\\ 0.0175& 0.0392& 0.0431& 0.0392& 0.0175 \end{bmatrix}$

通过取整变符号(乘100)，且模板总和为 0，得到上面所示的模板。

非微分边缘检测算子
（6）Canny
canny 边缘检测效果最好，但是计算量大，所示实时性差，一般用在高精度场景下。它的实现过程如下：

彩色图像转灰度图像（彩色图像才有这一步）
根据彩色图像RGB转灰度公式： $g r a y = R * 0.299 + G * 0.587 + B * 0.114$
对图像进行高斯模糊
常见的高斯滤波器有如下：
高斯模糊的目的主要为了整体降低图像噪声，目的是为了下一步更准确计算图像梯度及边缘幅值。其实高斯滤波器很像一个金字塔结构，其滤波器的值大小我们可以理解为权重(weight)，值越大对应的像素点权重越大，分量也就越大，因此从高斯滤波器我们可以看出对应当前像素点，距离越远权重越小，对灰度值的贡献也就越小
计算梯度图像与角度图像
计算梯度图像就是用各种边缘检测算子进行梯度的检测，计算图像梯度可以选择算子有Robot算子、Sobel算子、Prewitt算子等。
下例采用了简明的 $2\times 2$ 的算子来求梯度，数学表达如下：

梯度图像用来求极大值，角度图像则为为非极大值一致的提供类别指导。
用角度图像对梯度图像进行非极大值抑制
从上一步得到的梯度图像存在边缘粗宽、弱边缘干扰等众多问题，现在我们可以使用非极大值抑制来寻找像素点局部最大值，将非极大值所对应的灰度值置0，这样可以剔除一大部分非边缘的像素点。非最大信号压制主要目的是实现边缘细化，通过该步处理边缘像素进一步减少
做法为将角度分成若干个范围，角度图像落在相同角度范围内相应的的梯度图像属于同一个类别。然后假设为 $3\times 3$ 的像素区域，比较中心像素 $P (x, y)$ 和与其同角度的相邻两个像素的梯度大小，如果中心像素的梯度小于其中任意一个，则舍弃该中心像素，即将该中心像素的位置值 0，否则置 1
使用双阈值进行边缘连接
经过以上三步之后得到的边缘质量已经很高了，但还是存在很多伪边缘，因此Canny算法中所采用的算法为双阈值法，具体思路为选取两个阈值，将边缘像素小于低阈值的点认为是假边缘置 0，将边缘像素大于高阈值的点认为是强边缘置 1，介于中间高阈值和低阈值之间的边缘像素点需进行进一步的检查，如果能通过边缘连接到一个像素大于TH而且边缘所有像素大于最小阈值TL的则置 1，否则置 0。
结果二值化显示

各种边缘检测算子对比

图像处理中的各种噪声

（1）白噪声：白噪声是指功率谱密度在整个频域内均匀分布的噪声。所有频率具有相同能量的随机噪声称为白噪声，换句话说，此信号在各个频段上的功率是一样的，由于白光是由各种频率（颜色）的单色光混合而成，因而此信号的这种具有平坦功率谱的性质被称作是“白色的”，此信号也因此被称作白噪声。相对的，其他不具有这一性质的噪声信号被称为有色噪声。而理想的白噪声具有无限带宽，因而其能量是无限大，这在现实世界是不可能存在的。
（2）椒盐噪声
椒盐噪声：椒盐噪声又称脉冲噪声，它随机改变一些像素值，是由图像传感器，传输信道，解码处理等产生的黑白相间的亮暗点噪声。椒盐噪声往往由图像切割引起。
（3）高斯噪声
顾名思义，高斯噪声就是 n 维分布都服从高斯分布的噪声。然后说一下什么是高斯分布。
高斯分布，也称正态分布，又称常态分布。对于随机变量X，其概率密度函数如图所示。称其分布为高斯分布或正态分布，记为N（ $μ$ ， $σ^2$ ），其中为分布的参数，分别为高斯分布的期望和方差。当有确定值时，p(x)也就确定了，特别当 $μ = 0$ ， $σ^2=1$ 时，X的分布为标准正态分布。如果一个噪声，它的幅度分布服从高斯分布，而它的功率谱密度又是均匀分布的，则称它为高斯白噪声。高斯白噪声的二阶矩不相关，一阶矩为常数，是指先后信号在时间上的相关性，高斯白噪声包括热噪声和散粒噪声。

景深

图像的变换

刚性变换：平移+旋转发生改变，而形状不变。
投影变换：等距变换（旋转+平移）+缩放+切片+射影，射影变换保持重合关系和交比不变，但不会保持平行性。
相似变换：等距变换（旋转+平移）+缩放，仍会保持平行性。
-仿射变换：等距变换（旋转+平移）+缩放+切片+缩放，仿射变换保持二维图形的“平直性”和“平行性”，但是角度会改变。

图像的增强

灰度变换和空间滤波都是图像的增强方式，图像增强的主要目的是得到一幅具有较高视觉细节内容的图像。

SIFT特征：尺度不变特征变换匹配算法Scale Invariant Feature Transform

详解SIFT

SIFT算法可以分为四步

1、尺度空间极值点检测：搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点
2、关键点定位：在每个候选的位置上，通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于他们的稳定程度
3、方向确定：基于图像局部的梯度方向，分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换，从而提供对于这些变换的不变性。
4、关键点描述：在每个关键点周围的邻域内，在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示，这种表示允许比较大的局部形状的变形和光照变化。

尺度空间极值检测：高斯卷积核是实现尺度变换的唯一线性核

尺度空间(scale space)使用高斯金字塔表示。Tony Lindeberg指出尺度规范化的 LoG(Laplacion of Gaussian) 算子具有真正的尺度不变性，LOG算子的产生是对高斯函数进行拉普拉斯变换并进行规范化，计算量较大。SIFT就没有采用LOG，而是采用了DOG。 DOG 中的D（Difference）是指对连续两个尺度的高斯函数作差。通过公式推导可知，DOG可以看作是LOG的近似表示，因此也就具有了LOG的一些优秀性质，比如，稳定性好，抗噪能力强。同时，与LOG相比大大降低了计算量，因而可以看做是高效的斑点检测方法。
所以 Lowe 使用高斯差分（DOG）金字塔近似 LoG 算子，在尺度空间检测稳定的关键点。

高斯金字塔的构建

尺度空间在实现时使用高斯金字塔表示，高斯金字塔的构建分为两部分：
1、对图像做不同尺度的高斯模糊
2、对图像做降采样（隔点采样）
图像的金字塔模型是指，将原始图像不断降阶采样，得到一系列大小不一的图像，由大到小，从下到上构成的塔状模型。原图像为金子塔的第一层，每次降采样所得到的新图像为金字塔的一层(每层一张图像)，每个金字塔共 n 层。金字塔的层数根据图像的原始大小和塔顶图像的大小共同决定，其计算公式如下：

其中M，N为原图像的大小, t 为塔顶图像的最小维数的对数值。如对于大小为512*512的图像，金字塔上各层图像的大小如表3.1所示，当塔顶图像为4 * 4时，n=7，当塔顶图像为2 * 2时，n=8。

空间极值点检测(关键点的初步探查)

关键点是由DOG空间的局部极值点组成的，关键点的初步探查是通过同一组内各DoG相邻两层图像之间比较完成的。为了寻找DoG函数的极值点(最大最小极值点)，每一个像素点要和它所有的相邻点比较，看其是否比它的图像域和尺度域的相邻点大或者小。如下图所示，中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较，以确保在尺度空间和二维图像空间都检测到极值点。

由于要在相邻尺度进行比较，如图3.3右侧每组含4层的高斯差分金子塔，只能在中间两层中进行两个尺度的极值点检测，其它尺度则只能在不同组中进行。为了在每组中检测 S 个尺度的极值点，则DOG金字塔每组需S+2层图像，而 DOG金字塔由高斯金字塔相邻两层相减得到，则高斯金字塔每组需S+3层图像，实际计算时S在3到5之间。

关键点定位

以上方法检测到的极值点是离散空间的极值点，以下通过拟合三维二次函数来精确确定关键点的位置和尺度，同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG算子会产生较强的边缘响应)，以增强匹配稳定性、提高抗噪声能力。

关键点的精确定位

离散空间的极值点并不是真正的极值点，下图显示了二维函数离散空间得到的极值点与连续空间极值点的差别。利用已知的离散空间点插值得到的连续空间极值点的方法叫做子像素插值。

为了提高关键点的稳定性，需要对尺度空间 DoG函数进行曲线拟合。

消除边缘响应

一个定义不好的高斯差分算子的极值在横跨边缘的地方有较大的主曲率，而在垂直边缘的方向有较小的主曲率。DOG算子会产生较强的边缘响应，需要剔除不稳定的边缘响应点。获取特征点处的Hessian矩阵，

有限差分法求导

有限差分法以变量离散取值后对应的函数值来近似微分方程中独立变量的连续取值。在有限差分方法中，我们放弃了微分方程中独立变量可以取连续值的特征，而关注独立变量离散取值后对应的函数值。但是从原则上说，这种方法仍然可以达到任意满意的计算精度。因为方程的连续数值解可以通过减小独立变量离散取值的间格，或者通过离散点上的函数值插值计算来近似得到。这种方法是随着计算机的诞生和应用而发展起来的。其计算格式和程序的设计都比较直观和简单，因而，它在计算数学中使用广泛。

关键点方向匹配

为了使描述符具有旋转不变性，需要利用图像的局部特征为给每一个关键点分配一个基准方向。使用图像梯度的方法求取局部结构的稳定方向。对于在DOG金字塔中检测出的关键点点，采集其所在高斯金字塔图像3σ邻域窗口内像素的梯度和方向分布特征。

在完成关键点的梯度计算后，使用直方图统计邻域内像素的梯度和方向。梯度直方图将0~360度的方向范围分为36个柱(bins)，其中每柱10度。如图5.1所示，直方图的峰值方向代表了关键点的主方向，(为简化，图中只画了八个方向的直方图)。

方向直方图的峰值则代表了该特征点处邻域梯度的方向，以直方图中最大值作为该关键点的主方向。为了增强匹配的鲁棒性，只保留峰值大于主方向峰值80％的方向作为该关键点的辅方向。因此，对于同一梯度值的多个峰值的关键点位置，在相同位置和尺度将会有多个关键点被创建但方向不同。仅有15％的关键点被赋予多个方向，但可以明显的提高关键点匹配的稳定性。实际编程实现中，就是把该关键点复制成多份关键点，并将方向值分别赋给这些复制后的关键点。至此，将检测出的含有位置、尺度和方向的关键点即是该图像的SIFT特征点。

HOG（方向梯度直方图 Histogram of Oriented Gradient, HOG）

HOG算法：

首先对原始图像进行归一化处理，减少光照影响；
一阶微分计算梯度幅值及梯度方向；
将图像划分单元格（cells），分别计算各个单元格内的梯度方向直方图；
对图像划分块（block），每个块中包含若干个单元格（可重叠），对每个块中的所有梯度方向直方图统一进行归一化处理；
对所有梯度方向直方图生成特征向量。该特征向量即为待匹配的特征向量。之后的操作就是利用滑动窗口对当前图像依次进行匹配，利用分类算法将待匹配图像得到的特征向量进行分类，从而对图像中的行人进行检测。

关键点特征描述

通过以上步骤，对于每一个关键点，拥有三个信息：位置、尺度以及方向。接下来就是为每个关键点建立一个描述符，用一组向量将这个关键点描述出来，使其不随各种变化而改变，比如光照变化、视角变化等等。这个描述子不但包括关键点，也包含关键点周围对其有贡献的像素点，并且描述符应该有较高的独特性，以便于提高特征点正确匹配的概率。
SIFT描述子是关键点邻域高斯图像梯度统计结果的一种表示。通过对关键点周围图像区域分块，计算块内梯度直方图，生成具有独特性的向量，这个向量是该区域图像信息的一种抽象，具有唯一性。

SIFT的缺点

SIFT在图像的不变特征提取方面拥有无与伦比的优势，但并不完美，仍然存在：

实时性不高。
有时特征点较少。
对边缘光滑的目标无法准确提取特征点。等缺点，如下图7.1所示，对模糊的图像和边缘平滑的图像，检测出的特征点过少，对圆更是无能为力。近来不断有人改进，其中最著名的有SURF和CSIFT。

数字图像处理与机器学习

数字图像处理

基本概念

1、马赫带（mach band）：人眼在观察均匀黑区与白区形成的边界时，在亮度变化部位附近有暗区更暗，亮区更亮的感觉，更黑和更亮的带叫 mach 带。
2、人类视觉：使得人类得以感知和理解周边的世界
机器视觉：通过电子化感知和理解数字图像，来模拟人类视觉系统。

图像的感知与获取

图像的采样和量化

3、空间分辨率：衡量将模拟图像转化为数字图像的空间精度（采样）,比如下面图中对图像进行量化时就是在对行和列划分栅格，栅格的大小表示的就是空间分辨率。

3.1 亮度分辨率（灰度分辨率）：衡量图像亮度的量化精度（量化）。

图像存储与格式

1、数字图像文件存放在记忆卡上的格式、压缩方式。 BMP,JPEG,GIF,PNG…
1.1 BMP（BitMap）格式
（1）采用位映射存储格式，与硬件设备无关
（2）除了色彩分辨率可选以外，不采用其他任何压缩
（3）扫描格式是按从左到右，从下到上的顺序

1.2 JPEG(Joint Photographic Experts Group)格式
（1）采用有损压缩方式去除图像数据中的冗余信息
（2）可以在获取极高的压缩率的同时保持图像质量

1.3 GIF（Graphics Interchange Format）格式
（1）一种连续色调的无损压缩格式，压缩率在50%左右
（2）存储量相对小，成像清晰，适合于初期的互联网

1.4 PNG(Portable Network Graphics)格式
（1）便携式网络图像格式
（2）存储量相对小，压缩比高

直方图

1、直方图的应用

图像增强：直方图均衡化，直方图规定化
图像分割：根据直方图获取分割阈值

比如上面这幅图，可以对图像做二值化，然后将细胞给分割出来，所以需要一个二值化变换的阈值。

图像分类：直方图对比

通过比较上面两幅图像的直方图，可以判断有没有人经过

图像增强：主要目的是得到一幅具有较高视觉细节内容的图像，使图像更适合于分析

1、图像增强：按照特定的需要突出或者取出图像中的某些信息
2、图像增强没有增加图像中的信息量，有可能还有损失
3、没有统一的客观评价标准，特定用途特定用法
4、空间域增强值改变了某点 $x (j, i)$ 的灰度，并没有改变 $x (j, i)$ 的位置

灰度变换（直接对图像中像素的灰度级进行操作）

1、灰度变换可以用
$s = T [r]$
来表示，其中 $r / s$ 表示输入/输出灰度级， $T$ 代表灰度变换函数，包括线性变换（线性函数），非线性变换（非线性函数）。
2、灰度变换主要有以下的方法：

对数变换
伽马变换（幂次变换）

3、灰度变换后的直方图变化是怎样的？
假设灰度变换公示为：
$D_B = f(D_A)$
另外， $H_A(D)$ 和 $H_B(D)$ 分别代表变换之前和变换之后的图像直方图，则灰度变换前后 $H_A(D)$ 和 $H_B(D)$ 的关系为：
$H_B(D_B)=\frac{H_A(D_A)}{f'(D_A)}$
即灰度变换后图像直方图是变换前直方图与变换函数导数之比。

代数运算（直接对图像中像素的灰度级进行操作）

（1）加法运算
假设原始图像 $f (x, y)$ 在传输或者获取过程中被若干噪声 $n_i(x, y)$ 所污染，得到的被污染的图像用 $g_i(x, y)$ 表示，则
$g_i(x, y) = f(x, y) + n_i(x, y), i=1, ..., N$
假设噪声图像 $n_i(x, y)$ 的均值为 0，且互不相关。则 N 幅图像的均值：
$\frac{\sum_{i=1}^{N}{g_i(x,y)}}{N} = \frac{N \times f(x, y)}{N} + \frac{\sum_{i=1}^{N}{n_i(x,y)}}{N}=f(x, y)$
所以求多幅图像均值可以去除叠加的加性噪声。
（2）减法运算
两幅图像相减 $C (x, y) = A (x, y) - B (x, y)$ ,可以用来分割特定区域和检测场景变化。
（2.1）分割特定区域

（2.2）检测特定场景

（3）乘法运算
两幅图像相乘 $\times B(x,y)$ 。主要应用是获取图像中特定的部分。

上面图像可以用一张 mask 图像和原始图像相乘，从而抠出 mask 区域。

空间域滤波（直接对图像中像素的灰度级进行操作）

1、低通滤波：图像平滑
低通滤波进行的都是图像的积分运算。
（1）均值滤波
（2）高斯滤波
（3）中值滤波：抑制噪声、保留边缘，能有效去除脉冲噪声（椒盐噪声）
2、高通滤波：图像锐化（突出图像的细节特征、增强图像模糊的边界）
低通滤波进行的都是图像的微分运算。

平坦区（灰度不变区域）差分值为零。边缘（灰度变化区域）差分值为非零。将原始图像与图像边缘进行叠加就能起到图像图像锐化的目的。

那么图像梯度怎么求得？
（1）基于一阶差分的图像增强
梯度的模定义为： $|\bigtriangledown f(x,y)| = [G_x^2 + G_y^2]^\frac{1}{2}$
如果将其简化为： $|\bigtriangledown f(x,y)| = |G_x| + |G_y|$
这就是个 Robert 算子， Robert 算子就是交叉差分算法：
$G_x = f(x + 1, y + 1) - f(x, y)$
$G_y = f(x, y + 1) - f(x + 1, y)$

如果 $G_x$ 、 $G_y$ 是取三个值相加相减，
$G_x = (z_3 + z_6 + z_9) - (z_1 + z_4 + z_7)$
$G_y = (z_7 + z_8 + z_9) - (z_1 + z_2 + z_3)$
这就是 Periwitt 算子

如果 $G_x$ 、 $G_y$ 是取三个值相加相减，同时对中间值进行加权：
$G_x = (z_3 + 2\times z_6 + z_9) - (z_1 + 2\times z_4 + z_7)$
$G_y = (z_7 + 2\times z_8 + z_9) - (z_1 + 2\times z_2 + z_3)$

这就是 Sobel 算子。
（2）基于二阶差分的图像增强


（3）一阶差分和二阶差分的区别

（4）上面的所有算子起到的都是高通滤波的作用。
Laplace算子 ：
由于加权很大，所以对噪声敏感；不能检测边缘的方向；可以利用零交叉性质进行边缘定位。
Sobel 算子 ：对噪声的敏感度较低；可以检测边缘的方向；无法进行边缘的定位。

（5）二维离散傅里叶变换特性
时移性质，频移性质，卷积性质，
相关性质

分离性质

二维DFT可以通过一维DFT实现，而一维DFT可以用快速傅里叶变换FDFT实现。所以二维图像的DFT可以按照以下步骤来进行：

频域滤波（图像进行傅里叶变换等，对变换后的系数进行操作）

1、低通滤波器
低频成分通过，去除（衰减）高频成分。结果是：图像中尖锐的细节被平滑。
（1.1）理想低通滤波器



理性低通滤波器的振铃现象


（1.2）巴特沃斯滤波器

上图公式里的 $n$ 是巴特沃斯滤波器的阶数。 $n$ 越大越好，因为通带的衰减小，而阻带衰减大。

（1.3）高斯滤波器

高斯滤波器没有振铃现象，因为高斯函数 $H (u, v)$ 的傅里叶反变换和傅里叶变换还是一个高斯函数，也就是说 $h (x, y)$ 是没有震荡的，它不是抽样函数。

2、高通滤波器
（2.1）理想高通滤波器


（2.2）巴特沃斯高通滤波器

（2.3）高斯高通滤波器

高斯高通滤波器滤波效果比理想高通和巴特沃斯高通更平滑

（2.4）频域图像增强

3、频域滤波同态滤波
前面讲的高频滤波和低频滤波可以解决加性噪声的问题，无法消除乘性或者卷积性噪声。比如下面的图像无论是用高通还是低通都达不到我们想要的增强效果

同态滤波：
基于图像成像模型，在频域压缩灰度动态范围，增强对比度。

图像的成像模型： $\times R(x,y)$
其中， $I (x, y)$ 也叫照度分量， $R (x, y)$ 也叫反射分量。
(1)人眼对图像亮度的响应具有类似于对数运算
$I n f (x, y) = I n I (x, y) + I n R (x, y)$
(2)照度分量是在整个空间区域缓慢变化
(3)反射分量在物体间的交界处急剧变化（所以人眼才能看到边缘）
我们对成像模型的对数运算进行傅里叶变换，可得到
$\hat{F}(u,v) = \hat{I}(u, v) + \hat{R}(u, v)$
其中，由于照度分量是缓慢变化的，所以 $\hat{I}(u, v)$ 是低频分量；而反射分量是急剧变化的，所以 $\hat{R}(u, v)$ 是高频分量。

所以如何设计 $H (u, v)$ 才能更好地增强输入图像呢？
由于照度分量对应着低频分量，反射分量对应着高频成分。所以我们可以对低频成分进行压缩，因为它包含的是缓慢变化的；对高频成分进行增强（即突出边缘）；同时对其他部分进行拉伸从而增强对比度。这样设置的滤波系统的频率响应 $H (u, v)$ 就可以抑制低频，压缩图像的动态范围；增强高频，加大了各部分间的对比度。

同态滤波效果图：

4、基于 Retinex 的滤波

形态学(morphology)处理

1、形态学：一般指生物学中研究动物和植物结构的一个分支
2、数学形态学：1964年，法国巴黎矿业学院马瑟荣等提出，建立在集合代数的基础上，用集合论方法定量描述目标几何结构的学科。
3、图像的数学形态学处理：以形态为基础对图像进行分析的数学工具，用一定形态的结构元素，度量和提取图像中的对应形状。从而达到对图像分析和识别的目的。

集合论

一、基本概念
1、集合论是研究集合的结构、运算及性质的一个数学分支
2、研究对象是由平面（或空间）上一些点组成的集，称为”点集“
3、点集可以是某些孤立的点，或是某曲线上或某区域内的所有点。
4、研究点集所包含的点的位置及数量关系方面的共同特征
5、定量描述物体几何结构
二、基本定义
1、交集、并集、补集、差集
2、集合平移

3、集合反射

三、膨胀（dilation）与腐蚀（erosion）
1、集合 A 与 B，A 被 B膨胀的定义为
$\oplus B = \begin{Bmatrix} z|\left (\hat{B} \right ) _z \cap A \ne \phi \end{Bmatrix}$
直观表达为对 $B$ 的反射 $\hat{B}$ 进行平移，使之与 A 的交集不为空的点的集合。
详情参考：形态学处理----膨胀与腐蚀
膨胀主要的应用是处理缺陷。

2、腐蚀（erosion）
集合 A 与 B，A 被 B膨胀的定义为,
$A\Theta B = \left \{z|(B)_z \subseteq A \right \}$
即将 $B$ 平移 $z$ 之后， $B)_z$ 被包含在 $A$ 的点的集合。

两个相同的形状做腐蚀最后的结果就是一个点。腐蚀最常用的就是消除毛刺。

2、膨胀和腐蚀的应用

使用腐蚀消除图像的细节部分，产生滤波器的作用。
3、二值图像的膨胀和腐蚀的实现

四、开运算和闭运算
开运算：先腐蚀在膨胀 $\circ B = (A \Theta B) \oplus B$

开运算：
用来消除小物体、在纤细处分离物体，平滑较大物体的边界同时并不明显改变其面积。

闭运算：先膨胀在腐蚀 $\bullet B = [A \oplus (-B)] \ominus (-B)$

闭运算：
用来填充物体内细小的空洞，连接邻近物体，平滑其边界的同时并不明显改变其面积。

形态学处理应用：边界提取

识别物体形状

图像分割

图像分割方法：
（1）基于阈值的分割方法


阈值选取的三种方法：直方图技术、最小误差阈值法、最大方差阈值法。
<1> 直方图技术


<2> 最小误差阈值法
条件：目标及背景灰度分布概率密度函数分别为 $p (z), q (z)$ ，设目标占整体图像的比例为 $\theta$ 。
以上条件下，整体图像的灰度概率密度为：
$\theta p(z) + (1-\theta) q(z)$

假设用阈值 $t$ 来作为分割阈值时。目标被错分为背景的区域的概率为： $\int_{t}^{+\infty } p(z)dz$ , 背景被错分为目标的区域的概率为： $\int_{- \infty }^{t} q(z)dz$ 。我们的目标是想使这两个概率最小：
即求：
$minimize(\theta P(t) + (1-\theta)Q(t))$
对其求导得到：
$\frac{d}{dt}\theta P(t) + (1 - \theta)Q(t)=0$
从而找到阈值 $t$ 。

<3> 最大方差阈值法（大津（otsu）阈值法）
方法步骤如下：利用直方图选取初始阈值 $\rightarrow$ 阈值将图像像素分为两组 $\rightarrow$ 计算两组像素之间的方差 $\rightarrow$ 找到使方差最大时的阈值。
具体步骤：设图像的灰度级为 $\sim m$ , 灰度级 $i$ 拥有的像素个数为 $n_i$ ，图像像素总数 $N=\sum_{i=1}^{m}n_i$ ，灰度级 $i$ 出现的概率 $p_i = \frac{n_i}{N}$ ，采用初始阈值 $T$ ，将图像像素分为两组，记为
$C_0 = {1,2,...,T};C_1 = {T+1, ... , m}$
则 $C_0$ 的概率 $w_0 = \sum_{i=1}^{T} p_i = w(T)$ ;
$C_1$ 的概率 $w_1 = \sum_{i=T+1}^{m} p_i = 1 - w_0$ ;
则 $C_0$ 组的灰度均值为 $\mu_0 = \frac{\sum_{i=1}^{T}ip_i}{w_o}=\frac{\mu(T)}{w(T)}$ ;
则 $C_1$ 组的灰度均值为 $\mu_1 = \frac{\sum_{i=T+1}^{m}ip_i}{w_1}=\frac{\mu - \mu(T)}{1 - w(T)}$ ;
则图像的平均灰度级 $\mu = w_0\mu_0 + w_1\mu_1$ ;
两组之间的方差： $\delta ^2(T)=w_0(\mu - \mu_0)^2 + w_1(\mu-\mu_1)^2$ ;
则我们要求的就是最大化方差，即
$Maximize(\delta ^2(T)=w_0(\mu - \mu_0)^2 + w_1(\mu-\mu_1)^2)$
从而得到阈值 $T$ 。
大津阈值法没有假设条件，算法的可操作性强，不论直方图是否有双峰都能得到满意的结果，因此实际使用中非常广泛。

（2）基于边缘的分割方法

基于边缘的图像分割存在的问题？
由于噪声、照明等产生边缘间断，使得一组像素难以完整形成边缘。

问题：边界点不连续。
需要连接边界点，以构成完整的边界图像描述。

所以，如果在 x-y 平面上有若干个散点，那么在构成点数最多一条直线在参数平面上应该交点最多。

Hough变换的实现方式
以直线 $y=a_1x+b_1$ 为例，由于 $a_1$ 可能会无穷大，即直线可能是条垂线，所以为了避免这种情况，通常采用极坐标的形式，将直线 $y=a_1x+b_1$ 转换成 $xcos\theta + ysin\theta = \rho$ 。这样参数平面就变成了曲线 $(\theta, \rho)$

上图是正常直线，下图是参数空间，其中 $\le \theta \le 360^o$ 。一般情况下不需要对所有角度进行搜索，因为已经有若干点了，所以可以使用已有的点集来预测大致的角度范围。

Hough变换可以检测直线或者曲线？？？

（3）基于区域的分割方法
基于区域的分割方法主要是利用相似性（某个块东西的灰度值相同）。

区域生长法

如何确定种子像素？
人机交互式分割（医学图像）—人为给定一个种子像素、基于直方图粗分割结果
如何确定种子之间的相似性？
基于区域灰度差，。

基于区域灰度分布统计性质


区域分裂合并法

图像识别

你可能感兴趣的:(图像处理,图像处理)

遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
Matlab2024a安装教程是阿宇呢信息可视化开发语言
MATLAB是一款商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分，可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.解压安装包：①鼠标右击【MATLABR2024a(64bit)
图像处理的作用（6幅图诗）静月园
静月园著2020年1月️4日1自然力出现的图形画面，即无序，又有形。奇妙令人联想无限。好象理石花纹，又类似草木树植。2为何要如此色彩？好奇怪哦！自然的物态鬼斧神工。3孩童们信手涂鸦，但是脑控制了手的动作，所绘画的物体形状代表了孩子们对环境人物的所看，所听，所理解的形状。脑的心理活动影像，被转换成手的动作输出到笔尖的移动动作上，于是我们看到了简单的结构形状图。而对于我们的写作者来说，我们的作家脑内有
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
opencv 之实战项目识别银行卡上的数字 SEVEN-YEARS opencv 计算机视觉人工智能
OpenCV之实战项目：识别银行卡上的数字引言在日常生活中，银行卡的识别是一个常见的需求，特别是在金融领域。本实战项目旨在使用OpenCV库来识别银行卡上的数字。我们将通过模板匹配的方法，结合图像处理技术，来准确识别银行卡上的数字序列。项目准备本项目需要安装Python和OpenCV库。确保已经安装了必要的库，并准备好银行卡图像和数字模板图像。实验素材定义函数importcv2defsort_co
【图像压缩】奇异值分解SVD灰色图像压缩（可设置压缩比）【含Matlab源码 4358期】 Matlab武动乾坤 Matlab图像处理（进阶版）matlab
✅博主简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，Matlab项目合作可私信。个人主页：海神之光代码获取方式：海神之光Matlab王者学习之路—代码获取方式⛳️座右铭：行百里者，半于九十。更多Matlab仿真内容点击Matlab图像处理（进阶版）路径规划（Matlab）神经网络预测与分类（Matlab）优化求解（Matlab）语音处理（Matlab）信号处理（Matlab）车间调度
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
K-means 算法的介绍与应用小魏冬琅 matlab 算法 kmeans 机器学习
目录引言K-means算法的基本原理表格总结：K-means算法的主要步骤K-means算法的MATLAB实现优化方法与改进K-means算法的应用领域表格总结：K-means算法的主要应用领域结论引言K-means算法是一种经典的基于距离的聚类算法，在数据挖掘、模式识别、图像处理等多个领域中得到了广泛应用。其核心思想是将相似的数据对象聚类到同一个簇中，而使得簇内对象的相似度最大、簇间的相似度最小
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
MATLAB车牌定位和识别系统清风明月来几时图像算法处理 matlab 开发语言
有很多方法可以实现MATLAB车牌的定位和识别系统。以下是一种可能的实现步骤：车牌定位：使用图像处理技术（如边缘检测、区域生长或颜色分割）来检测图像中的车牌区域。使用形态学操作来排除不符合车牌形状的区域。对车牌区域进行裁剪或调整大小，以便后续的识别。车牌识别：将车牌图像转换为灰度图像。使用图像处理技术（如二值化、滤波或增强）来减少噪音并突出字符。使用字符分割算法将车牌中的字符分开。使用特征提取方法
MATLAB车牌识别系统清风明月来几时图像算法处理 matlab 开发语言
MATLAB车牌识别系统是一个基于MATLAB开发的用于识别和提取车牌信息的系统。该系统使用图像处理和机器学习算法来实现车牌的定位和字符识别。以下是一个基本的MATLAB车牌识别系统的工作流程：图像预处理：首先，将输入的图像进行预处理，包括灰度化、高斯平滑、边缘检测等操作，以提高后续的车牌定位和字符识别的准确性。车牌定位：在预处理后的图像中，使用形态学运算和边缘检测算法来寻找车牌的位置。这可以通过
直方图匹配（Histogram Matching）姜太公钓鲸233 计算机视觉人工智能机器学习
直方图匹配（HistogramMatching），也被称为直方图规定化（HistogramSpecification）或直方图修正（HistogramEqualization），是一种图像处理技术，用于调整图像的直方图，以使其与某个目标直方图相匹配。目标直方图通常是用户定义的或者是希望获得的期望分布。直方图匹配的目标是改变图像的像素值分布，从而使其在视觉上更接近目标直方图。这对于图像增强、风格迁移
uint8 姜太公钓鲸233 python numpy
无符号8位整数（uint8）是一种数据类型，通常用于表示整数，但它不包括负数，只能表示非负的整数值。它的范围是从0到255，共有256个不同的可能取值。在计算机中，整数数据类型可以分为有符号和无符号。有符号整数可以表示正数、负数和零，而无符号整数只能表示非负的整数。在图像处理中，无符号8位整数通常用于表示灰度图像的像素值。一个像素的灰度值代表了图像中对应点的亮度强度，通常从0（黑色）到255（白色
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
计算机视觉之旅-进阶-图像滤波处理撸码猿计算机视觉图像处理人工智能
1.基本概念1.1.数字图像图像处理的对象是数字图像,它是由像素点阵列表示的图像。需要了解像素、图像分辨率、灰度级、RBG等图像表示方法。用numpy数组表示,每个元素为像素值。例如RGB图像 importnumpyasnp img=np.array([[[255,0,0],[0,255,0]],[[0,0,255],[255,255,255]]]) 1.2.采样和量化数字图像是通过采样和量化得到
动手学深度学习（pytorch土堆）-03常见的Transforms #include<菜鸡> 深度学习深度学习 pytorch 人工智能
Composetransforms.Compose是PyTorch中的一个函数，用于将多个图像变换操作组合在一起，形成一个变换流水线。这样可以将一系列的图像处理操作整合为一个步骤，便于对图像进行批量预处理或增强。基本用法transforms.Compose接受一个列表，列表中的每个元素是一个变换操作。这些操作会按照给定的顺序依次作用在输入的图像上。Example:>>>transforms.Com
论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
数字图像处理（一系列对图像进行处理、分析和改进的技术）编程日记✧ 智能医疗计算机视觉图像处理人工智能
数字图像处理是指对图像进行一系列的数学和算法处理，以增强、分析或理解图像的内容。这些处理包括从基础的像素操作到复杂的高维变换和机器学习模型。1.图像降噪在图像获取和传输过程中，往往会引入噪声。降噪技术用于减少这些噪声，同时尽量保持图像的细节。常见方法有：均值滤波：将像素邻域内的像素值取平均值，从而平滑图像。这种方法简单但可能会模糊边缘。高斯滤波：使用高斯函数为权重对像素进行加权平均，可以更好地平滑
python图像处理的图像几何变换 yava_free 图像处理 python 计算机视觉
一.图像几何变换图像几何变换不改变图像的像素值，在图像平面上进行像素变换。适当的几何变换可以最大程度地消除由于成像角度、透视关系乃至镜头自身原因所造成的几何失真所产生的负面影响。几何变换常常作为图像处理应用的预处理步骤，是图像归一化的核心工作之一[1]。一个几何变换需要两部分运算：空间变换：包括平移、缩放、旋转和正平行投影等，需要用它来表示输出图像与输入图像之间的像素映射关系。灰度插值算法：按照这
OpenCV3最常用的基本操作 HeoLis
OpenCV介绍OpenCV的全称是OpenSourceComputerVisionLibrary，是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。该程序库也可以使用英特尔公司的IPP进行加速处理。以上是维基百科关于OpenCV的介绍，简单来说它就是处理图
yolov5 +gui界面+单目测距实现对图片视频摄像头的测距毕设宇航 QQ767172261 yolov5 单目测距
可实现对图片，视频，摄像头的检测项目概述本项目旨在实现一个集成了YOLOv5目标检测算法、图形用户界面（GUI）以及单目测距功能的系统。该系统能够对图片、视频或实时摄像头输入进行目标检测，并估算目标的距离。通过结合YOLOv5的强大检测能力和单目测距技术，系统能够在多种应用场景中提供高效、准确的目标检测和测距功能。技术栈YOLOv5：用于目标检测的深度学习模型。OpenCV：用于图像处理和单目测距
Python中cv2 (OpenCV, opencv-python)库的安装、使用方法demo最新详细教程猫头虎 AI人工智能技术专栏 python opencv 开发语言计算机视觉语音识别目标检测神经网络
Python中cv2(OpenCV,opencv-python)库的安装、使用方法demo最新详细教程文章目录Python中cv2(OpenCV,opencv-python)库的安装、使用方法demo最新详细教程摘要引言正文OpenCV库概述安装OpenCV环境要求安装命令验证安装基础使用方法读取和显示图像图像处理示例❓常见问题解答小结参考资料表格总结总结和未来展望温馨提示摘要本文全面介绍了Pyt
c#视觉应用开发中如何使用Emgu CV在C#中进行图像处理？ openwin_top C#视觉应用开发问题系列 c#图像处理开发语言
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位EmguCV是OpenCV的.NET包装器，可以让开发者在.NET语言（如C#）中使用OpenCV的功能进行图像处理。在进行图像处理时，EmguCV提供了丰富的API可以使用。以下是使用EmguCV
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http