oges

西电计科大数据计算机视觉作业一sobel算子和canny算子

基于python对Sobel和Canny算子的复现

Sobel算子部分

X方向梯度

   **图1.1Sobel x方向卷积核**

通过Sobel的x方向卷积核（如图1.1）与通过opencv读取到的灰度值图像矩阵进行乘法运算卷积运算得到新的图像。

通过循环实现卷积核与该图像的所有像素点都经过计算。

最后过滤掉一些像素值较小的噪音点，达到最终图像，代码如下所示：

kernel\_x = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])  

# sobel x方向卷积核

# x轴方向
def sobel\_x(img, threshold):
      W = np.size(img, 0)
      H = np.size(img, 1)  # 计算图片的长度和宽度
      mag = np.zeros(img.shape)  # 创建一个图片形状的空矩阵
      for i in range(0, W - 2):
          for j in range(0, H - 2):
              v = sum(sum(kernel\_x \* img[i:i + 3, j:j + 3]))  # 进行矩阵卷积运算
              mag[i + 1, j + 1] = v

      for p in range(0, W):  # 过滤掉一些噪音点，让主体突出
          for q in range(0, H):
              if mag[p, q] < threshold:
                  mag[p, q] = 0
      return mag

Y方向梯度

Y方向梯度算法与x方向相似，只需将x方向梯度中的x卷积核替换成y方向的卷积核(如图2.1)再进行卷积运算即可。

 **图2.1Sobel y方向卷积核**

其代码如下：

kernel\_y = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])  # sobel y方向卷积核

# y轴方向
def sobel\_y(img, threshold):
      W = np.size(img, 0)
      H = np.size(img, 1)
      mag = np.zeros(img.shape)
      for i in range(0, W - 2):
          for j in range(0, H - 2):
              h = sum(sum(kernel\_y \* img[i:i + 3, j:j + 3]))
              mag[i + 1, j + 1] = h

      for p in range(0, W):
          for q in range(0, H):
              if mag[p, q] < threshold:
                  mag[p, q] = 0
      return mag

滤波结果

综合前两部的x方向梯度与y方向梯度，我们在算出一个像素点的x方向梯度与y方向梯度之后，通过平方和后取根号的形式，来获得该点的像素值。

kernel\_x = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])  # sobel x方向卷积核
kernel\_y = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])  # sobel y方向卷积核
def sobel1(img, threshold):
      W = np.size(img, 0)
      H = np.size(img, 1)
      mag = np.zeros(img.shape)
      for i in range(0, W - 2):
          for j in range(0, H - 2):
              v = sum(sum(kernel\_x \* img[i:i + 3, j:j + 3]))  # x轴方向
              h = sum(sum(kernel\_y \* img[i:i + 3, j:j + 3]))  # y轴方向
              z = np.sqrt((v \*\* 2) + (h \*\* 2))  
              if z < threshold:  # 如果小于阈值 则为0
                  mag[i + 1, j + 1] = 0
              else:
                  mag[i + 1, j + 1] = z
      return mag

梯度幅值

		 **图4.1计算幅值时Sobel x方向与y方向卷积核**

计算真实的幅值时我们需要用到计算幅值的卷积核（如图4.1）这与Sobel算子的标准定义不同。其计算方式与上一节提到的计算方式相似。

其代码如下：

kernel\_x = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])  # sobel x方向卷积核
kernel\_y = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])  # sobel y方向卷积核

a = 1 / 8 \* kernel\_x  # 算幅值时的卷积核
b = 1 / 8 \* kernel\_y

def sobel\_amplitude(img, threshold):
      W = np.size(img, 0)
      H = np.size(img, 1)
      mag = np.zeros(img.shape)
      for i in range(0, W - 2):
          for j in range(0, H - 2):
              v = sum(sum(a \* img[i:i + 3, j:j + 3]))  # x轴方向
              h = sum(sum(b \* img[i:i + 3, j:j + 3]))  # y轴方向
              z = np.sqrt((v \*\* 2) + (h \*\* 2))  # 计算幅值
              if z < threshold:  # 如果幅值小于阈值 则为0
                  mag[i + 1, j + 1] = 0
              else:
                  mag[i + 1, j + 1] = z
      return mag

计算梯度角度

在我们分别计算出gy与gx后，通过求取他们的arctan值来计算出梯度角度。

Python math库中的atan2函数已经考虑到gx等于0的情况所以我们进行分类讨论。

atan2函数的返回值为（-Π，Π），我们通过映射和计算将他转化为（0，360）。

再将这些不同数值的像素通过色彩来进行区分，这里调用了matplotlib的cmap函数，中的rainbow色块如下图所示

							  ** 图5.1rainbow色块展示 **

因cmap rainbow色块支持256个可选值所以我们再将（0，360）的角度映射到

（0，256）上。如此角度越小的点颜色越偏蓝色，角度越大的点颜色偏红色

其代码如下：

def sobel\_amplitude(img, threshold):
    W = np.size(img, 0)
    H = np.size(img, 1)
    mag = np.zeros(img.shape)
    for i in range(0, W - 2):
        for j in range(0, H - 2):
            v = sum(sum(a \* img[i:i + 3, j:j + 3]))  # x轴方向
            h = sum(sum(b \* img[i:i + 3, j:j + 3]))  # y轴方向
            z = np.sqrt((v \*\* 2) + (h \*\* 2))  # 计算幅值
            if z < threshold:  # 如果幅值小于阈值 则为0
                mag[i + 1, j + 1] = 0
            else:
                # 如果赋值大于阈值 则计算他的角度
                #  这里用了math库的artan2的函数其返回值为（-Π，Π） 通过算数运算将其转化为（0，360）
                #  因matplotlib的cmap库色彩可选值为256个 再经过运算转化为（0，256）
                mag[i + 1, j + 1] = z
    return mag

    plt.imshow(mag\_angle, plt.get\_cmap('rainbow'))

Sobel结果展示

6.1Sobel算子各图结果展示

绘图代码如下：

def sobel(image):
    # image = cv2.imread('2.jpg', 0)  # read an image
    mag\_y = sobel\_y(image, 5)
    mag\_x = sobel\_x(image, 5)
    mag\_amplitude = sobel\_amplitude(image, 5)
    mag\_angle = sobel\_angle(image, 50)
    mag\_sobel = sobel1(image, 5)
    plt.figure("Sobel", frameon=False)  # 图像窗口名称
    plt.subplot(2, 3, 5)
    plt.imshow(mag\_x, cmap='gray')
    plt.title("x方向图", fontsize=8)
    plt.xticks([])
    plt.yticks([])
    plt.subplot(2, 3, 6)
    plt.imshow(mag\_y, cmap='gray')
    plt.title("y方向", fontsize=8)
    plt.xticks([])
    plt.yticks([])
    plt.subplot(2, 3, 3)
    #plt.imshow(mag\_angle)
    plt.imshow(mag\_angle, plt.get\_cmap('rainbow'))
    plt.title("角度图", fontsize=8)
    plt.xticks([])
    plt.yticks([])
    plt.subplot(2, 3, 4)
    plt.imshow(mag\_amplitude, cmap='gray')
    plt.title("幅值图", fontsize=8)
    plt.xticks([])
    plt.yticks([])
    plt.subplot(2, 3, 2)
    plt.imshow(mag\_sobel, cmap='gray')
    plt.title("结果图", fontsize=8)
    plt.xticks([])
    plt.yticks([])
    plt.subplot(2, 3, 1)
    plt.imshow(image, cmap='gray')
    plt.title("原图", fontsize=8)
    plt.xticks([])
    plt.yticks([])

Sobel算子结果分析

7.1. x方向梯度与y方向梯度对比发现x方向梯度图片在竖直方向和水平方向分别有所空缺

7.2 结果图与幅值图对比

虽然两张图片宏观上看十分相似没有什么区别，我一开始也以为自己是否做错。

但是当我放大两张图片时，发现在微观上，如果卷积核乘1/8后，其边缘将会相比于结果图更加清晰。我们将图片局部放大并将亮度调高后会很明显的看出，在乘1/8后图片跟接近于真实的幅值。

Canny算子部分

高斯滤波

高斯滤波器（kernel）是将高斯函数离散化，将滤波器中对应的横纵坐标索引代入高斯函数，即可得到对应的值。

(2k+1)x(2k+1) 滤波器的计算公式如右：

常见的高斯滤波器为size=5，其近似值为：

我们依旧用矩阵运算将待测图片进行高斯模糊。

其代码如下：

def smooth(img, sigma=1.4, length=5):
      # 生成高斯核
      k = length // 2
      gaussian = np.zeros([length, length])
      for i in range(length):
          for j in range(length):
              gaussian[i, j] = np.exp(-((i - k) \*\* 2 + (j - k) \*\* 2) / (2 \* sigma \*\* 2))
      gaussian /= 2 \* np.pi \* sigma \*\* 2
      gaussian = gaussian / np.sum(gaussian)

      # 用高斯核进行滤波
      W = np.size(img, 0)
      H = np.size(img, 1)
      new\_image = np.pad(img, ((1, 1), (1, 1)), constant\_values=0)

      for i in range(W - 2 \* k):
          for j in range(H - 2 \* k):
              new\_image[i, j] = np.sum(img[i:i + 5, j:j + 5] \* gaussian)

      return new\_image

计算图片的幅值与角度

其计算步骤与Sobel计算方式相同，此处不再赘述。

其代码如下：

def getGradAngle(image):  # 用sobel核计算图片的幅值和梯度角度
      *""" 
           -1 0 1        -1 -2 -1
      Gx = -2 0 2   Gy =  0  0  0
           -1 0 1         1  2  1
      """*
      Gx = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])
      Gy = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])

      W = np.size(image, 0)
      H = np.size(image, 1)
      amplitude = np.zeros([W - 2, H - 2])  # 幅值数组
      angle = np.zeros([W - 2, H - 2])  # 角度数组

      for i in range(W - 2):
          for j in range(H - 2):
              dx = np.sum(image[i:i + 3, j:j + 3] \* Gx)
              dy = np.sum(image[i:i + 3, j:j + 3] \* Gy)
              amplitude[i, j] = np.sqrt(dx \*\* 2 + dy \*\* 2)
              angle[i, j] = math.atan2(dy, dx)

      return amplitude, angle

非最大值抑制（NMS）

当我们计算一点C时我们会找到他梯度方向的相邻点dTmp1与dTmp2。如果C点不是这三个点中的最大值时，我们则将C点的像素值置0。

计算dTmp1时我们可能会遇到这两个点并不能直接被获取，这时我们用类似线性插值的方式，用它临近点g1与g2共同来描述该点的像素值。具体的权重通过theta角度算tan值来描述。这里涉及一些数学中角度换算的过程，详细信息如代码所示：

def NMS(amplitude, angle):
      *""" Non-maxima suppression
          非最大值抑制
          遍历梯度方向两个其他节点
          如果有值比本身大，则将本身置为0
      """*
      W = np.size(amplitude, 0)
      H = np.size(angle, 1)
      nms = amplitude.copy()
      # 当梯度不为45的整数倍时 通过同行相邻节点加权算出该点的值
      # 通过角度来计算权重
      for i in range(1, W - 1):
          for j in range(1, H - 1):
              theta = angle[i, j]
              weight = np.tan(theta)
              # 不同角度的权重不同
              if theta > np.pi / 4:
                  d1 = [0, 1]
                  d2 = [1, 1]
                  weight = 1 / weight
              elif theta >= 0:
                  d1 = [1, 0]
                  d2 = [1, 1]
              elif theta >= - np.pi / 4:
                  d1 = [1, 0]
                  d2 = [1, -1]
                  weight \*= -1
              else:
                  d1 = [0, -1]
                  d2 = [1, -1]
                  weight = -1 / weight

              g1 = amplitude[i + d1[0], j + d1[1]]
              g2 = amplitude[i + d2[0], j + d2[1]]
              g3 = amplitude[i - d1[0], j - d1[1]]
              g4 = amplitude[i - d2[0], j - d2[1]]

              grade\_count1 = g1 \* weight + g2 \* (1 - weight)
              grade\_count2 = g3 \* weight + g4 \* (1 - weight)

              if grade\_count1 > amplitude[i, j] or grade\_count2 > amplitude[i, j]:
                  nms[i, j] = 0

      return nms

双阈值抑制

设有阈值T1

这里通过dfs算法扫描所有的大于T2的点，并扫描这些点的边缘中是否有大于T1的点。将所有小于T1的点删除，将大于T2的点和大于T1且与大于T2的点相连的点保留。

注：图片中一个像素点的斜上、下方都是该点的相邻点，所以遍历它相邻点时，方向数组应该有八个值。

 其代码如下：

def double\_threshold(nms, threshold1, threshold2):
      *""" Double Threshold
      通过dfs找出所有强像素点的所有联通点
      """*
      visited = np.zeros\_like(nms)
      output\_image = nms.copy()
      W, H = output\_image.shape

      def dfs(i, j):
          *"""
          当像素值超过第二阈值时直接保留
          像素值小于第一阈值时直接删除
          与第二阈值相连的且大于第一阈值的像素保留
          通过dfs来查询这些与第二阈值相连的大于第一阈值的点
          """*
          #方向数组
          dx = [-1, -1, -1, 0, 0, 1, 1, 1]
          dy = [-1, 0, 1, -1, 1, -1, 0, 1]
          if i >= W or i < 0 or j >= H or j < 0 or visited[i, j] == 1:
              return
          visited[i, j] = 1
          if output\_image[i, j] > threshold1:
              output\_image[i, j] = 255
              for p in range(0, 8):
                  dfs(i + dx[p], j + dy[p])
          else:
              output\_image[i, j] = 0

      for w in range(W):
          for h in range(H):
              if visited[w, h] == 1:
                  continue
              if output\_image[w, h] >= threshold2:
                  dfs(w, h)
              elif output\_image[w, h] <= threshold1:
                  output\_image[w, h] = 0
                  visited[w, h] = 1
      # 将剩余其他不连通的点置为0
      for w in range(W):
          for h in range(H):
              if visited[w, h] == 0:
                  output\_image[w, h] = 0

      return output\_image

Canny结果展示

以下三张图片分别为原图、模糊图、与结果图

展示代码如下所示：

def canny(image):
      smoothed\_image = smooth(image)
      amplitude, angle = getGradAngle(smoothed\_image)
      nms = NMS(amplitude, angle)
      output\_image = double\_threshold(nms, 10, 60)
      plt.figure("Canny", frameon=False)
      plt.subplot(1, 3, 1)
      plt.imshow(image)
      plt.title("原图", fontsize=8)
      plt.xticks([])
      plt.yticks([])
      plt.subplot(1, 3, 2)
      plt.imshow(smoothed\_image)
      plt.title("高斯模糊图", fontsize=8)
      plt.xticks([])
      plt.yticks([])
      plt.subplot(1, 3, 3)
      plt.imshow(output\_image)
      plt.title("滤波图", fontsize=8)
      plt.xticks([])
      plt.yticks([])
      # plt.show()

6．Canny结果分析

Canny算子的双阈值抑制算法与最终结果的数值息息相关，要想得到一个非常好的边缘检测结果，那这两个值可能需要精心选择。其结果较为精准，能将轮廓与背景很好的区分。

Sobel与Canny算子对比

相比来说sobel算子处理图片速度更快，但Canny算子更经典，精准度更高，能更好的去除噪音并保留更清晰的线条。Canny边缘检测之所以优秀是因为它在一阶微分算子的基础上，增加了非最大值抑制和双阈值两项改进。利用非极大值抑制不仅可以有效地抑制多响应边缘，而且还可以提高边缘的定位精度；利用双阈值可以有效减少边缘的漏检率。但Canny算子设计更多参数，需要更准确地设置参数，更繁杂一些。

代码地址:

https://gitee.com/orangeinus/xd_-cs_computer_vison_1.git

你可能感兴趣的:(计算机视觉)

OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
计算机视觉产品推荐,个性化推荐:人工智能中的计算机视觉、NLP自然语言处理和个性化推荐系统哪个前景更好一些？...
这个问题直接回答的话可能还是有着很强的个人观点，所以不如先向你介绍一些这几个领域目前的研究现状和应用情况(不再具体介绍其中原理)你自己可以斟酌一下哪方面更适合自己个性化推荐。一．所谓计算机视觉，是指使用计算机及相关设备对生物视觉的一种模拟个性化推荐。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样[1]。现在人工智能的计算机视觉主要研究
基于深度学习的目标检测：从基础到实践 Blossom.118 机器学习与人工智能深度学习目标检测人工智能音视频语音识别计算机视觉机器学习
前言目标检测（ObjectDetection）是计算机视觉领域中的一个核心任务，其目标是在图像中定位和识别多个对象的类别和位置。近年来，深度学习技术，尤其是卷积神经网络（CNN），在目标检测任务中取得了显著进展。本文将详细介绍如何使用深度学习技术构建目标检测模型，从理论基础到代码实现，带你一步步掌握目标检测的完整流程。一、目标检测的基本概念（一）目标检测的定义目标检测是指在图像中识别和定位多个对象
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象步步咏凉天计算机视觉人工智能
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象。它模拟的是人类视觉系统对视觉场景中“显著”区域的感知能力。显著性可以用于图像理解、目标检测、图像压缩、图像分割等多个任务。下面是对显著性在计算机视觉中的几个关键方面的解释：一、显著性检测（SaliencyDetection）显著性检测的目标是预测图像中最能吸引人注意的区域，通常输出一个与输
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
【AAAI2025】计算机视觉|P-sLSTM:P-sLSTM：让LSTM在时间序列预测领域“重获新生”
论文地址：https://arxiv.org/pdf/2408.10006代码地址：https://github.com/Eleanorkong/P-sLSTM关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要传统的循环神经网络结构，如长短期记忆神经网络(LSTM)，在时间序列预测(TSF)任
【TPAMI2024】计算机视觉|即插即用|FreqFusion:炸裂！告别模糊，精准分割，视觉新高度！爆改模型计算机视觉人工智能
论文地址：https://arxiv.org/pdf/2408.12879代码地址：https://github.com/Linwei-Chen/FreqFusion关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要密集图像预测任务需要在高分辨率下具有强大的类别信息和精确空间边界细节的特征。为
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
使用 C++ 和 OpenCV 进行表面划痕检测 whoarethenext c++opencv 开发语言划痕检测
使用C++和OpenCV进行表面划痕检测在工业自动化生产中，产品表面的质量控制至关重要。划痕作为一种常见的表面缺陷，其检测是许多领域（如金属、玻璃、塑料制造）质量保证流程中的一个关键环节。本文将介绍如何使用C++和强大的计算机视觉库OpenCV来实现一个基本的表面划痕检测算法。核心思路划痕通常在图像中表现为具有以下一个或多个特征的区域：高对比度的线性结构：划痕区域的像素强度通常会与其周围背景有明显
MATLAB 基于图像处理的杂草识别技术鱼弦 matlab 图像处理计算机视觉
MATLAB基于图像处理的杂草识别技术1.系统介绍杂草识别是精准农业中的重要环节，基于图像处理的杂草识别技术利用计算机视觉和机器学习算法，自动识别田间杂草，为精准施药提供决策支持。本系统基于MATLAB实现杂草图像处理，包括图像预处理、特征提取、分类识别等模块。2.应用场景精准农业:自动识别田间杂草，实现精准施药，减少农药使用量。生态监测:监测农田杂草种类和分布，评估生态环境。植物保护:识别有害杂
Python Gradio：快速搭建人脸识别应用 Python编程之道 Python人工智能与大数据 Python编程之道 python 开发语言 ai
PythonGradio：快速搭建人脸识别应用关键词：Python,Gradio,人脸识别,深度学习,计算机视觉,交互式应用,模型部署摘要：本文详细介绍了如何使用Python的Gradio库快速搭建一个交互式的人脸识别应用。我们将从基础概念出发，逐步讲解人脸识别的核心算法原理、Gradio的界面设计方法，并通过完整的项目实战演示如何将深度学习模型部署为可交互的Web应用。文章包含详细的代码实现、数
【图像处理基石】如何入门大规模三维重建？小米玄戒Andrew 图像处理基石深度学习人工智能三维重建大规模三维重建立体视觉大模型 LLM
入门大规模三维重建需要从基础理论、核心技术到实践工具逐步深入，同时需关注该领域的经典工作和前沿进展。以下是分阶段的入门路径及值得重点学习的工作：一、基础理论与前置知识大规模三维重建的核心是从海量图像或传感器数据中恢复场景的三维结构，涉及计算机视觉、摄影测量、图形学、最优化等多个领域，需先掌握以下基础：数学基础线性代数：矩阵运算、特征值分解（用于相机姿态估计）、奇异值分解（SVD，用于基础矩阵求解）
OpenCV 入门指南 —— 从环境搭建到图像处理 m0_74751715 opencv 图像处理人工智能 python
文章目录前言一、什么是OpenCV？二、环境准备与安装1.Python虚拟环境2.安装OpenCV3.验证安装三、读取与显示图像四、常见图像处理操作1.色彩空间转换2.图像平滑（模糊）3.边缘检测（Canny算法）4.在图像上绘制图形与文字五、视频与摄像头操作六、推荐学习路线七、参考资料前言在计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）凭借其开源、
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
【Python】人脸识别宅男很神经 python 开发语言
第一章：计算机视觉与图像处理的基石在深入人脸识别之前，我们必须首先牢固掌握计算机视觉和图像处理的基本概念。人脸，本质上就是一张复杂的图像，对图像的理解是所有高级视觉任务的起点。1.1图像的本质：像素与数字化表示图像，在我们看来是连续的画面，但在计算机内部，它却是离散的数值矩阵。1.1.1什么是像素？图像的最小单元像素（Pixel），是构成数字图像的最小单位。可以将其想象成一个微小的彩色点。一张数字
计算机视觉算法实战——关键点检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言关键点检测（KeypointDetection）是计算机视觉领域中的一个重要研究方向，旨在从图像或视频中检测出具有特定语义信息的关键点。这些关键点通常代表了物体的特定部位或特征，例如人体的关节、面部特征点、车辆的轮子等。关键点检测在姿态估计、动作识别、目标跟踪、三维重建等任务中
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
【人工智能面经第五期：模型训练与优化核心面试深度问答】码上有前 Pytorch Python 深度学习人工智能面试职场和发展
作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题，解析正则化协同策略、迁移学习适配场景、数据增强实践等核心要点，助力读者掌握人工智能与计算机视觉岗位面试中模型训练优化的知识体系，明晰技术原理与实际应用的关联。目录训练技巧-正则化策略相关问题
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他