CharlesWu123

OpenCV —— 图像分割之基于距离变换的分水岭分割

图像分割之基于距离变换的分水岭分割

- 图像分割处理流程
- 距离变换
- - 原理详解
  - OpenCV 函数
  - C++示例
- 分水岭算法
- - 原理详解
  - OpenCV函数
- 整体分割流程示例

图像分割处理流程

原图像灰度化，二值化，开运算消除噪点
距离变换，归一化 distanceTransform normalize
再次二值化，得到确定的前景，即种子
根据种子生成 Marker，可以通过以下两种方式生成：
- 查找连通分量 connectedComponents
- 查找轮廓，绘制轮廓 findContours, drawContours
分水岭变换 watershed
输出图像

距离变换

原理详解

计算原图像的每个像素到最近的 0 像素的距离。

计算每个二值图像像素到最近的零像素之间的近似或精确距离。对于零图像像素，该距离将为零。

一般二值图像中前景为白色（255），背景为黑色（0），距离变换即计算前景与背景的距离。所以前景目标中的像素点距离背景越远，则距离越大，那么距离变换后的图像距离背景越远就越亮。

OpenCV 函数

void cv::distanceTransform( InputArray		src,
                          	OutputArray		dst,
                            OutputArray		labels,
                            int				distanceType,
                            int				maskSize,
                            int				labelType = DIST_LABEL_CCOMP 
                            )		
// Python:
dst, labels = cv.distanceTransformWithLabels(src, distanceType, maskSize[, dst[, labels[, labelType]]])

void cv::distanceTransform(	InputArray		src,
                            OutputArray		dst,
                            int				distanceType,
                            int				maskSize,
                            int				dstType = CV_32F 
                            )
// Python
dst = cv.distanceTransform(src, distanceType, maskSize[, dst[, dstType]])

函数解释

当maskSize == DIST_MASK_PRECISE和distanceType == DIST_L2时，该函数运行算法¹。该算法与TBB库并行化。

在其他情况下，使用算法²。这意味着对于一个像素，该函数能会找到到最接近的零像素的最短路径，该路径由以下基本位移组成：水平，垂直，对角线或 knight’s move（当 mask 为 5×5 时可用）。总距离计算为这些基本距离的总和。由于距离函数应该是对称的，因此所有水平和垂直移位必须具有相同的代价（表示为a），所有对角移位必须具有相同的代价（表示为 b），并且所有 knight’s move 都必须具有相同的代价（表示为c）。对于 DIST_C 和 DIST_L1类型，可以精确计算距离，而对于 DIST_L2（欧几里得距离），则只能以相对误差来计算距离（5×5 mask可以提供更准确的结果）。对于 a，b和 c，OpenCV使用原始论文中建议的值：

DIST_L1 : a = 1, b = 2
DIST_L2 :
- 3 x 3 : a = 0.955, b = 1.3693
- 5 x 5 : a = 1, b = 1.4, c = 2.1969
DIST_C : a = 1, b = 1

一般，对于快速和粗略的距离估计 DIST_L2，使用 3×3 的 mask。为了获得更精确的距离估计DIST_L2，可使用 5×5 mask 或精确算法。请注意，精确算法和近似算法在像素数上都是线性的。

此函数的变体不仅计算每个像素 $(x, y)$ 的最小距离，而且还标识由零像素（labelType == DIST_LABEL_CCOMP）或最近的零像素（labelType == DIST_LABEL_PIXEL）组成的最近的连接分量。连通/像素的索引存储在 labels(x,y) 中。当 labelType == DIST_LABEL_CCOMP 时，该函数自动在输入图像中查找零像素的连接分量，并用不同的标签标记它们。当 labelType == DIST_LABEL_CCOMP 时，该函数将扫描输入图像，并使用不同的标签标记所有零像素。

在这种模式下，复杂度仍然是线性的。也就是说，该函数提供了一种非常快速的方法来计算二值图像的Voronoi 图。当前，第二个变体只能使用近似距离变换算法，即，尚不支持 maskSize = DIST_MASK_PRECISE。

参数解释

参数	解释
src	8-bit，单通道原图像
dst	计算距离的输出图像。与 src 大小相同的 8-bit 或32-bit 单通道图像
labels	输出标签的二维数组（离散 Voronoi 图）。类型为CV_32SC1，大小与src相同。
distanceType	距离的类型
maskSize	距离变换 mask 的大小。不支持 `DIST_MASK_PRECISE`。在`DIST_L1`或`DIST_C`距离类型的情况下，该参数被强制为 3，因为 3×3 与 5×5 或更大的 mask 具有相同的结果。
labelType	要构建的标签数组的类型，`DIST_LABEL_CCOMP` 和 `DIST_LABEL_PIXEL`

C++示例

int main()
{
    string outDir = "./";
    Mat img = imread("手.png", 0);
    // 二值化
    Mat imgBinary;
    threshold(img, imgBinary, 0, 255, THRESH_BINARY_INV|THRESH_OTSU);
    imshow("bin", imgBinary);
    // 距离变换
    Mat imgDist, imgDistBin;
    distanceTransform(imgBinary, imgDist, DIST_L2, 3);
    normalize(imgDist, imgDist, 0, 1, NORM_MINMAX);
    imshow("dist", imgDist);
  	// 再次阈值处理, 可以获取距离背景最远的部分（手掌心）
    threshold(imgDist, imgDistBin, 0.7, 1, THRESH_BINARY);
  	imshow("distBin", imgDistBin);
    waitKey();
    return 0;
}

分水岭算法

原理详解

分水岭的概念是以三维方式来形象化一幅图像为基础的：两个空间坐标作为灰度的函数，如下图所示：

在这种地形学的解释中，考虑三种类型的点：

局部最小值点：属于一个区域的最小值的点，
汇水盆地或分水岭：把一点视为一个水滴，如果把这些点放在任意位置上，水滴一定会下落到某个最小值点
分割线或分水线：处在该点的水会等概率地流向不止一个这样的最小值点

主要目标是找出分水线，基本思想：假设在每个区域的最小值上打一个洞，并且让水通过洞以均匀的速率上升，从低到高淹没珍各个地形。当不同汇水盆地中上升的水聚集时，修建一个水坝来阻止这种聚合。水将达到在水线上只能见到各个水坝的顶部的程度，这些大坝的边界对应于分水岭的分割线。这就是由分水岭算法提取出来的边界。

水坝构建

水坝的构建是以二值图为基础构建的，构建水坝最简单的方法是使用形态学膨胀。

使用下图来说明如何使用形态学膨胀来构建水坝。图 a 显示了第 n-1 步淹没的两个汇水盆地，图 b 显示了第 n 步淹没的结果。水已经从一个盆地溢出到了另一个盆地，因此必须构建水坝来阻止这种情况的发生。

使用 3 x 3 的结构元对图 a 的连通分量进行膨胀。第一轮膨胀（图 c 浅灰色区域）展开了每个原始连通分量的边界，均匀扩展了每个区域的边界。第二轮膨胀（图 c 黑色区域），有一像素的由叉线所示的连通路径是左右两个连通分量膨胀时同时会膨胀的，这条路径就构成了所期望的分割水坝。构建水坝，就是把构建水坝的这条路径上的所有点的像素值设置为大于图像最大灰度值的值，通常设置为图像中允许的最大灰度值加 1。这样，当水位升高时，可以阻止洪水漫过所完成的水坝。

通过这一过程构建的水坝就是我们希望得到的分割边界，可以消除分割线断裂的问题。

标记的使用

直接应用以上的分水岭算法通常会由于噪声和梯度的其他局部不规则性造成过度分割，过度分割的严重性足以令算法得到的结果变得毫无用处，如下图。在这种情况下，意味着存在大量的分割区域。可以通过加入预处理步骤来限制允许存在的区域的数量，而预处理步骤是指将附加知识应用于分割过程。

用于控制过度分割的一种方法基于标记这一概念。标记是指属于一幅图像的连通分量。与感兴趣物体相联系的标记称为内部标记，与背景相关联的标记称为外部标记。选择标记的典型过程由两个主要步骤组成：1. 预处理；2. 定义标记必须满足的一个准则集合。导致上图过度分割的部分原因是，存在大量潜在的最小值。由于它们的尺寸，许多最小值是不相关的细节。将很小的空间细节的影响降至最低的有效方法是，用一个平滑滤波对图像进行过滤。

内部标记定义为：

被更高“海拔”点包围的区域
区域中形成一个连通分量的那些点
连通分量重所有的点又相同的灰度值

在图像经过平滑处理后，内部标记在下图左中以红色、斑点状区域显示。接着，在这些内部标记只能是在允许区域最小值的限制下，对平滑后的图像应用分水岭算法。图左显示了得到的分水线，将这些分水线定义为外部标记，沿分水线的点经过相邻标记间的最高点。

外部标记有效地将图像分割成了不同的区域，每个区域都包涵一个内部标记和背景。这样，问题就简化为将每个区域划分为两部分：单个物体及其背景。可以根据这一简化后的问题，应用不同的分割技术；另一种方法是，对各个区域简单地应用分水岭算法。也就是说，在求得平滑后图像的梯度，然后将算法限制在只对该特殊区域中包含这一标记的单一分水岭进行操作。使用这种方法得到的结果如下图右所示，改善很明显。

标记的选择可以基于灰度值和连通性的简单过程归类。关键是使用标记带来的与分割问题有关的先验知识。

OpenCV函数

void cv::watershed(	InputArray			image,
                    InputOutputArray	markers 
                    )		
// Python:
markers = cv.watershed(image, markers)

使用分水岭算法执行基于标记的图像分割。

该函数实现了分水岭的一种变体，基于非参数标记的分割算法³

在将图像传递给函数之前，您必须使用正（> 0）索引在图像标记中大致勾勒出所需区域。因此，每个区域都表示为一个或多个连接的组件，像素值分别为1、2、3等。可以使用 findContours 和 drawContours 从二进制掩码中检索此类标记。标记是未来图像区域的“种子”。标记中与轮廓区域的关系未知并应由算法定义的所有像素应设置为 0。在函数输出中，标记中的每个像素在区域之间的边界处设置为“种子”分量的值或-1。

参数：

image : 输入 8 位三通道图像
markers : 标记的输入/输出 32位单通道图像。它的大小应与image相同。

整体分割流程示例

基于距离变换的分水岭分割算法

int main()
{
    Mat src = imread("./coins_001.jpg");
    if (src.empty()) {
        cout << "could not load image..." << endl;
        return -1;
    }
    namedWindow("input image", WINDOW_AUTOSIZE);
    imshow("input image", src);
	// 均值漂移，边缘保留，平滑色彩细节
    Mat gray, binary, shifted;
    pyrMeanShiftFiltering(src, shifted, 21, 51);
    imshow("shifted", shifted);
	// 二值化
    cvtColor(shifted, gray, COLOR_BGR2GRAY);
    threshold(gray, binary, 0, 255, THRESH_BINARY | THRESH_OTSU);
    imshow("binary", binary);

    // 距离变换
    Mat dist;
    distanceTransform(binary, dist, DIST_L2, 3, CV_32F);
    normalize(dist, dist, 0, 1, NORM_MINMAX);
    imshow("distance result", dist);

    // 二值化，获取种子
    threshold(dist, dist, 0.4, 1, THRESH_BINARY);
    imshow("distance binary", dist);

    // 通过寻找轮廓，绘制轮廓，获取标记
    Mat dist_m;
    dist.convertTo(dist_m, CV_8U);
    vector<vector<Point>> contours;
    findContours(dist_m, contours, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE, Point(0, 0));

    Mat markers = Mat::zeros(src.size(), CV_32SC1);
    for (int t = 0; t < contours.size(); t++) {
        drawContours(markers, contours, t, Scalar::all(t + 1), -1);
    }
    circle(markers, Point(5, 5), 3, Scalar(255), -1);
    
    // 形态学操作 - 彩色图像，目的是去掉干扰，让效果更好
    Mat k = getStructuringElement(MORPH_RECT, Size(3, 3), Point(-1, -1));
    morphologyEx(src, src, MORPH_ERODE, k);

    // 完成分水岭变换
    watershed(src, markers);
    Mat mark = Mat::zeros(markers.size(), CV_8UC1);
    markers.convertTo(mark, CV_8UC1);
    imshow("watershed result", mark);

    // 生成随机颜色
    vector<Vec3b> colors;
    for (size_t i = 0; i < contours.size(); i++) {
        int r = theRNG().uniform(0, 255);
        int g = theRNG().uniform(0, 255);
        int b = theRNG().uniform(0, 255);
        colors.push_back(Vec3b((uchar)b, (uchar)g, (uchar)r));
    }

    // 颜色填充与最终显示
    Mat dst = Mat::zeros(markers.size(), CV_8UC3);
    int index = 0;
    for (int row = 0; row < markers.rows; row++) {
        for (int col = 0; col < markers.cols; col++) {
        	index = markers.at<int>(i,j);
          	// index == -1 是分水线（边缘）
            if(index == -1){
                dst.at<Vec3b>(row, col) = Vec3b(255, 255, 255);
            // 背景
            } else if (index <= 0 || index > contours.size()) {
                dst.at<Vec3b>(row, col) = Vec3b(0, 0, 0);
            } else {
                dst.at<Vec3b>(row, col) = colors[index - 1];
            }
        }
    }

    imshow("Final Result", dst);
    cout << "number of objects : " << contours.size() << endl;;

    waitKey(0);
    return 0;

}

Pedro Felzenszwalb and Daniel Huttenlocher. Distance transforms of sampled functions. Technical report, Cornell University, 2004. ↩︎
Gunilla Borgefors. Distance transformations in digital images. Computer vision, graphics, and image processing, 34(3):344–371, 1986. ↩︎
Fernand Meyer. Color image segmentation. In Image Processing and its Applications, 1992., International Conference on, pages 303–306. IET, 1992. ↩︎

Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系时光旅人01号深度学习 pytorch opencv
想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。为了让工厂顺利运转，你需要搭建基础设施、安装设备、设置生产线，并配备控制台来管理整个生产过程。以下是这座工厂的详细构建过程：1.工厂的基础设施：Ubuntu比喻：Ubuntu是工厂所在的土地和建筑，提供了基础设施和运行环境。作用：提供操作系统环境，支持安装和运行各种工具和框架
在瑞芯微RK3588平台上使用RKNN部署YOLOv8Pose模型的C++实战指南机＿长 YOLO系列模型有效涨点改进深度学习落地实战 YOLO c++开发语言
在人工智能和计算机视觉领域，人体姿态估计是一项极具挑战性的任务，它对于理解人类行为、增强人机交互等方面具有重要意义。YOLOv8Pose作为YOLO系列中的新成员，以其高效和准确性在人体姿态估计任务中脱颖而出。本文将详细介绍如何在瑞芯微RK3588平台上，使用RKNN（RockchipNeuralNetworkToolkit）框架部署YOLOv8Pose模型，并进行C++代码的编译和运行。注本文全
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【干货】视频文件抽帧（opencv和ffmpeg方式对比） zkFun 超硬干货 Python opencv ffmpeg 人工智能
1废话不多说，直接上代码opencv方式importtimeimportsubprocessimportcv2,osfrommathimportceildefextract_frames_opencv(video_path,output_folder,frame_rate=1):"""使用OpenCV从视频中抽取每秒指定帧数的帧,并保存到指定文件夹。如果视频长度不是整数秒,则会在最后一帧时补充空白
使用BLIP模型生成图像描述的可查询索引 dgay_hua python 计算机视觉开发语言
在本篇文章中，我们将介绍如何使用预训练的SalesforceBLIP图像描述模型，生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像，并通过一系列步骤生成查询索引。使用示例代码进行演示，帮助读者理解和实践。技术背景介绍随着计算机视觉技术的发展，图像描述生成成为了重要的研究领域。通过对图像内容自动生成文字描述，可以大大提高对图像信息的检索和管理效率。Salesfo
查看opencv版本信息 zhanghui9020
在VS2010中编写控制台C++程序：#include#include"cv.h"usingnamespacestd;main(){cout<<CV_VERSION;}运行即可打印安装的opencv的版本信息
深度学习模型中的知识蒸馏是如何工作的? c++服务器开发深度学习人工智能
深度学习模型在多个领域，特别是计算机视觉和自然语言处理中，已经取得了革命性的进展。然而，随着模型复杂性和资源需求的不断攀升，如何将这些庞大模型的知识浓缩为更紧凑、更高效的形式，成为了当前研究的热点。知识蒸馏，作为一种将知识从复杂模型转移到更简单模型的策略，已经成为实现这一目标的有效工具。在本文中，我们将深入探究深度学习模型中知识蒸馏的概念、原理及其在各领域的应用，以期为读者提供一个全面而严谨的视角
Python从0到100（四）：Python中的运算符介绍(补充) 是Dream呀 python java 数据库
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python从0到100（三十五）：beautifulsoup的学习是Dream呀 Dream的茶话会 python beautifulsoup 学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
《深入浅出AI》前言知识：深度学习基础总结 GoAI 深入浅出AI 人工智能深度学习机器学习 cnn rnn 生成对抗网络神经网络
个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉方向导师等，专注大数据与人工智能知识分享。AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成
OpenCV的卡尔曼滤波器：实现和应用雪域Code opencv 人工智能计算机视觉 C/C++
OpenCV的卡尔曼滤波器：实现和应用卡尔曼滤波器（Kalmanfilter）是一种最优估计的算法，在众多领域有着广泛的应用，如控制系统、通信系统、机器人等。OpenCV作为一个计算机视觉库，也提供了对卡尔曼滤波器的支持。本文将介绍OpenCV中卡尔曼滤波器的基本原理、实现方法以及在图像处理中的应用。一、卡尔曼滤波器简介卡尔曼滤波器是一种用于状态估计和信号滤波的算法，主要针对线性、高斯分布的系统。
生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命 ProgramHan 人工智能计算机视觉学习
生成式AI如何重塑计算机视觉：自监督学习与稀疏计算的革命引言：从“数据饥渴”到“智能涌现”传统计算机视觉高度依赖海量标注数据，但现实场景中标注成本高昂且覆盖范围有限。例如，医疗影像标注需专业医生耗时数月，工业缺陷检测需针对特定产线定制数据集。生成式AI（如Diffusion模型、自监督学习）的崛起，正在打破这一瓶颈——通过更高效的训练范式与计算架构，让机器学会“从无标注数据中看见世界”。（示意图：
【深度学习】计算机视觉（CV）-目标检测-DETR（DEtection TRansformer）—— 基于 Transformer 的端到端目标检测 IT古董深度学习人工智能深度学习计算机视觉目标检测
1.什么是DETR？DETR（DEtectionTRansformer）是FacebookAI（FAIR）于2020年提出的端到端目标检测算法，它基于Transformer架构，消除了FasterR-CNN、YOLO等方法中的候选框（AnchorBoxes）和非极大值抑制（NMS）机制，使目标检测变得更简单、高效。论文：End-to-EndObjectDetectionwithTransforme
机器学习:支持向量机小源学AI 人工智能支持向量机机器学习算法
基本概念1.什么是支持向量机支持向量机是一种二分类模型,在机器学习、计算机视觉、数据挖掘中广泛应用,主要用于解决数据分类问题,它的目的是寻找一个超平面对样本进行分割,分割的原则是间隔最大化(也就是数据集的边缘点到分界点的距离d最大)最终转化成一个凸二次规划问题来求解。通常的SVM用于二元分类问题,对于多元分类问题可将其分解为多个二元分类问题,在进行分类。2.最优分类边界什么才是最优分类边界?什么条
基于图像处理的裂缝检测与特征提取机器懒得学习图像处理计算机视觉人工智能
一、引言裂缝检测是基础设施监测中至关重要的一项任务，尤其是在土木工程和建筑工程领域。随着自动化技术的发展，传统的人工巡检方法逐渐被基于图像分析的自动化检测系统所取代。通过计算机视觉和图像处理技术，能够高效、精确地提取裂缝的几何特征，如长度、宽度、方向、面积等，从而为工程质量评估提供数据支持。本文将详细介绍一段用于裂缝检测与特征提取的Python代码，重点讲解其实现的核心算法与关键步骤，分析其应用场
利用 OpenCV 进行棋盘检测与透视变换萧鼎 python基础到进阶教程 opencv 人工智能计算机视觉
利用OpenCV进行棋盘检测与透视变换1.引言在计算机视觉领域，棋盘检测与透视变换是一个常见的任务，广泛应用于摄像机标定、文档扫描、增强现实（AR）等场景。本篇文章将详细介绍如何使用OpenCV进行棋盘检测，并通过透视变换将棋盘区域转换为一个标准的矩形图像。我们将基于一段Python代码进行分析，代码的主要任务包括：读取图像并进行预处理（灰度转换、自适应直方图均衡化、去噪）检测边缘并提取棋盘区域计
对换脸、动嘴生成的视频做初筛之群害马音视频计算机视觉 opencv
首尾帧人脸差异检测代码概述本脚本实现了一个简单的视频筛查系统，主要功能是通过比较视频首帧和尾帧中的人脸差异来判断视频是否合格。如果视频中没有人脸或存在其他异常情况，视频将被移动到错误目录中。具体来说，系统包含以下几个主要步骤：加载视频文件：尝试打开视频文件，并读取首帧和尾帧。人脸检测：使用OpenCV的Haar级联分类器检测视频首帧和尾帧中的人脸。人脸提取与标准化：从检测到的人脸区域中提取并标准化
CVPR2023 Highlight | ECON：最新单图穿衣人三维重建SOTA算法 3Ｄ视觉工坊 3D视觉从入门到精通算法 SLAM 自动驾驶 3D视觉
作者：宁了个宁|来源：计算机视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf。添加微信：dddvisiona，备注：三维重建，拉你入群。文末附行业细分群。图1所示。从彩色图像进行人体数字化。ECON结合了自由形式隐式表示的最佳方面，以及明确的拟人化正则化，以推断高保真度的3D人类，即使是宽松的衣服或具有挑战性的姿势。0.笔者个人体会这篇文章讨论了单图像的穿着人类重建问题。隐式方
商汤绝影端到端自动驾驶的迭代优化 AGI大模型与大数据研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型训练,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展，自动驾驶汽车从科幻走进了现实。商汤科技推出的绝影端到端自动驾驶系统，就是其中的佼佼者。本文将深入剖析商汤绝影端到端自动驾驶系统的迭代优化过程，帮助读者理解其背后的技术原理和架构设计。2.核心概念与联系商汤绝影端到端自动驾驶系统的核心架构如下：graphLRA[感知
使用OpenCV在Visual Studio上编译x86或x64平台的应用程序程序世界航海 opencv visual studio 人工智能编程
OpenCV是一个广泛使用的计算机视觉库，它提供了丰富的图像处理和计算机视觉算法。如果你想在VisualStudio上编译一个使用OpenCV的应用程序，并且需要针对特定的x86或x64平台进行优化，那么本文将为你提供一些指导。以下是在VisualStudio中编译x86或x64平台上的OpenCV应用程序的步骤：步骤1：安装VisualStudio和OpenCV首先，确保你已经安装了最新版本的V
用realsense d435i传感器在实际环境中跑ORB_SLAM3，顺带解决一部分编译问题睫力上爬 SLAM 日常折腾传感器 ORB_SLAM3
是的ORB_SLAM3来了，时隔五年，它来带的惊喜到底是啥呢？一个完全依赖于最大后验估计（MAP）的单/双目惯导融合系统高回召的地点识别功能（High-recallplacerecognition）第一个完整的多地图系统（multi-map）一个抽象的相机模型表示论文地址论文细节今天不说，今天主要先拿到代码，并且用自己的传感器试试实际效果编译终端拉代码记得提前安装好OpenCV，Eigen，和Pa
ROS教程（六）：Rviz显示USB摄像头（详细图文） Leslie___Cheung ROS ROS rviz usb摄像头
目录前言一、RVIZ介绍1.数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ2.添加模块三、启动总结（最重要的）前言上一章讲解了如何使用OpenCV调用电脑摄像头或USB摄像头，本章Leslie就讲解如何使用rviz来显示摄像头的画面。一、RVIZ介绍1.数据类型介绍参考ROS教程（四）->数据类型介绍2.界面介绍二、配置RVIZ1.打开RVIZ打开终端，输入rvi
【ORB_SLAM系列3】—— 如何在Ubuntu18.04中使用自己的单目摄像头运行ORB_SLAM3（亲测有效，踩坑记录）啥也不会的研究僧 SLAM算法安装与实践记录 ubuntu 计算机视觉人工智能自动驾驶
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、ORB_SLAM3源码编译二、ORB_SLAM3实时单目相机测试1.查看摄像头的话题2.运行测试三.运行测试可能的报错1.报错一(1)问题描述(2)原因分析(3)解决2.报错二(1)问题描述(2)解决前言本次教程运行ORB_SLAM3，所需的环境如下：Ubuntu18.04、ros版本：melodicOpencv4.5
奥比中光3D机器视觉相机能连接halcon吗？视觉人机器视觉机器视觉3D 3d 数码相机视觉检测 c#
奥比中光的设备与Halcon的兼容性可以通过以下方式实现：数据接口的通用性奥比中光的相机（如AstroPro、大白等）支持通过UVC协议获取彩色图像，深度数据则通过OpenNI或ROS2接口传输105。若Halcon支持这些协议或标准接口（如ROS消息、OpenCV图像流），则可通过直接调用或二次开发实现连接。例如，通过Python或C#脚本将图像数据从相机传输至Halcon的处理流程中。SDK与
探秘 DeepSeek R1 模型：跨越多领域的科技奇迹，引领智能应用新浪潮羑悻的小杀马特. AI学习科技 deepseek AI大模型
DeepSeekR1模型功能强大，应用广泛。在自然语言处理、计算机视觉、推荐系统和医疗等领域都能发挥作用。本文介绍了其在各领域的应用场景和代码示例，助你深入了解它。目录编辑一、本篇背景：二、DeepSeekR1模型概述：2.1模型特点：2.2技术原理：三、自然语言处理领域的应用：3.1文本分类：3.1.1应用场景：3.1.2代码演示：3.2情感分析：3.2.1应用场景：3.2.2代码演示：3.3机
Ubuntu 安装 OpenCV (C++) LegendBIT 程序开发--基本工具 ubuntu opencv c++
版本详情：Ubuntu:22.04+5.15.0-133-genericgcc:11.4.0g++:11.4.0OpenCV:4.7.01.卸载OpenCV进入原先编译opencv的build目录，在该目录下打开终端，执行以下代码（如果build已经删除了，可以重新编译一遍该版本的opencv，然后在最后一步执行sudomakeuninstall）sudomakeuninstallcd..sudo
QT5在windows下调用OpenCV库出现: undefined reference to `xxxxx' 错误解决办法（适用MinGW编译器）。 DS小龙哥 QT(C++)应用软件开发 AI人工智能 opencv
一、环境介绍window系统：win10X64QT版本:5.12QT5.12自带的MinGW编译器版本：mingw730_32与mingw730_64在QT的安装目录下，可以查看MinGW编译器的版本:二、使用OpenCV出现的问题在QT框架代码里使用老版本的分类器(cvLoad、cvHaarDetectObjects)处理图像时，正常编译没有问题，当使用新版本级联分类器(CascadeClass
使用opencv实现深度学习的图片与视频的超分辨率人工智能研究所人工智能之计算机视觉 opencv 深度学习视频超分辨率图片超分辨率
图片超分辨率什么是视频与图片的超分辨率，总结一下便是给一张分辨率比较低的图片，进行超分辨率的处理后，生成比较清晰的高分辨率的图片，上图图片完美解释了超分辨率的过程，由于不同的算法不同，处理的结果也不相同，本期我们介绍一下如何进行图片的超分辨率的处理。·EDSR模型图像超分辨率EDSR：EnhancedDeepResidualNetworksforSingleImageSuper-Resolutio
OpenCV 简介奇点创客 OpenCV
OpenCV（OpenSourceComputerVisionLibrary，开源计算机视觉库：http://opencv.org）是一个开放源代码库，其中包含数百种计算机视觉算法。本文档介绍所谓的OpenCV2.xAPI，与基于C的OpenCV1.xAPI相比，该API本质上是一套C++API（自OpenCV2.4发行以来，不推荐再使用CAPI，并且不使用“C”编译器进行测试）。OpenCV具有
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

OpenCV —— 图像分割之基于距离变换的分水岭分割

图像分割之基于距离变换的分水岭分割

图像分割处理流程

距离变换

原理详解

OpenCV 函数

C++示例

分水岭算法

原理详解

OpenCV函数

整体分割流程示例

你可能感兴趣的:(OpenCV,计算机视觉,opencv)