苏州程序大白

Opencv 源码初探

序言
这篇博客主要是想记录一下关于 opencv 这个库的一些学习心得，并穿插一些图像处理的基本知识。
分析基于 opencv 4.5.1，其他版本可能会存在一些接口的变动，还请注意。
准备
首先是 opencv 的安装。对于 python 版的 opencv，可以直接使用 pip install 进行安装。对于 C++ 版则可以自己下载源码进行编译与安装。这里介绍在 ubuntu 下如何编译源码:

工具: git、cmake

首先需要下载源码（开源码）:

 https://github.com/opencv/opencv

由于 git 可能较慢，linux 或 mac 下可以使用 wget/curl 等指令利用代理进行下载，以加快下载速度。也可以到我分享的网盘下：

链接：https://pan.baidu.com/s/1ZKOH1ehXm3gmU749lwZRlw 
提取码：0wov

其次是配置，opencv 的配置需要用到 cmake。

mkdir build && cd build // 新建 build 文件夹用于构建
cmake .. // 生成 makefile 文件
make && make install // 编译并安装

注: 编译选项可以在 cmake 生成 Makefile 的时候进行配置。另外由于项目较大，编译耗时较长，也可以加上 -j4 等利用多线程进行编译。
调用 cmake 的时候如果报错提示需要创建另一个文件来存放编译产物这样的信息，可以试下把 CMakeCache.txt 删掉。
安装完毕后，可以先使用简单的 demo 进行测试。
C++:

#include 
using namespace cv;
int main(int argc, char **argv) {
    /// 将文件的路径传入 opencv 读取
    Mat a = imread(argv[1]);
    imshow("test", a);
    waitKey(0);
    return 0;
}

CMakefile:

cmake_minimum_required(VERSION 2.8)
project( LearnOpenCV ) # 文件名字随便起，和下面对应就行
find_package( OpenCV REQUIRED )
include_directories ( ${OpenCV_INCLUDE_DIRS} )
add_executable( LearnOpenCV test.cpp ) # 输入文件名也要对应
target_link_libraries( LearnOpenCV ${OpenCV_LIBS} )

最后使用 CMake 还有 make 进行编译即可。找一张图片测试下如果能正常展示出来应该就没问题了。当然也可以使用 g++/clang++ 等直接进行编译，但需要注意链接的时候要加上 opencv 的二进制文件。

Arch

opencv 的项目文件结构的安排同样是按照模块进行划分的，源文件基本都放在了 modules 文件夹下。其中，几个重要的模块如下:

1、core，包含一些基本的类定义，比如矩阵类 Mat，以及 mask，blend 操作等
2、imgproc，包含大量图像处理算法，也是这个博客的重点
3、highgui, imgcodecs, videoio，包含图像/视频的编解码等功能
4、feature2d，包含 2d 图像特征检测相关的 api
5、calib3d，3d 摄像机相关的库

对于每个模块，基本的文件结构如下:

1、doc 包含模块相关文档
2、include 包含模块的头文件(.hpp)
3、misc 包含其他语言的一些源文件，包括 python，java，oc 等
4、perf 包含性能测试相关文件
5、src 模块源文件
6、test 包含单元测试相关文件

Read / Write / Show

使用图像前往往对图像进行读取。api 如下:

Mat imread( const String& filename, int flags = IMREAD_COLOR );

对应的实现在 imgcodecs 模块中的 loadsave.cpp 文件中。做一定的检查并初始化一个 Mat 容器，然后调用同一个文件中的 imread_ 函数。化简后的步骤如下:

static bool
imread_( const String& filename, int flags, Mat& mat )
{
    ImageDecoder decoder;
    decoder = findDecoder( filename ); /// 找到一个合适的 decoder 去解析文件
    if( !decoder ){ /// 找不到则返回
        return 0;
    }

    int scale_denom = 1;
    ...
    decoder->setScale( scale_denom ); /// 设置 scale
    decoder->setSource( filename ); /// 设置源文件名
    ...
    /// 确保 decode 的文件大小不会过大
    Size size = validateInputImageSize(Size(decoder->width(), decoder->height()));
    /// 获取 decoder 对应的图片的类型
    int type = decoder->type();
    type = ...
    /// 创建大小为 height * width，类型为 type 的矩阵
    mat.create( size.height, size.width, type );
    /// 读取图片数据
    bool success = false;
    try
    {
        if (decoder->readData(mat))
            success = true;
    }
    catch ...
    if (!success)
    {
        mat.release();
        return false;
    }
    ...
    return true;
}

经过这样一个步骤，图片就会根据具体的类型调用能解码对应类型的图像解码器，readData 将文件读取到矩阵当中。最后返回 true 表示读取成功。每种类型的图片的读取方式都不太相同，但最终都会转化一个矩阵的形式(通常为 BGR 或者灰度图)，此后的处理就都是针对矩阵了。

写操作类似，首先是搜索找到一个合适的图像编码器，然后将类型传入，设置好目的文件名，然后具体的写入逻辑就转交给编码器了。

imshow 位于 highgui 模块的 window.cpp 中。定义以下代码所示:

void cv::imshow( const String& winname, InputArray _img )
{
    CV_TRACE_FUNCTION();
    const Size size = _img.size();
#ifndef HAVE_OPENGL
    /// show with cvShowImage
#else
    const double useGl = getWindowProperty(winname, WND_PROP_OPENGL);
    CV_Assert(size.width>0 && size.height>0);
    if (useGl <= 0)
    {
        /// show with cvShowImage
    }
    else
    {
        ...
        setOpenGlContext(winname);
        cv::ogl::Texture2D& tex = ownWndTexs[winname];
        /// copy buffer from image to texture
        if (_img.kind() == _InputArray::CUDA_GPU_MAT)
        {
            cv::ogl::Buffer& buf = ownWndBufs[winname];
            buf.copyFrom(_img);
            buf.setAutoRelease(false);

            tex.copyFrom(buf);
            tex.setAutoRelease(false);
        }
        else
        {
            tex.copyFrom(_img);
        }
        setOpenGlDrawCallback(winname, glDrawTextureCallback, &tex);
        updateWindow(winname);
    }
#endif
}

绘图的逻辑中，总共有两条支线。如果可以使用 opengl，优先使用 opengl 进行绘制(目前默认没有使用 opengl)。如果不支持 opengl，opencv 还提供了 gtk，qt，w32，winrt 等绘图 api。cv 这个命名空间中的几个 cvUpdateWindow, setOpenGlDrawCallback 函数等为空实现。如果配置中选择了相应的库，则加入编译。这样就做到了动态地配置绘图实现方式。

Dip

图像处理涉及到的知识面十分复杂，因此这里仅选择 filter，canny，morphology 三个比较重要的部分，分析源码是如何实现的。

Filter

滤波是图像处理中的一个核心步骤，C++ 层接口如下：

CV_EXPORTS_W void filter2D( InputArray src, OutputArray dst, int ddepth,
                            InputArray kernel, Point anchor = Point(-1,-1),
                            double delta = 0, int borderType = BORDER_DEFAULT );

opencv 中的 filter2D 并不是数学意义上的卷积，而是相关(Correlation)。数学上的卷积需要先对核进行翻转操作。如果核范围超过了图像，则使用给定的 border 模式对图像进行插值。经过数值提取后，函数的实现如下(位于 imgproc 模块的 filter.dispatch.cpp 文件中)：

bool res;
res = replacementFilter2D(...);
if (res)
    return;
res = dftFilter2D(...);
if (res)
    return;
ocvFilter2D(...);

可以看到，滤波函数的处理总共有三种分支。第一种是 replacementFilter2D，使用 ipp(Integrated Performance Primitives, 包含一套硬件实现的高速算法)。如果不支持 ipp，则采用第二种方式，即基于 dft(逆傅里叶变换) 的滤波方式。最后在没有其他可行的方式的情况下，才采用最原始的方式进行计算。

ocvFilter2D

ocvFilter2D 中，调用 createLinearFilter 函数创建一个 FilterEngine。

static void ocvFilter2D(...) {
    ...
    Ptr<FilterEngine> f = createLinearFilter(...);
    f->apply(...);
}

createLinearFilter 中又调用了 getLinearFilter 函数获取线性滤波器，然后将其包装在 FilterEngine 内。getLinearFilter 最后又用到了 filter.simd.hpp 中 Filter2D 这个模板类。

apply 函数中调用到了 FilterEngine__apply 函数。先是使用 FilterEngine__start 进行初始化以及校验的工作，然后调用 FilterEngine__proceed，最后调用到的是 Filter2D 的 operator() 实现滤波的(本质上还是两个 for 循环实现的)。

dftFilter2D

使用 dft 版本的滤波器如下: 首先会根据硬件是否支持以及原矩阵和目标矩阵的类型决定最大的核的大小。如果核很小，则返回 false，表示不采用 dft 方式，最后就会使用线性滤波实现。通常核大于 11 x 11 时就会采用 dft。

条件检查过后，会创建一个新的 temp 矩阵，然后调用 crossCorr 进行计算，最后再将 temp 矩阵拷贝到 dst，然后返回成功信息。

static bool dftFilter2D(...)
{
    {
        ...
        int dft_filter_size = ... ? 130 : 50;
        if (kernel_width * kernel_height < dft_filter_size)
            return false;
        ...
    }
    ...
    // crossCorr doesn't accept non-zero delta with multiple channels
    if (src_channels != 1 && delta != 0) {
        create Mat temp
        crossCorr(src, kernel, temp, anchor, 0, borderType);
        add(temp, delta, temp);
        ...
    } else {
        create Mat tmp
        crossCorr(src, kernel, temp, anchor, delta, borderType);
        ...
    }
    return true;
}

crossCorr 函数的实现在 imgproc module 的 templmatch.cpp 文件中。实现较复杂这里就不再贴上来，基本的思路就是: 计算出一个合适的 dft 后的矩阵大小，将原图像以及核都分别进行 dft 操作，然后在频域空间上进行相乘(调用了 mulSpectrums 函数)，最后再使用 idft 还原到原来的大小。其中最复杂的点在于矩阵的大小的确定: 过小会导致精度的丢失，过大则增加了计算的复杂度。最合适的大小在 opencv 中是 hardcode 的：

// 枚举 2^32 以内所有最佳大小，最后使用二分查找计算得到一个最合适的大小
static const int optimalDFTSizeTab[] = {
    1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 15, 16, ...}

Medium Filter
中值滤波在图像处理中也比较常见，实现位于 imgproc 模块的 mediun_blur.dispatch.cpp 文件中。

void medianBlur( InputArray _src0, OutputArray _dst, int ksize )
{
    ...
    // 1. 优先使用 opencl, 如果能够成功计算结果则直接返回
    CV_OCL_RUN(_dst.isUMat(),
               ocl_medianFilter(_src0,_dst, ksize))

    Mat src0 = _src0.getMat();
    _dst.create( src0.size(), src0.type() );
    Mat dst = _dst.getMat();
    // 2. 尝试使用 cv_hal_medianBlur 函数进行中值滤波，当前版本下这个函数默认为空。
    // 这里应该是预留了自行定制中值滤波函数的入口
    CALL_HAL(medianBlur, cv_hal_medianBlur, src0.data, src0.step, dst.data, dst.step, src0.cols, src0.rows, src0.depth(),
             src0.channels(), ksize);
    // 3. 尝试使用 openvx 进行中值滤波
    CV_OVX_RUN(true,
               openvx_medianFilter(_src0, _dst, ksize))
    // 4. 最后使用 medianBlur.simd.hpp 进行中值滤波的计算
    CV_CPU_DISPATCH(medianBlur, (src0, dst, ksize),
        CV_CPU_DISPATCH_MODES_ALL);
}

进一步分析，进入 medianBlur.simd.hpp 文件中查看 opencv 内置的中值滤波的实现方式。

void medianBlur(const Mat& src0, /*const*/ Mat& dst, int ksize) {
    ...
    bool useSortNet = ...;
    Mat src;
    if ( useSortNet ) {
        ...
        if( src.depth() == CV_8U )
            medianBlur_SortNet<MinMax8u, MinMaxVec8u>( src, dst, ksize );
        else if( src.depth() == CV_16U )
            medianBlur_SortNet<MinMax16u, MinMaxVec16u>( src, dst, ksize );
        else if( src.depth() == CV_16S )
            medianBlur_SortNet<MinMax16s, MinMaxVec16s>( src, dst, ksize );
        else if( src.depth() == CV_32F )
            medianBlur_SortNet<MinMax32f, MinMaxVec32f>( src, dst, ksize );
        else
            CV_Error(CV_StsUnsupportedFormat, "");
        return;
    } else {
        /// 创建 border
        cv::copyMakeBorder( src0, src, 0, 0, ksize/2, ksize/2, BORDER_REPLICATE|BORDER_ISOLATED);
        if( ksize <= ...) medianBlur_8u_Om( src, dst, ksize );
        else medianBlur_8u_O1( src, dst, ksize );
    }
}

可以看到，中值滤波一共有三个出口。首先根据核的大小(3 或者 5)判断是否使用 SortNet，是则进入 medianBlur_SortNet 方法。然后再次根据核大小判断，核比较小则采用一般的 Om 的一个中值滤波器，核比较大时，则使用一个 O1 的中值滤波器。

下面再进入 medianBlur_SortNet 方法查看实现。可以看到，这里只处理 m = 3 和 m = 5 情况下的中值滤波。同时，这个方法是一个泛型方法，传入的是 Op 和 VecOp 这两个类，分别对应于两个值之间的大小比较以及两个向量之间的大小比较。

template<class Op, class VecOp>
static void
medianBlur_SortNet( const Mat& _src, Mat& _dst, int m )
{
    CV_INSTRUMENT_REGION();

    typedef typename Op::value_type T;
    typedef typename Op::arg_type WT;
    typedef typename VecOp::arg_type VT;

    const T* src = _src.ptr<T>();
    T* dst = _dst.ptr<T>();
    int sstep = (int)(_src.step/sizeof(T));
    int dstep = (int)(_dst.step/sizeof(T));
    Size size = _dst.size();
    int i, j, k, cn = _src.channels();
    Op op;
    VecOp vop;

    if( m == 3 ) {
        if( size.width == 1 || size.height == 1 ) {
            /// 处理极端情况
            return;
        }
        size.width *= cn;
        /// 遍历每一行
        for( i = 0; i < size.height; i++, dst += dstep ) {
            const T* row0 = src + std::max(i - 1, 0)*sstep;
            const T* row1 = src + i*sstep;
            const T* row2 = src + std::min(i + 1, size.height-1)*sstep;
            int limit = cn;
            /// 遍历每一列
            for(j = 0;; ) {
                /// 遍历 cn 个像素点，对每个通道都进行比较得到中值
                for( ; j < limit; j++ )
                {
                    int j0 = j >= cn ? j - cn : j;
                    int j2 = j < size.width - cn ? j + cn : j;
                    WT p0 = row0[j0], p1 = row0[j], p2 = row0[j2];
                    WT p3 = row1[j0], p4 = row1[j], p5 = row1[j2];
                    WT p6 = row2[j0], p7 = row2[j], p8 = row2[j2];
                    /// op(p1, p2) 作用是当 p1 < p2 时交换两个数字
                    op(p1, p2); op(p4, p5); op(p7, p8); op(p0, p1);
                    op(p3, p4); op(p6, p7); op(p1, p2); op(p4, p5);
                    op(p7, p8); op(p0, p3); op(p5, p8); op(p4, p7);
                    op(p3, p6); op(p1, p4); op(p2, p5); op(p4, p7);
                    op(p4, p2); op(p6, p4); op(p4, p2);
                    dst[j] = (T)p4;
                }

                if( limit == size.width )
                    break;

                for( ; j <= size.width - VecOp::SIZE - cn; j += VecOp::SIZE )
                {
                    VT p0 = vop.load(row0+j-cn), p1 = vop.load(row0+j), p2 = vop.load(row0+j+cn);
                    VT p3 = vop.load(row1+j-cn), p4 = vop.load(row1+j), p5 = vop.load(row1+j+cn);
                    VT p6 = vop.load(row2+j-cn), p7 = vop.load(row2+j), p8 = vop.load(row2+j+cn);

                    vop(p1, p2); vop(p4, p5); vop(p7, p8); vop(p0, p1);
                    vop(p3, p4); vop(p6, p7); vop(p1, p2); vop(p4, p5);
                    vop(p7, p8); vop(p0, p3); vop(p5, p8); vop(p4, p7);
                    vop(p3, p6); vop(p1, p4); vop(p2, p5); vop(p4, p7);
                    vop(p4, p2); vop(p6, p4); vop(p4, p2);
                    vop.store(dst+j, p4);
                }
                limit = size.width;
            }
        }
    }
    else if( m == 5 ) {
        /// 类似上面 m == 3 的处理方式，使用尽量少的比较得到中值
    }
}

Op 的实现在同个文件中的 MinMax? 类，？分别为 8u，16u, 16s, 32f。具体操作是在第一个参数比第一个参数大的时候交换这两个数。注意到 MinMax8u 对应的类中的 operator() 方法有点不同：

int t = CV_FAST_CAST_8U(a - b);
b += t; a -= t;

另外，如果没有启用 CV_SIMD(Simple instruction multiple data，硬件级别的优化)，VecOp 则和 Op 是等价的。这个方法中一个比较大的优化是，使用了循环展开，并用多次 MinMax 操作将获取中值，而不是使用循环遍历，加快了代码的执行速度。

另外一个实现中值滤波的方法 medianBlur_8u_Om 的实现则完全不同。一个比较有趣的点是: 它计算中值的方式是直接统计核覆盖的矩阵中 0 ~ 255 的像素点出现次数。然后只要遍历查看某个 x 的出现次数大于核的大小的一半，结果矩阵中就把 x 填入。这样导致的问题是，最坏情况下每次要遍历 256 个值，因此算法中采用了一个简单的优化: 使用区间统计。用一个新的大小为 16 的数组表示分别表示 [0…15], [16…31]… 的出现次数。这样在寻找中值点的时候速度就要快了很多，最坏情况下只需要遍历 32 个值即可得到中值点。

Canny
Canny 算法是很经典的边缘提取算法，opencv 的 imgproc 模块有一个单独的 canny.cpp 文件负责完成 canny 算法。入口函数如下：

/// src 为输入矩阵，dst 为输出矩阵
/// low_thresh 和 high_thresh 分别为高低阈值
/// aperture_size 为 Sobel 孔径大小(3、5 或 7)
/// L2Gradient 表示是否使用 L2 梯度
void Canny( InputArray _src, OutputArray _dst,
                double low_thresh, double high_thresh,
                int aperture_size, bool L2gradient )
{
    /// 一些基本的条件检查
    const Size size = _src.size();
    ...
    /// 依次尝试使用 opencl，hal，openvx 以及 ipp 完成 Canny 算法的计算，成功会直接返回
    CV_OCL_RUN(...)
    CALL_HAL(...);
    CV_OVX_RUN(...)
    CV_IPP_RUN_FAST(...)
    /// 使用 L2Gradient，需要修正 thresh
    if (L2gradient)
    {
        low_thresh = std::min(32767.0, low_thresh);
        high_thresh = std::min(32767.0, high_thresh);
        if (low_thresh > 0) low_thresh *= low_thresh;
        if (high_thresh > 0) high_thresh *= high_thresh;
    }
    int low = cvFloor(low_thresh);
    int high = cvFloor(high_thresh);
    /// 根据当前的 opencv 中运行的线程数以及 cpu 核的数量计算使用多少个线程去计算 canny
    int numOfThreads = ...;

    Mat map;
    std::deque<uchar*> stack;
    /// 并行计算 canny
    parallel_for_(Range(0, src.rows), parallelCanny(src, map, stack, low, high, aperture_size, L2gradient), numOfThreads);
    /// 进行依次全局的 edge track
    ptrdiff_t mapstep = map.cols;
    while (!stack.empty())
    {
        uchar* m = stack.back();
        stack.pop_back();

        if (!m[-mapstep-1]) CANNY_PUSH((m-mapstep-1), stack);
        if (!m[-mapstep])   CANNY_PUSH((m-mapstep), stack);
        if (!m[-mapstep+1]) CANNY_PUSH((m-mapstep+1), stack);
        if (!m[-1])         CANNY_PUSH((m-1), stack);
        if (!m[1])          CANNY_PUSH((m+1), stack);
        if (!m[mapstep-1])  CANNY_PUSH((m+mapstep-1), stack);
        if (!m[mapstep])    CANNY_PUSH((m+mapstep), stack);
        if (!m[mapstep+1])  CANNY_PUSH((m+mapstep+1), stack);
    }
    /// 最后遍历一遍 map，将 map 中标记为 edge 的点转成 255，其余点转成 0
    parallel_for_(Range(0, src.rows), finalPass(map, dst), src.total()/(double)(1<<16));
}

可以看到，核心的计算函数就是 parallelCanny，利用多线程进行计算，计算的流程可以拆分成下面几个步骤(不考虑 SIMD 的情况下，考虑 SIMD 的话部分代码会有些不同)。

sobel 算子

canny 的第一步是使用 sobel 算子计算每个点在 x，y 方向上的梯度，核心的两个函数调用如下:

if(needGradient)
{
    Sobel(src.rowRange(rowStart, rowEnd), dx, CV_16S, 1, 0, aperture_size, scale, 0, BORDER_REPLICATE);
    Sobel(src.rowRange(rowStart, rowEnd), dy, CV_16S, 0, 1, aperture_size, scale, 0, BORDER_REPLICATE);
}

根据给定的参数，参与计算的 sobel 的核为:

kernelX = [[-1, 0, 1]]
kernelY = [[-1],[0],[1]]

计算的结果保存在 dx，dy 这两个矩阵中。

Edge detect

为了更好地利用空间，此处使用了循环 buffer 来保存图像中每一行中各个点的强度(magnitude)大小。mag_a 表示当前行，mag_p 表示上一行，mag_n 表示下一行。

AutoBuffer<int> buffer(3 * (mapstep * cn));
_mag_p = buffer.data() + 1;
_mag_a = _mag_p + mapstep * cn;
_mag_n = _mag_a + mapstep * cn;

接下来遍历线程所负责的每一行，计算 magnitude 的大小。然后再进行非极大值抑制，得到每个点是否属于 edge 的相关信息。用矩阵 pmap 表示，每个点 2 表示这个点是边，1 表示这个点不可能是边，0 表示这个点可能是边。

/// rowStart 和 end 分别表示当前线程所负责的图像的行
for (int i = rowStart; i <= boundaries.end; ++i) {
    /*  计算 magnitude 部分  */
    /// 计算下一行的 magnitude
    if(i < rowEnd) {
        _dx = dx.ptr<short>(i - rowStart);
        _dy = dy.ptr<short>(i - rowStart);
        /// 使用 L2 计算梯度
        if (L2gradient)
        {
            int j = 0, width = src.cols * cn;
            for ( ; j < width; ++j)
                _mag_n[j] = int(_dx[j])*_dx[j] + int(_dy[j])*_dy[j];
        } else { /// 使用 L1 计算梯度
            int j = 0, width = src.cols * cn;
            for ( ; j < width; ++j)
                _mag_n[j] = std::abs(int(_dx[j])) + std::abs(int(_dy[j]));
        }
        ...
    } else {
        ...
    }
    ...
    /*  非极大值抑制部分  */
    /// tan22 大小为 13573/(1<<16)，用整数提高精度
    const int TG22 = 13573;
    int j = 0;
    for (; j < src.cols; j++) {
        int m = _mag_a[j];
        if (m > low) {
            short xs = _dx[j];
            short ys = _dy[j];
            int x = (int)std::abs(xs);
            int y = (int)std::abs(ys) << 15;

            int tg22x = x * TG22;
            /// 梯度位于水平方向上
            if (y < tg22x)
            {
                if (m > _mag_a[j - 1] && m >= _mag_a[j + 1])
                {
                    /// 判断点的梯度是否大于阈值 high，若是则 push 进堆栈，同时 pmap 设为 0
                    /// 下面类似
                    CANNY_CHECK(m, high, (_pmap+j), stack);
                    continue;
                }
            }
            else
            {
                /// 梯度位于垂直方向上
                int tg67x = tg22x + (x << 16);
                if (y > tg67x)
                {
                    if (m > _mag_p[j] && m >= _mag_n[j])
                    {
                        CANNY_CHECK(m, high, (_pmap+j), stack);
                        continue;
                    }
                }
                else
                {
                    /// 梯度位于斜方向上
                    int s = (xs ^ ys) < 0 ? -1 : 1;
                    if(m > _mag_p[j - s] && m > _mag_n[j + s])
                    {
                        CANNY_CHECK(m, high, (_pmap+j), stack);
                        continue;
                    }
                }
            }
        }
        _pmap[j] = 1;
    }
}

Edge track

前面的函数中，已经计算得到了 pmap 表示每个结点是否可能为边这样的信息。双阈值要求算法需要对于可能为边的结点，仅当周围八个点中存在一定为边的结点才能计为边，否则当前点不属于边。因此，算法使用了栈这样的数据结构来实现，所有一定为边的结点入栈，处理每个结点时周围八个结点如果存在可能为边的结点，则标记为边并入栈，直到栈为空。

while (!stack.empty())
{
    uchar *m = stack.back();
    stack.pop_back();
    if(/* 不是位于边界 */ (unsigned)(m - pmapLower) < pmapDiff) {
        if (!m[-mapstep-1]) CANNY_PUSH((m-mapstep-1), stack);
        if (!m[-mapstep])   CANNY_PUSH((m-mapstep), stack);
        if (!m[-mapstep+1]) CANNY_PUSH((m-mapstep+1), stack);
        if (!m[-1])         CANNY_PUSH((m-1), stack);
        if (!m[1])          CANNY_PUSH((m+1), stack);
        if (!m[mapstep-1])  CANNY_PUSH((m+mapstep-1), stack);
        if (!m[mapstep])    CANNY_PUSH((m+mapstep), stack);
        if (!m[mapstep+1])  CANNY_PUSH((m+mapstep+1), stack);
    } else {
        /// 处理边界情况
    }
}

上边步骤结束后，由于只在局部进行了 edge track 的操作，边界上可能还会有些问题，因此 opencv 的 canny 算法还增加了一个全局的 track 操作，代码和上方类似，不再赘述。

Final pass

最后的一个步骤就是把 pmap 中标记为 2 的点映射到 255，0 或 1 则映射到 0。代码如下：

// the final pass, form the final image
for (int i = boundaries.start; i < boundaries.end; i++)
{
    int j = 0;
    uchar *pdst = dst.ptr<uchar>(i);
    const uchar *pmap = map.ptr<uchar>(i + 1);
    pmap += 1;
    for (; j < dst.cols; j++)
    {
        pdst[j] = (uchar)-(pmap[j] >> 1);
    }
}

注意到代码中 pmap+1 是因为 pmap 在原图像基础上加上了一个宽度为 1 的边界。
uchar 则表示 uchar 类型的 0，pmap[j] >> 1 后仅当 pmap[j] = 2 时才为 1，因此最后就将 2 映射到了 255(白色), 0/1 映射到了 0(黑色)，即得到了边界提取后的图像。

Morph

morph.dispatch.cpp 类中提供了一个构造形态学操作的核的一个方法，如下:

Mat getStructuringElement(int shape, Size ksize, Point anchor)
{
    int i, j;
    int r = 0, c = 0;
    double inv_r2 = 0;

    anchor = normalizeAnchor(anchor, ksize);
    if( ksize == Size(1,1) )
        shape = MORPH_RECT;
    if( shape == MORPH_ELLIPSE )
    {
        r = ksize.height/2;
        c = ksize.width/2;
        inv_r2 = r ? 1./((double)r*r) : 0;
    }

    Mat elem(ksize, CV_8U);
    for( i = 0; i < ksize.height; i++ )
    {
        uchar* ptr = elem.ptr(i);
        int j1 = 0, j2 = 0;
        /// 形状为矩形或者十字刚好处于横着的那一行时，直接填充一整行
        if( shape == MORPH_RECT || (shape == MORPH_CROSS && i == anchor.y) )
            j2 = ksize.width;
        else if( shape == MORPH_CROSS )
            j1 = anchor.x, j2 = j1 + 1;
        else
        {
            int dy = i - r;
            if( std::abs(dy) <= r )
            {
                /// 计算近似的椭圆的宽度
                int dx = saturate_cast<int>(c*std::sqrt((r*r - dy*dy)*inv_r2));
                j1 = std::max( c - dx, 0 );
                j2 = std::min( c + dx + 1, ksize.width );
            }
        }
        /// 填充 j1 ~ j2 区间内的数字
        for( j = 0; j < j1; j++ )
            ptr[j] = 0;
        for( ; j < j2; j++ )
            ptr[j] = 1;
        for( ; j < ksize.width; j++ )
            ptr[j] = 0;
    }

    return elem;
}

可以看到总共有三种形状的核，分别对应如下:

注意到上图是以中点为中心(Anchor) 的，也可以以其他点为中心的操作(相当于对图像做了偏移)。

另外，各种形态学相关操作最后基本都转化为 erode 和 dilate 操作。几种常见的形态学操作如下(位于 morph.dispatch.cpp 文件中的 morphologyEx 方法中):

switch( op )
{
case MORPH_ERODE: /// 腐蚀操作
    erode( src, dst, kernel, anchor, iterations, borderType, borderValue );
    break;
case MORPH_DILATE: /// 扩张操作
    dilate( src, dst, kernel, anchor, iterations, borderType, borderValue );
    break;
case MORPH_OPEN: /// 开操作
    erode( src, dst, kernel, anchor, iterations, borderType, borderValue );
    dilate( dst, dst, kernel, anchor, iterations, borderType, borderValue );
    break;
case MORPH_CLOSE: /// 闭操作
    dilate( src, dst, kernel, anchor, iterations, borderType, borderValue );
    erode( dst, dst, kernel, anchor, iterations, borderType, borderValue );
    break;
case MORPH_GRADIENT: /// 梯度计算操作
    erode( src, temp, kernel, anchor, iterations, borderType, borderValue );
    dilate( src, dst, kernel, anchor, iterations, borderType, borderValue );
    dst -= temp;
    break;
case MORPH_TOPHAT: /// 顶帽操作
    if( src.data != dst.data )
        temp = dst;
    erode( src, temp, kernel, anchor, iterations, borderType, borderValue );
    dilate( temp, temp, kernel, anchor, iterations, borderType, borderValue );
    dst = src - temp;
    break;
case MORPH_BLACKHAT: /// 黑帽操作
    if( src.data != dst.data )
        temp = dst;
    dilate( src, temp, kernel, anchor, iterations, borderType, borderValue );
    erode( temp, temp, kernel, anchor, iterations, borderType, borderValue );
    dst = temp - src;
    break;
...
}

dilate 和 erode 两个操作统一用到了 morphOp 方法。接着调用到 morph 方法。这个方法中会提供一个空的 cv_hal_morph 方法供用户自行定义 morph 方法的实现。若没有自己定义的实现，则调用 opencv 内置提供的 ocvMorph 方法。和其他滤波器类似，在该方法中，调用了 createMorphologyFilter 得到一个 FilterEngine，最后调用 apply 方法进行计算。最后实际进行图形学滤波运算的是 MorphFilter 这样一个模板类:

template<class Op, class VecOp> struct MorphFilter : BaseFilter
{
    typedef typename Op::rtype T;
    MorphFilter( const Mat& _kernel, Point _anchor ) { ... }

    void operator()(const uchar** src, uchar* dst, int dststep, int count, int width, int cn) CV_OVERRIDE
    {
        ...
        width *= cn;
        /// 遍历每一行
        for( ; count > 0; count--, dst += dststep, src++ )
        {
            ...
            /// 遍历每一列
            for( ; i < width; i++ )
            {
                T s0 = kp[0][i];
                /// 滤波操作
                for( k = 1; k < nz; k++ )
                    s0 = op(s0, kp[k][i]);
                D[i] = s0;
            }
        }
    }
};

对于 erode 和 dilate 两种操作，只需要分别传入 MinOp(返回值更小的那个) 和 MaxOp(返回值更大的那个) 即可。以 erode 为例，传入 MinOp 之后，对于核上每一个为 1 的点，覆盖到图像上的对应位置也必须为 1，否则由于 min 操作的特性，只要有一个是 0 最后的结果就会是 0，这个操作的结果就是，将核中心放在结果图像上任意一个为 1 的点，都能够被原图像包裹，即结果图像是源图像的腐蚀。膨胀则使用最大值，分析类似。

Python extension

opencv 的代码是由 C++ 编写的，但它同时也提供了 python 的库，这是怎么做到的呢？这就是 python 的扩展了。官方文档中提供了一个 Python.h 的库给开发者使用，里面提供了各种各样的用于 C++ 和 python 交互的 api，例如:

PyModule_Create  /// 创建一个 python module
PyModule_AddObject  /// 往 module 中添加一个对象
PyModule_AddIntConstant  /// 往 module 中添加 int 常量
PyModule_AddStringConstant  /// 往 module 中添加一个 string 常量
Py_DECREF /// 回收一个 python 对象
PyObject_Call  /// 调用一个 python 函数并返回结果的指针
...

这样，对于每个需要暴露给 python 的 C++ 方法，只需要创建一个包装方法(包装类)，最后将结果作为一个 python 对象返回即可，类似下面的代码:

static PyObject *
spam_system(PyObject *self, PyObject *args)
{
    const char *command;
    int sts;

    if (!PyArg_ParseTuple(args, "s", &command))
        return NULL;
    sts = system(command);
    return PyLong_FromLong(sts);
}

然后，需要再加入 PyInit_xxx 名字的类，进行 module 的创建工作。编译完成后，启动 python，调用 import 后 python 解释器会找到 PyInit_cv2 这样的名字的函数并调用这个方法，我们就只要在这个方法内部创建 module 以及添加模块内的方法即可。

opencv 中，init 函数位于 python module 下的 cv2.cpp 文件中:

PyObject* PyInit_cv2() {
    import_array(); // from numpy
    PyObject* m = PyModule_Create(&cv2_moduledef);
    if (!init_body(m))
        return NULL;
    return m;
}

nit_body 函数中，依次创建每一个子模块并把函数签名传入。

包装类和包装方法则是由 python 模块下的 gen2.py 和 hdr_parser.py 生成的，在编译期间会自动运行这两个函数以生成转换代码。gen2.py 调用 hdr_parser.py 依次解析每个模块对应的头文件，根据 CV_EXPORTS_W，CV_WRAP 等宏标识某个函数/类是否需要生成中间转换代码。编译生成完毕后，运行期间就由 python 解释器自己查找对应的函数区执行了。

关注苏州程序大白，持续更新技术分享。谢谢大家支持

你可能感兴趣的:(C++,Opencv,计算机视觉,opencv)

C++ 中两个类之间的通信方式 lixzest c++开发语言
C++中两个类之间的通信在C++中，两个类之间可以通过多种方式进行通信。以下是几种常见的方法：1.包含/组合（Composition）一个类包含另一个类的对象作为成员：classClassB{public:voidmethodB(){coutmethodB();}};3.友元类（FriendClass）使用friend关键字允许一个类访问另一个类的私有成员：classClassB{private:
区间DP 石子合并 C++ 小超超爱学习9937 c++开发语言算法数据结构学习
区间DP是一种动态规划的方法，用于解决涉及区间的问题。它通常应用于需要确定区间的最优解或最值的情况下。石子合并问题是一个经典的区间DP问题，可以用区间DP方法解决。给定一行n个石子，每个石子有一个价值，现要将石子合并成若干堆，每次只能选择相邻的两堆进行合并，合并的得分为两堆石子的总价值，合并后的新堆的价值为得分。求合并到最后，最终得到的堆的最大价值。要求解石子合并问题，可以定义一个dp数组，dp[
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码
最近开始炼手写体汉字识别方面的丹，网上找了下数据集，主要有：中科院自动化研究所开源的CASIA数据集（下载链接地址）哈工大开源的HIT-OR3C数据集（下载链接地址）这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别，对于C、C++不是很熟用Python较多的我来说踩了不少的坑（还都是CSDN、知乎、Google都搜不到的巨坑），造福下后来人吧。首先，明确一点，由于博主此次研究
【华为OD机试真题 2025C卷】161、机器人可活动的最大网格点数目 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od 机器人 c++华为OD机试真题 java 机器人可活动的最大网格点数目 c语言
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代码问题
051-OpenCV GrabCut图像分割算法
话不多说，上代码，看结果。importcv2#导入库importnumpyasnp'''cv2.imread(filename,flags)#filename为文件名，图片与.py文件在一个文件夹时输入文件名即可#不在一个文件夹时输入图片的路径和名字#flags为图片的颜色类型，默认为1，灰度图像为0'''img=cv2.imread('89.jpg')mask=np.zeros(img.shap
五大编程竞赛平台终极对比 2401_86601498 c++
LeetCodeLeetCode是一个流行的在线编程平台，提供大量算法和数据结构题目。题目分为简单、中等和困难三个难度级别。LeetCode的题目涵盖各种主题，包括数组、字符串、树、动态规划等。LeetCode支持多种编程语言，包括C++，并提供在线代码编辑器和即时反馈。LeetCode还提供竞赛和面试模拟功能，适合准备技术面试的用户。CodeforcesCodeforces是一个以竞赛为主的在线
opencv常用函数汇总 Sky.Kevin opencv 计算机视觉
一、色彩空间类型转换1、cv2.cvtColordst=cv2.cvtColor(src,code[,dstCn])式中：dst表示输出图像，与原始输入图像具有同样的数据类型和深度。src表示原始输入图像。可以是8位无符号图像、16位无符号图像，或者单精度浮点数等。code是色彩空间转换码，表4-2展示了其枚举值。dstCn是目标图像的通道数。如果参数为默认的0，则通道数自动通过原始输入图像和co
c++ 反射与QMetaObject::invokeMethod介绍
文章目录c++QMetaObject::invokeMethodC++语言标准本身并不直接支持反射机制，这与Java、C#等语言不同，它们在语言层面提供了丰富的反射API。然而，C++是一种非常灵活的语言，可以通过一些设计和编程技巧来实现类似反射的功能。在C++中实现反射通常涉及以下几种技术：动态创建对象：反射可以在运行时创建任意一个已经定义的类的对象实例，即使你在编写代码时并不知道将要创建哪个类
python ffmpeg pipe_如何使用python从ffmpeg输出管道？ weixin_39611725 python ffmpeg pipe
我正在尝试将FFmpeg的输出用管道输送到Python中。我正在从一个视频采集卡读取图像，我成功地使用dshow从命令行将其读入输出文件。我正在尝试从卡抓取图像到我的OpenCv代码，以便能够进一步处理数据。不幸的是，当我通过管道输出图像时，我只得到视频的显示，如链接所示：link:s000.tinyupload.com/?file_id=15940665795196022618.我使用的代码如下
金属表面划痕检测实践指南 - 使用OpenCV IYA1738
本文还有配套的精品资源，点击获取简介：在机器视觉领域，表面划痕检测是一项关键技术，特别是在金属表面。本文深入探索了如何使用OpenCV库在VisualStudio2019环境下进行表面划痕检测。主要技术包括图像作差、动态阈值处理、边缘检测以及形态学操作。通过这些方法，我们可以有效地从金属表面图像中提取划痕特征。本文详细描述了实施表面划痕检测的步骤，包括图像读取、差分图像计算、阈值处理、边缘检测优化
对象的本质：OOP编程核心揭秘止观止计算机科学 OOP 面对对象编程
引言面向对象编程（OOP）革命性地重塑了软件开发，其核心在于“对象”——一种模拟现实实体的计算模型。对象不仅是数据容器，更是封装了状态和行为的自治单元，使程序从指令序列转变为交互网络。通过本解析，我们将层层递进，揭示对象在OOP中的根本角色：从定义延伸到设计实践，帮助读者跨越语言差异（如Java、Python或C++），掌握这一范式的精髓。章节构建遵循技术演进：先解剖对象本质，再关联OOP支柱，最
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
基于Opencv的工业缺陷检测/C++版本 Deeeil opencv c++人工智能
找工作过程中发现要求会C++的工业检测，用一个项目熟悉整个流程#include#include#include//定义一个结构体来存储缺陷信息structDefect{inttype;//缺陷类型，1代表划痕，2代表污渍intx;//缺陷的x坐标inty;//缺陷的y坐标intwidth;//缺陷的宽度intheight;//缺陷的高度//构造函数，初始化缺陷信息Defect(intt,intx,
使用 C++ 和 OpenCV 进行表面划痕检测 whoarethenext c++opencv 开发语言划痕检测
使用C++和OpenCV进行表面划痕检测在工业自动化生产中，产品表面的质量控制至关重要。划痕作为一种常见的表面缺陷，其检测是许多领域（如金属、玻璃、塑料制造）质量保证流程中的一个关键环节。本文将介绍如何使用C++和强大的计算机视觉库OpenCV来实现一个基本的表面划痕检测算法。核心思路划痕通常在图像中表现为具有以下一个或多个特征的区域：高对比度的线性结构：划痕区域的像素强度通常会与其周围背景有明显
校园导游系统（C++）白开水最甜数据结构课程设计校园导航系统
问题总结1、当使用时，该头文件没有定义全局命名空间，必须使用usingnamespacestd，这样才能使用类似于cout这样的C++标识符正确用法：#includeusingnamespacestd;2、对称赋值（注意细节）for(i=1;i注意string第一个字母是小写4、使用迪杰特斯拉算法出现的问题只设置与起始节点v0有弧时前驱设置为v0,否则为-1，而忘记设置起始节点的前驱为-1。以至于
ROS2 视频采集节点实现 ZPC8210 ROS 音视频
一个完整的ROS2视频采集节点的实现，使用OpenCV进行视频捕获并通过ROS2发布图像消息。1.创建功能包首先创建一个新的ROS2功能包（如果还没有）：bashros2pkgcreatevideo_capture--build-typeament_python--dependenciesrclpysensor_msgscv_bridgeopencv-python2.实现视频采集节点在video_
【CMake】使用 CMake 构建 C/C++ 项目的标准流程详解
目录️使用CMake构建C/C++项目的标准流程详解目录1️⃣项目结构约定2️⃣跨平台构建环境准备3️⃣标准构建流程4️⃣构建后目录结构示例Linux/macOSWindows+MinGW5️⃣常用构建操作命令6️⃣跨平台命令对照表7️⃣注意事项与最佳实践8️⃣总结相关文章：️使用CMake构建C/C++项目的标准流程详解目录项目结构约定跨平台构建环境准备标准构建流程构建后目录结构示例常用构建操作
ROS2 通过相机确定物品坐标位置
要实现通过相机确定物品坐标位置，通常需要相机标定、物体检测和坐标转换几个步骤。下面我将提供一个完整的解决方案，包括相机标定、物体检测和3D坐标估计。1.系统架构相机标定-获取相机内参和畸变系数物体检测-使用OpenCV或深度学习模型检测物品坐标转换-将2D图像坐标转换为3D世界坐标ROS2集成-将上述功能集成到ROS2节点中2.实现步骤2.1创建功能包bashros2pkgcreateobject
OpenCV特征点提取算法orb、surf、sift对比点云SLAM 图形图像处理 ORB算法 SIFT算法人工智能计算机视觉算法
下面是OpenCV中三种常用特征点提取算法：ORB、SURF和SIFT的详细对比，从算法原理、性能、使用限制和适用场景多维度进行总结，帮助大家在实际项目中合理选择。一览表：ORBvs.SURFvs.SIFT属性/算法ORBSURFSIFT全称OrientedFASTandRotatedBRIEFSpeededUpRobustFeaturesScale-InvariantFeatureTransfo
2025.06.11华为暑期实习机试真题【最大的矩形新游戏】Java/Python/C++/JS/C 实现 MISAYAONE python 华为 java c++华为暑期实习机试
目录题目思路Code题目小华之前玩过一个游戏，在横轴上放了n个相邻的矩形，每个矩形的宽度是1，而第i(1≤i≤n)个矩形的高度为h[i],这n个短形构成了一个直方图，在直方图中我留能够勾勒出来的矩形的最大面积。这个游戏小华已经玩得很腻了，于是小华就想增加一下难度，现在有1次交换任意2个矩形的操作，请问在交换后，能够勾勒出的最大的短形面积能达到多少呢?输入描述第-行包含一个整数n(2=h的矩形聚集在
C/C++---文件读取 MzKyle C/C++c语言 c++java
在C++中，文件读取操作主要是通过fstream类来完成的。fstream类提供了多种功能，用于从文件读取数据、写入数据以及对文件进行其他处理。文件读取操作可以通过两种主要方式实现：文本文件读取和二进制文件读取。文件读取在传参工作中，扮演十分重要的角色，方便客户端不接触代码的情况下对系统进行调试。1.文件输入流(ifstream)C++提供了ifstream（InputFileStream）类用于
MATLAB 基于图像处理的杂草识别技术鱼弦 matlab 图像处理计算机视觉
MATLAB基于图像处理的杂草识别技术1.系统介绍杂草识别是精准农业中的重要环节，基于图像处理的杂草识别技术利用计算机视觉和机器学习算法，自动识别田间杂草，为精准施药提供决策支持。本系统基于MATLAB实现杂草图像处理，包括图像预处理、特征提取、分类识别等模块。2.应用场景精准农业:自动识别田间杂草，实现精准施药，减少农药使用量。生态监测:监测农田杂草种类和分布，评估生态环境。植物保护:识别有害杂
【C#、C++ 和 Java】实现重力迷宫游戏鱼弦游戏开发 c#c++java 游戏
引言(Introduction)重力迷宫是一种益智游戏，玩家通过旋转整个游戏区域（迷宫），改变重力的方向，使得玩家角色和其他可动物体（如箱子、球）沿着新的重力方向下落。玩家的目标是利用重力到达迷宫的出口。实现重力迷宫需要管理复杂的网格状态（地形和物体），处理旋转输入，并实现根据当前重力方向模拟物理下落的逻辑。技术背景(TechnicalBackground)实现重力迷宫主要涉及以下核心技术概念：游
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
NOIP2013提高组复赛数据详细分析与应用指南欧学东
本文还有配套的精品资源，点击获取简介：2013年的NOIP提高组复赛数据，涉及C++编程、算法设计、数据结构、问题分析、时间空间复杂度优化、调试测试、比赛策略、历年试题分析等多个知识点。这些数据对于参赛者、教练和信息技术教育研究者具有重要参考价值，有助于提升信息技术能力和竞赛准备的有效性。1.NOIP竞赛概览全国青少年信息学奥林匹克竞赛（NationalOlympiadinInformaticsi
Python Gradio：快速搭建人脸识别应用 Python编程之道 Python人工智能与大数据 Python编程之道 python 开发语言 ai
PythonGradio：快速搭建人脸识别应用关键词：Python,Gradio,人脸识别,深度学习,计算机视觉,交互式应用,模型部署摘要：本文详细介绍了如何使用Python的Gradio库快速搭建一个交互式的人脸识别应用。我们将从基础概念出发，逐步讲解人脸识别的核心算法原理、Gradio的界面设计方法，并通过完整的项目实战演示如何将深度学习模型部署为可交互的Web应用。文章包含详细的代码实现、数
【图像处理基石】如何入门大规模三维重建？小米玄戒Andrew 图像处理基石深度学习人工智能三维重建大规模三维重建立体视觉大模型 LLM
入门大规模三维重建需要从基础理论、核心技术到实践工具逐步深入，同时需关注该领域的经典工作和前沿进展。以下是分阶段的入门路径及值得重点学习的工作：一、基础理论与前置知识大规模三维重建的核心是从海量图像或传感器数据中恢复场景的三维结构，涉及计算机视觉、摄影测量、图形学、最优化等多个领域，需先掌握以下基础：数学基础线性代数：矩阵运算、特征值分解（用于相机姿态估计）、奇异值分解（SVD，用于基础矩阵求解）
C++ Primer Plus 第五版：源代码深度解析与实践贫僧法号止尘
本文还有配套的精品资源，点击获取简介：《C++PrimerPlus第五版》通过源代码的实例展示，系统地介绍了C++编程语言的基础和高级特性。本书内容涵盖了基本语法、控制结构、函数、类和对象、封装、继承与多态、模板、异常处理、STL以及输入/输出流等多个关键知识点，帮助读者在理解理论的同时，通过实践加深对这些概念的应用。1.C++基础语法和高级特性介绍C++是一种静态类型、编译式、通用的编程语言，它
【c++】提升用户体验：问答系统的交互优化实践——关于我用AI编写了一个聊天机器人……（12） gfdhy 算法数据结构 c++c语言人工智能 tf-idf
本期依旧使用豆包辅助完成代码。从功能到体验的转变上个版本已经实现了问答系统的核心功能：基于TF-IDF算法的问题匹配和回答。它能够读取训练数据，处理用户输入，并返回最相关的答案。但在用户体验方面还有很大提升空间。让我们看看改进版做了哪些关键优化：1.引导系统上个版本仅在启动时显示简单的"Hello!输入'exit'结束对话。"提示，对于初次使用的用户来说不够友好。改进版增加了：详细的欢迎信息和功能
【C语言】基于 DEV C++的简单扫雷游戏九.九 C 语言游戏 c++游戏算法 c语言编辑器开发语言
目录一、代码二、实训报告三、答辩PPT一、代码这学期C语言大作业选题:基于DEVC++的简单扫雷游戏,以下是devc++适配代码。#define_CRT_SECURE_NO_WARNINGS1#include#include#include#defineROWS9#defineCOLS9#defineMINE_COUNT10voidInitBoard(charboard[][COLS],intro
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>