OliverLYH

车辆检测和车道检测

NKU计算机视觉期末大作业

- 车辆检测和车道检测
  - 软件要求
  - 车辆检测
    - 根据hog特征进行训练
    - 根据haar特征进行训练
    - 最终检测
  - 直线检测

软件要求

opencv3.0+
opencv-contrib
cmake
CLion编译器(可选)
opencv python版本

车辆检测

车辆检测的整体框架是结合hog-svm分类器和haar-cascade分类器对车辆进行检测，之后采用非极大值抑制，得出最终的检测框。

根据hog特征进行训练

方向梯度直方图（Histogram of Oriented Gradient, HOG）特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。HOG特征提取方法就是将一个image（要检测的目标或者扫描窗口）：

1）灰度化（将图像看做一个x,y,z（灰度）的三维图像）；

2）采用Gamma校正法对输入图像进行颜色空间的标准化（归一化）；目的是调节图像的对比度，降低图像局部的阴影和光照变化所造成的影响，同时可以抑制噪音的干扰；

3）计算图像每个像素的梯度（包括大小和方向）；主要是为了捕获轮廓信息，同时进一步弱化光照的干扰。

4）将图像划分成小cells（例如6*6像素/cell）；

5）统计每个cell的梯度直方图（不同梯度的个数），即可形成每个cell的descriptor；

6）将每几个cell组成一个block（例如3*3个cell/block），一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。

7）将图像image内的所有block的HOG特征descriptor串联起来就可以得到该image（你要检测的目标）的HOG特征descriptor了。这个就是最终的可供分类使用的特征向量了。

为了样本的多样性，我采用的是部分数据集一的负样本和数据集二部分正样本和全部负样本作为训练数据。最终正样本与负样本的比例为1:3，一共16000张图片。

正样本大致如下：

负样本大致如下：

因为汽车大致呈现正方形，故对每张图片resize到64x64大小，然后提取hog特征。在这里我选择的相关系数为：

block大小：16x16
window大小：64x64
cell大小：4x4
block步长：x方向为8，y方向为8
window步长：x方向为8，y方向为8

根据如下公式可以算出整个hog特征维度为8100

d i m e n s i o n = 9 * b l o c k x c e l l x * b l o c k y c e l l y * (1 + w i n d o w x - b l o c k x b l o c k s t r i d e x) * (1 + w i n d o w y - b l o c k y b l o c k s t r i d e y)

如果想要采用不同的步长或者块大小，可以在 config.cpp可以修改这些全局变量。

在提取特征之前我们要先将训练集与测试集写到两个txt中方便读取，考虑到c++文件读写以及科学计算方面不是很方便，在这里我采用python对数据集进行的划分处理，利用numpy,cv2,sklearn.model_selection可以较为方便的完成，具体方法在/python_func/BuildImgList.py文件中。

接下来可以提取hog特征，这部分代码在GetFeature.cpp中，引入头文件opencv2/xfeature2d.hpp，我们可以调用提取hog特征的方法：

Mat GetHOGfeature(string imgname){
    Mat img = imread(imgname);
    resize(img, img, Size(Imgheight, Imgwidth));
    Ptr hog = new HOGDescriptor(Size(Window_y, Window_x),
                                               Size(block_y, block_x),
                                               Size(block_stride_y, block_stride_x),
                                               Size(cell_y, cell_x), 9);
    assert(hog->getDescriptorSize() == dimension);
    vector<float> descriptor;
    hog->compute(img, descriptor, Size(Window_stride_y, Window_stride_x), Size(0, 0));
    assert(descriptor.size() == dimension);
    Mat s(descriptor);
    transpose(s, s);
    return s;
}

我们对所有图片提取特征，接下来的步骤便是送进支持向量机中进行训练，这一部分的代码在train.cpp中。在对数据集进行处理时，我把正样本的label标注为1，把负样本的label标注为-1。由于这是一个二分类问题，因此在选择SVM的核类型时，选择线性核即可。为了求出最优的参数，在这里采用opencv的machine learning模块的trainAuto函数(可以自动调节超参数)而非train函数。在调用之前必须要对一些超参数赋予初始值，如下为训练方法：

void HOGSVMtrainAuto(string trainlist){
    Mat Data4Train(0, dimension, CV_32FC1), labels(0, 1, CV_32SC1);
    GetAllImgHOGfeature(Data4Train, labels, trainlist, ImgTrainPath);

    struct timeval pre, after;
    gettimeofday(&pre, NULL);

    Ptr<ml::SVM> model = ml::SVM::create();
    model->setKernel(ml::SVM::KernelTypes::LINEAR);
    model->setType(ml::SVM::C_SVC);
    model->setP(1e-2);
    model->setC(1);
    model->setGamma(1e-2);
    model->setTermCriteria(cvTermCriteria(CV_TERMCRIT_ITER, 10000, 0.000001));

    if(debug){
        cout << "height: "<<Data4Train.rows << ", width: " << Data4Train.cols << endl;
        cout << "trainingdata depth: " << Data4Train.depth() << endl;
        cout << "label depth: " << labels.depth() << endl;
        cout << "trainingdata type " << Data4Train.type() << endl;
        cout << "label type " << labels.type() << endl;
    }

    assert(Data4Train.type() == CV_32FC1);
    assert(labels.type() == CV_32SC1);

    Ptr<ml::TrainData> data = ml::TrainData::create(Data4Train, ml::ROW_SAMPLE, labels);
    cout << "start training ..." << endl;
    model->trainAuto(data, 10);
    cout << "finish training ..." << endl;
    gettimeofday(&after, NULL);
    cout << "training time: " << after.tv_sec - pre.tv_sec << "s"<< endl;
    model->save("../model/svm_hog_classifier.xml");
    cout << "model saving fininshed ..." << endl;
}

训练大概花费20~30分钟，训练完成后会生成xml文件，即训练好的模型，在测试集上测试，准确率可以达到98%，仅从测试集上看，效果还是不错的。

根据haar特征进行训练

Haar-like特征点，是一种简单的特征描述，其理论相当容易理解，就是按照下图的模式来计算白色窗口的像素总和和黑色窗口像素总和的差，如下图：

利用提取到的haar特征可以训练弱分类器，通过若干个弱分类器可以组建一个强分类器，类似于一种投票的手段，只不过不同的分类器具有不同的权重，整个训练过程可以看做是一个不断调整权重大小的过程，如下：

接下来便是级联，如下图，最终的分类器是由多个强分类器级联而成。当且仅当通过了所有分类器的判定后才能输出结果。

仅仅参考图像的hog特征可能会存在漏检测。由此，我将人脸识别中常见的级联器检测方法迁移到车辆检测中，参考博文一、博文二和opencv官方文档。以数据集一的全部正样本和负样本为数据源，正负样本比大概为1:3。首先制作两个标准格式的txt文件，一个是正样本txt，另一个时负样本txt。正样本txt格式大致如下(路径图片中目标个数 xmin ymin xmax ymax)：

../../../data/ProData3/17622107.jpg 1 0 0 38 38
../../../data/ProData3/112237754.BMP 1 0 0 128 96
../../../data/ProData3/12130486.BMP 1 0 0 128 96
...

负样本txt只需要图片路径即可，如下：

../../../data/ProData4/174157305.jpg
../../../data/ProData4/18635891.jpg
../../../data/ProData4/1356388.jpg
...

为了方便我用python制作了该txt文件，具体方法在/adaboost/Gen_Imglist.py中。

opencv提供了opencv_createsamples.exe建立训练所需要的参数列表，在命令行中调用该exe，输入如下命令：

opencv_createsamples -vec pos.vec -info pos_info.dat -bg neg_info.dat -num 2000 -w 24 -b 24

根据上图的解释可知：-vec为最终生成的文件，-num为要产生的正样本的数量，-w为输出的样本高度，-h为输出的样本宽度。

接下来利用opencv提供的opencv_traincascade.exe进行训练，在命令行中调用该exe，输入如下命令：

opencv_traincascade -data ../model/adaboost -vec pos.vec -bg neg_info.dat -numPos 2000 -numNeg 7000

根据上图的解释可知：在训练过程中所有中间模型都会放在model/adaboost这个文件夹里，这里采用2000个正样本和7000个负样本。

级联器的训练很慢，大概训练了一天左右，在模型文件夹中存放着每一级的弱分类器和最终的分类器。

最终检测

结合训练好的hog-svm分类器和haar-cascade分类器。便可以检测出物体。大致pipline如下：

对图像进行缩放，resize到448x448
我们以64x64的滑动窗口在图像上滑动，用hog-svm分类器和haar-cascade分类器检测
滑动窗口以一定比例放大，对图像进行多尺度检测，避免漏检较大的车辆
对所有结果进行非极大值抑制，得出最终检测结果

部分检测代码如下：

void FinalDetect(string filename, string model_cascade, string model_hog, int dataset = 1, bool IsLine = false) {
    setUseOptimized(true);
    setNumThreads(8);

    HOGDescriptor my_hog(Size(Window_y, Window_x), Size(block_y, block_x), Size(block_stride_y, block_stride_x),
                         Size(cell_y, cell_x), 9);
    CascadeClassifier car_classifier;
    car_classifier.load(model_cascade);
    //get support vector from model
    Ptr model = ml::StatModel::load(model_hog);
    Mat sv = model->getSupportVectors();
    vector<float> hog_detector;
    const int sv_total = sv.cols;
    Mat alpha, svidx;
    double rho = model->getDecisionFunction(0, alpha, svidx);
    Mat alpha2;
    alpha.convertTo(alpha2, CV_32FC1);
    Mat result(1, sv_total, CV_32FC1);
    result = alpha2 * sv;
    for (int i = 0; i < sv_total; ++i)
        hog_detector.push_back(-1 * result.at<float>(0, i));
    hog_detector.push_back((float) rho);
    //load vector to hog detector
    my_hog.setSVMDetector(hog_detector);

    vector detections;
    vector<double> foundWeights;
    vector<int> rejLevel;
    vector dets;
    vector keep;
    VideoCapture cap;
    cap.open(filename);
    while (true) {
        Mat img;
        cap >> img;
        if (!img.data)
            break;
        resize(img, img, Size(448, 448));
        cout << img.size() << endl;
        if (IsLine)
            LineDetect2(img, dataset);

        detections.clear();
        foundWeights.clear();
        rejLevel.clear();
        dets.clear();
        keep.clear();

        my_hog.detectMultiScale(img, detections, foundWeights, 0, Size(8, 8), Size(), 1.1, 2., true);
        cout << "hog detect object: " << detections.size() << endl;
        for (size_t i = 0; i < detections.size(); i++) {
            if (foundWeights[i] > 1.3) {
                bbox_info tmp_bbox(detections[i].x, detections[i].y, detections[i].br().x, detections[i].br().y,
                                   foundWeights[i]);
                dets.push_back(tmp_bbox);
            }
        }

        car_classifier.detectMultiScale(img, detections, rejLevel, foundWeights, 1.1, 3, 0, Size(), Size(), true);
        cout << "cascade detect object: " << detections.size() << endl;
        for (int i = 0; i < detections.size(); i++) {
            if (rejLevel[i] < 20 || foundWeights[i] < 1.)
                continue;
            bbox_info tmp(detections[i].x, detections[i].y, detections[i].br().x, detections[i].br().y,
                          foundWeights[i]);
            dets.push_back(tmp);
        }

        keep = nms(dets);
        for (size_t i = 0; i < keep.size(); i++) {
            Point p1(keep[i].xmin, keep[i].ymin), p2(keep[i].xmax, keep[i].ymax);
            Scalar color(0, 255, 0);
            rectangle(img, p1, p2, color, 2);
        }
        imshow("detect", img);
        waitKey(0);

    }
}

部分结果如下：

直线检测

参考博文3，博文4，博文5，对于车道检测，主要采用如下的pipline:

对图像进行透视变换，使其变为鸟瞰图：

Point2f origin[] = {Point2f(204, 286), Point2f(71, 448), Point2f(394, 448), Point2f(243, 286)};
        Point2f dst[] = {Point2f(112, 0), Point2f(112, 448), Point2f(336, 448), Point2f(336, 0)};
        trans = getPerspectiveTransform(origin, dst);
        warpPerspective(img_o ,img, trans, img.size());

对原图像进行x-sobel滤波，并进行阈值过滤

void mag_threshold(const Mat img, Mat &out, int sobel_kernel, int min_thres, int max_thres) {

    cvtColor(img, out, CV_BGR2GRAY);
    Sobel(out, out, CV_8UC1, 1, 0, sobel_kernel);
    normalize(out, out, 0, 255, NORM_MINMAX);
    threshold(out, out, min_thres, 0, THRESH_TOZERO);
    threshold(out, out, max_thres, 255, THRESH_BINARY);
}

对原图像转换到HLS空间，保留黄色和白色(车道多为黄色和白色)

void yellow_white_threshold(Mat origin, Mat &out1) {
    int y_lower[] = {10, 0, 100};
    int y_upper[] = {40, 255, 255};
    int w_lower[] = {0, 200, 0};
    int w_upper[] = {180, 255, 255};
    Mat HLS, y_mask, w_mask, mask;
    cvtColor(origin, HLS, CV_BGR2HLS);

    vector<int> yellow_lower(y_lower, y_lower + 3);
    vector<int> yellow_upper(y_upper, y_upper + 3);
    vector<int> white_lower(w_lower, w_lower + 3);
    vector<int> white_upper(w_upper, w_upper + 3);
    inRange(HLS, yellow_lower, yellow_upper, y_mask);
    inRange(HLS, white_lower, white_upper, w_mask);

    bitwise_or(y_mask, w_mask, mask);
    bitwise_and(origin, origin, out1, mask);
    cvtColor(out1, out1, CV_HLS2BGR);
    cvtColor(out1, out1, CV_BGR2GRAY);
    threshold(out1, out1, 130, 255, THRESH_BINARY);
}

根据2,3步得到最终的二值图

利用霍夫变换找出相应的直线端点(根据直线斜率进行一定的限制)

    vector lines;
    vector leftlines;
    vector rightlines;
    HoughLinesP(out1, lines, 1, CV_PI / 180, 50, 30, 10);
    cout << lines.size() << endl;
    for (size_t i = 0; i < lines.size(); i++) {
        //abandon horizontal line.
        if (lines[i][1] == lines[i][3])
            continue;
        //get left lines
        if (lines[i][0] <= 224 && lines[i][2] <=224){
            float k = 1.5;
            //if not verticle line
            if (lines[i][0] != lines[i][2])
                k = fabs(float(lines[i][3]-lines[i][1])/float(lines[i][2]-lines[i][0]));
            if (k>=1.5) {
                leftlines.push_back(Point2f(lines[i][0], lines[i][1]));
                leftlines.push_back(Point2f(lines[i][2], lines[i][3]));
            }

        }

对这些点进行线性回归

    Vec4f line_left, line_right;
    fitLine(leftlines, line_left, DIST_L1, 0, 0.01, 0.01);
    fitLine(rightlines, line_right, DIST_L1, 0, 0.01, 0.01);

画出直线围成的区域，并进行高亮，显示到原图上

整个流程图如下：

源代码详见：我的github

手机零部件三维光学测量解决方案 yy229382036 人工智能 3d 光学成像算法
在移动互联网时代，智能终端深受市场追捧，而智能手机占据了第一大移动智能终端的地位。市场的火热造就了手机厂商白热化的竞争，继CPU、屏幕、摄像头等硬件配置大战之后，以外观、设计、质量为切入点的设计及功能竞争，也日趋激烈。在手机设计、质量检测中，无论是手机中框还是屏幕，利用三维光学测量技术，有助于优化从原型和模具构建、首件检验报告到装配分析等环节的质量控制，并有效节省检测时间，快速推进新产品上市。另外
微软开源神器OmniParser V2.0 介绍魔王阿卡纳兹开源项目观察大模型知识札记 microsoft OmniParser 开源项目
微软开源的OmniParserV2.0是一款基于纯视觉技术的GUI智能体解析工具，旨在将用户界面（UI）截图转换为结构化数据，从而实现对计算机屏幕上的可交互元素的高效识别和操控。这一工具通过结合先进的视觉解析技术和大型语言模型（LLM），显著提升了AI智能体在复杂环境下的识别能力和操作效率。核心功能与特点高精度识别：OmniParserV2.0在检测小尺寸可交互UI元素时的准确率显著提升，达到了3
功能强大的电脑硬件检测及驱动安装工具开开心心就好 pdf tcp/ip macos 网络协议 android python django
今天给大家带来一款超实用的电脑硬件检测软件——入梦工具箱。它是开源的，全程无广告干扰，使用起来清爽又安心。打开入梦工具箱，进入“硬件信息”选项，电脑各个配件的详细参数一目了然。无论是CPU的型号、频率，还是显卡、内存等硬件的具体规格，都能轻松获取，让你对电脑的“内部构造”了如指掌。入梦工具箱功能十分丰富，内含80多款实用工具。以CPU工具为例，无需安装，点击任意一款就能直接使用，快速满足你的相关需
自动驾驶中控制模块状态机的作用与设计方法程序员龙一自动驾驶自动驾驶状态机 control
问题解答：一、车辆状态机在自动驾驶控制模块中的核心作用在自动驾驶系统中，状态机（StateMachine）是控制模块的核心逻辑框架，用于管理车辆在不同运行阶段的行为和状态切换。其核心优势体现在以下几个方面：1.系统行为的模块化与可维护性模块化分层管理：状态机将复杂的车辆行为（如启动、停车、紧急避障、车道保持等）分解为独立的状态模块。每个状态专注于单一功能（例如“车道保持”状态仅处理横向控制），降低
基于STM32蓝牙智能温控风扇系统设计与实现（代码+原理图+PCB+蓝牙APP）科创工作室li 毕业设计1 stm32 智能家居嵌入式硬件单片机物联网
STM32蓝牙智能温控风扇系统设计与实现资料齐全:源代码，原理图，PCB和机智云相关教程，参考lun文等！摘要：本文设计并实现了一种基于STM32F103C8T6单片机的蓝牙智能温控风扇系统。该系统具备OLED显示、自动/手动模式切换、温湿度检测、风扇档位调节、人体红外检测、倒计时以及蓝牙APP远程控制等功能。通过集成多种传感器和执行器，系统能够根据当前温湿度变化自动控制风扇转动，同时支持手机AP
python的try和except_Python 异常处理(Try...Except) weixin_40001309
版权所有，未经许可，禁止转载try块让你可以检测代码块中的错误。except块让你可以处理错误。finally块让你可以执行最终代码，不管try与except块的结果如何，finally块的代码都将执行。异常处理当错误(或者异常)发生时，Python通常会停止执行，并报错。这些异常可以使用try/except语句处理：示例下面try块会产生异常，因为x没有定义:try:print(x)except
基于STM32单片机的人脸识别电子密码锁RFID刷卡门禁锁设计+红外避障检测人流量液晶显示设计DIY25-147 通旺科技单片机 stm32 嵌入式硬件
STM32单片机+红外人流量统计+人脸识别(管理)+RFID刷卡+密码可设+TFT屏+舵机+蜂鸣器+矩阵按键本系统由STM32F103C8T6单片机核心板、1.44寸TFT彩屏、红外避障传感器、人脸识别模块、RFID射频卡读写模块、舵机驱动电路、蜂鸣器报警电路、矩阵按键电路及电源组成。【1】设备识别到已录入的人脸信息、已录入的RFID卡号信息、输入密码正确，则进行舵机控制，打开门禁；同时液晶能够显
高亮动态物体——前景提取与动态物体检测器（opencv实现） WenJGo AI学习之路 Python之路 opencv 计算机视觉人工智能深度学习神经网络
目录代码说明1.导入库2.创建背景建模对象3.打开视频源4.逐帧处理视频5.应用背景建模获得前景掩码6.形态学操作去除噪声6.1定义形态学核6.2开运算去除噪点6.3膨胀操作填补前景区域空洞7.轮廓检测识别动态物体8.绘制轮廓和边界框9.显示处理结果10.退出控制与资源释放整体代码效果展示代码说明主要功能是通过背景建模检测视频中的运动目标。其工作流程如下：读取视频帧；利用MOG2算法生成前景掩码；
RAG 在多模态数据处理中的应用探索：结合图像与文本生成 hy098543 AIGC
目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型训练应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展，数据呈现出多模态的特性，即包含文本、图像、音频、视频等多种形式。在自然语言处理（NLP）和计算机视觉（CV
Port xxxxx is in use by another program. Either identify and stop that program, or start the server 李卓璐报错整理服务器运维
端口被占用问题如何解决：1.安装netstatapt-getinstallnet-tools2.检测端口占用netstat-npl|grep"端口"3.根据PID杀死该进程kill-9xxxxx
F12抓包用于做postman接口测试的全过程解析自动化测试君软件测试自动化测试接口测试 postman 测试工具软件测试经验分享职场和发展
一、为什么抓包从功能测试角度通过抓包查看隐藏字段Web表单中会有很多隐藏的字段，这些隐藏字段一般都有一些特殊的用途，比如收集用户的数据，预防CRSF攻击，防网络爬虫，以及一些其他用途。这些隐藏字段在界面上都看不到，如果想检测这些字段，就必须要使用抓包工具。通过抓包工具了解协议内容方便开展接口和性能测试性能测试方面，性能测试其实就是大量模拟用户的请求，所以我们必须要知道请求中的协议内容和特点，才能更
28.Vulmap：Web 漏洞扫描与验证工具白帽少女安琪拉安全工具网络安全网络
一、项目介绍Vulmap是一款功能强大的Web漏洞扫描和验证工具，专注于对Web容器、Web服务器、Web中间件及CMS等Web程序的漏洞检测与利用。其集成了漏洞扫描（PoC）和漏洞利用（Exp）两种模式，帮助安全人员快速发现并验证目标系统的安全漏洞，适用于渗透测试、漏洞挖掘及安全评估等场景。1.1核心功能漏洞扫描（PoC模式）：支持对多种Web程序（如Tomcat、WebLogic、Shiro、
flutter 专题九十三 Flutter开发之基础Widgets leluckys Flutter面试与实战 flutter javascript 命令模式
Widgets概念Flutter里有一个非常重要的核心理念：一切皆为组件，Flutter的所有元素都是由控件构成的。与原生开发中控件所代表的含义不同，Flutter中widget的概念更加广泛，它不仅可以表示UI元素，也可以表示一些功能性的组件，如用于手势检测的GestureDetectorwidget、用于应用主题数据传递的Theme等等。而原生开发中的控件通常只是指UI元素。由于Flutter
被单方面删除VX？这款工具帮你一键检测！学术裁缝李师傅微信开源软件软件分享
还在为"红色感叹号"深夜emo？教你一招神不知鬼不觉揪出单删好友！今天实测这款GitHub开源神器WechatRealFriends，电脑端免安装直接运行，检测6000+好友只要喝杯奶茶的时间！软件介绍软件名字“WechatRealFriends”，软件是绿色版，双击exe即可打开软件。▶️三大核心优势✅开源免费无广告|GitHub万人星标项目✅极速扫描不打扰|15分钟扫完7000好友✅双维度精准
毕业论文需要进行几次AIGC检测？ kexiaoya2013 人工智能 AIGC 论文阅读论文笔记
每到毕业季，许多同学都会面临论文查重的困扰。尤其是今年Deepseek的爆火，学校对论文AIGC检测也越来越严格。那么，毕业论文AIGC检测究竟需要做几次呢？一、检测次数受哪些因素影响1、学校政策部分高校提供1-2次免费检测机会，有的则要求自己检测合格后才能提交。检测前，务必提前了解所在院校的检测规则。若学校未明确，建议至少自查2次（初稿+定稿）。2、AI率波动如果首次AI率检测结果超过或接近学校
3D-AFFORDANCELLM: HARNESSING LARGE LANGUAGE MODELS FOR OPEN-VOCABULARY AFFORDANCE DETECTION UnknownBody LLM Daily 3d 语言模型人工智能
摘要3D可及性检测是一个具有挑战性的问题，在各种机器人任务中有着广泛的应用。现有方法通常将检测范式制定为基于标签的语义分割任务。这种范式依赖于预定义的标签，缺乏理解复杂自然语言的能力，导致在开放世界场景中的泛化能力有限。为了解决这些限制，我们将传统的可及性检测范式重新定义为指令推理可及性分割（IRAS）任务。该任务旨在根据查询推理文本输出可及性掩码区域，避免了输入标签的固定类别。相应地，我们提出了
VLLM专题（三十五）—多模态数据处理 AI专题精讲大模型专题系列人工智能
为了在vLLM中实现各种优化，例如分块预填充和前缀缓存，我们使用BaseMultiModalProcessor来提供占位符特征标记（例如）与多模态输入（例如原始输入图像）之间的对应关系，基于HF处理器的输出。以下是BaseMultiModalProcessor的主要特性：提示更新检测HF处理器的主要职责之一是使用占位符标记更新提示。例如：在字符串的开头插入特征占位符标记（例如…，其数量等于特征大小
【保姆级视频教程（一）】YOLOv12环境配置：从零到一，手把手保姆级教程！| 小白也能轻松玩转目标检测！一只云卷云舒 YOLOv12保姆级通关教程 YOLO YOLOv12 flash attention GPU 计算能力算力
【2025全站首发】YOLOv12环境配置：从零到一，手把手保姆级教程！|小白也能轻松玩转目标检测！文章目录1.FlashAttentionWindows端WHL包下载1.1简介1.2下载链接1.3国内镜像站1.4安装方法2.NVIDIAGPU计算能力概述2.1简介2.2计算能力版本与GPU型号对照表2.2.1CUDA-EnabledDatacenterProducts2.2.2CUDA-Enab
yolov8的第一次实验报告算法宇宙 YOLO 人工智能计算机视觉
1.实验概述实验名称:占道经营目标检测模型实验目标:提高模型的精确率（Precision）和召回率（Recall），使其接近1。实验日期:[2025-01-16]2.数据集数据集名称:[datasets]数据集大小:[2.68Gb]数据集描述:[数据集主要分两个类别：zdjy_ld,zdjy_gd]注释：占道经营流动，占道经营固定3.模型配置3.1基础配置·模型类型:YOLOv8·预训练模型:YO
C#学习笔记（3）：调用YOLOv8 playerofIE c#学习笔记 YOLO python
最近做的项目需要C#编写上位机程序，同时也要使用yolo进行深度学习检测。使用pythonnet调用写好的py文件，C#代码如下:Runtime.PythonDLL="python310.dll";PythonEngine.Initialize();using(Py.GIL()){dynamicsys=Py.Import("sys");dynamictorch=Py.Import("torch")
YOLOv8 的简介及C#中如何简单应用YOLOv8 码上有潜 YOLOv8 YOLO
YOLOv8是YOLO（YouOnlyLookOnce）系列中的最新版本，是一种用于目标检测和图像分割的深度学习模型。YOLO模型以其快速和准确的目标检测性能而著称，广泛应用于实时应用程序中。主要特点高效性：YOLOv8在保持高检测速度的同时，进一步提高了检测精度。端到端训练：可以直接从图像输入端到分类结果输出，简化了训练和部署过程。改进的架构：包括更深的网络结构、更复杂的特征提取方法以及更高效的
EDAS：投稿经验-word版本-问题解决 weixin_41724971 学习总结 Latex写作经验总结 SCI科研写作方法总结 word
1.字体不对，字体未嵌入问题问题：word转PDF后，总是显示有字体格式不对（忘记截图了）。办法：1.EDAS投稿PDF格式问题-CSDN博客-PDF上修改+IEEE论文检测的字体未嵌入问题TimesNewRoman,Bold,TimesNewRoman,Italicisnotembedded解决方法_打开其他人的word显示文字未嵌入-CSDN博客（必须有会员，说实话我没弄出来。如有需要这俩结合
BioDeepAV：一个多模态基准数据集，包含超过1600个深度伪造视频，用于评估深度伪造检测器在面对未知生成器时的性能。数据集
2024-11-29,由罗马尼亚布加勒斯特大学创建BioDeepAV数据集，它专门设计来评估最先进的深度伪造检测器在面对未见过的深度伪造生成器时的泛化能力，这对于提高检测器的鲁棒性和适应性具有重要意义。一、研究背景：随着生成模型的快速发展，深度伪造内容的逼真度不断提高，人们越来越难以在线检测出被操纵的媒体内容，从而容易受到各种诈骗的欺骗。这不仅对个人隐私构成威胁，也对社会信任和民主构成挑战。目前遇
Yolov11目标检测(ultralytics) @M_J_Y@ 目标检测 YOLO 目标检测人工智能
Yolov11目标检测（ultralytics）1.克隆仓库2.安装环境依赖3.训练、验证、推理以及onnx模型导出1.克隆仓库从官网下载Yolov11到本地。[email protected]:ultralytics/ultralytics.git2.安装环境依赖pipinstall-e.-ihttps://pypi.mirrors.ustc.edu.cn/simple/3.训练、验证
以下功能模块助力企业实现流程智能化、降本增效：牛油果爱编程云计算开源软件开源
1⃣‌智能流程设计器‌‌拖拽式建模‌：可视化搭建流程节点，支持条件分支、并行任务等复杂逻辑。‌AI辅助优化‌：自动检测流程瓶颈，推荐优化路径（2024版新增AI引擎）。‌模板库‌：预置财务审批、采购管理等行业模板，开箱即用。2⃣‌自动化触发与执行‌‌事件驱动‌：支持数据库变更、API调用、表单提交等触发条件。‌机器人流程自动化（RPA）‌：无缝集成外部系统操作（如自动填表、数据抓取）。‌动态分配规
OpenCV多分辨率模板匹配与容错优化实战指南追寻向上 opencv 人工智能计算机视觉
第一章：问题背景与挑战1.1传统模板匹配的局限性模板匹配（TemplateMatching）是计算机视觉中基础且广泛使用的技术，其核心思想是通过滑动窗口在目标图像中寻找与模板最相似的位置。然而，传统方法（如OpenCV的cv2.matchTemplate）在实际应用中存在以下问题：尺寸敏感性当目标的实际尺寸与模板不一致时，匹配结果会严重偏离。例如，在工业检测中，摄像头与物体的距离变化会导致目标缩放
AI API：快速集成智能化功能的开发利器桂花饼 AIGC AI API 人工智能 AIGC 语言模型 AI作画
AIAPI（ArtificialIntelligenceApplicationProgrammingInterface，人工智能应用程序接口）是应用程序接口的一种，专门用于提供人工智能相关功能的开发接口。它允许开发者利用现有的AI模型、工具或服务，将这些功能集成到自己的应用程序中，并为用户带来智能化的体验。AIAPI的核心功能主要与AI技术相关，比如自然语言处理（NLP）、计算机视觉、语音处理、机
使用 labelImg 制作YOLO系列目标检测数据集（ 2401_89791028 YOLO 目标检测人工智能
文章转载自K同学，谨防原文失效可参考link1和link2和link3LabelImg介绍LabelImg支持文件夹的导入，在标完一张后，在左侧选择NextImage就可以切换到下一张继续了。输出格式部分，目前LabelImg支持YOLO和PascalVOC2种格式，前者标签文件后缀是.txt件，而后者标签文件后缀是.xml件。标签保存在对应的labels文件夹下，与images中的图片文件名一一
第1章：家庭电费直降40%：DeepSeek让冰箱学会“偷电“的合法攻略 m0_65737849 运维
第1章：家庭电费直降40%：DeepSeek让冰箱学会"偷电"的合法攻略——前电网调度工程师的四年零事故实践方案1.1藏在压缩机里的消费陷阱打开中国家庭的电费单，冰箱的耗电量永远在“看不见的第三位”：国网能源研究院2024年报告显示，1级能效双开门冰箱年均耗电438度，相当于每天悄悄消耗1.2元。更惊人的是，其中62%的电力浪费发生在夜间——当保鲜室传感器检测到温度回升0.5℃时，压缩机会以2.3
SMT贴片加工厂厂房承重能力要求贴片机 smt
SMT贴片加工厂厂房承重能力要求SMT贴片加工大部分都是重型设备，尤其是贴片机、回流焊等设备，有些重达几顿、十几吨，因此厂房承重必须符合规范，如果厂房承重差，极有可能造成坍塌，并且SMT产线都是整线设备摆放，对厂房局部承重压力大，因此厂房承重能力是SMT贴片厂必须认真审视的问题，下面英特丽为大家介绍厂房承重能力的要求。厂房承重能力决定能够摆放多少SMT设备，事先必须经过厂房承重检测机构进行检测鉴定
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

车辆检测和车道检测