翟雷雷

检测跟踪推理

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

#include 
#include 
#include 


#include "BYTETracker.h"
#include "scrfd.h"
#include "mtcnn.h"
//近似的仿射变换
cv::Mat getsrc_roi(std::vector x0, std::vector dst)
{
    int size = dst.size();
    cv::Mat A = cv::Mat::zeros(size * 2, 4, CV_32FC1);
    cv::Mat B = cv::Mat::zeros(size * 2, 1, CV_32FC1);

    //[ x1 -y1 1 0] [a]       [x_1]
    //[ y1  x1 0 1] [b]   =   [y_1]
    //[ x2 -y2 1 0] [c]       [x_2]
    //[ y2  x2 0 1] [d]       [y_2]	

    for (int i = 0; i < size; i++)
    {
        A.at(i << 1, 0) = x0[i].x;// roi_dst[i].x;
        A.at(i << 1, 1) = -x0[i].y;
        A.at(i << 1, 2) = 1;
        A.at(i << 1, 3) = 0;
        A.at(i << 1 | 1, 0) = x0[i].y;
        A.at(i << 1 | 1, 1) = x0[i].x;
        A.at(i << 1 | 1, 2) = 0;
        A.at(i << 1 | 1, 3) = 1;

        B.at(i << 1) = dst[i].x;
        B.at(i << 1 | 1) = dst[i].y;
    }

    cv::Mat roi = cv::Mat::zeros(2, 3, A.type());
    cv::Mat AT = A.t();
    cv::Mat ATA = A.t() * A;
    cv::Mat R = ATA.inv() * AT * B;

    //roi = [a -b c;b a d ];

    roi.at(0, 0) = R.at(0, 0);
    roi.at(0, 1) = -R.at(1, 0);
    roi.at(0, 2) = R.at(2, 0);
    roi.at(1, 0) = R.at(1, 0);
    roi.at(1, 1) = R.at(0, 0);
    roi.at(1, 2) = R.at(3, 0);
    return roi;

}

//人脸对齐
cv::Mat faceAlign(cv::Mat& imageAlign, Bbox& finalBboxAlign)
{
    double dst_landmark[10] = {
        38.2946, 73.5318, 55.0252, 41.5493, 70.7299,
        51.6963, 51.5014, 71.7366, 92.3655, 92.2041 };
    vectorcoord5points;
    vectorfacePointsByMtcnn;
    for (int i = 0; i < 5; i++) {
        coord5points.push_back(cv::Point2f(dst_landmark[i], dst_landmark[i + 5]));
    }

    for (int j = 0; j < 5; j = j + 1)
    {
        //cv::circle(image, cvPoint(finalBbox[i].ppoint[j], finalBbox[i].ppoint[j + 5]), 2, CV_RGB(0, 255, 0), CV_FILLED);
        facePointsByMtcnn.push_back(cv::Point(finalBboxAlign.ppoint[j], finalBboxAlign.ppoint[j + 5]));
    }

    cv::Mat warp_mat = cv::estimateAffinePartial2D(facePointsByMtcnn, coord5points);
    if (warp_mat.empty()) {
        warp_mat = getsrc_roi(facePointsByMtcnn, coord5points);
    }
    warp_mat.convertTo(warp_mat, CV_32FC1);
    cv::Mat alignFace = cv::Mat::zeros(112, 112, imageAlign.type());
    warpAffine(imageAlign, alignFace, warp_mat, alignFace.size());
    return alignFace;
}



float* getFeatByMobileFaceNetNCNN(ncnn::Extractor ex, cv::Mat img)
{
    //cout << "getFeatByMobileFaceNetNCNN" << endl;
    float* feat = new float[128];
    ncnn::Mat in = ncnn::Mat::from_pixels_resize(img.data, ncnn::Mat::PIXEL_BGR, img.cols, img.rows, 112, 112);
    ex.input("data", in);
    ncnn::Mat out;
    ex.extract("fc1", out);

    for (int j = 0; j < out.w; j++)
    {
        feat[j] = out[j];
    }
    return feat;
}


//正方形化
static cv::Rect SquarePadding(cv::Rect facebox, int margin_rows, int margin_cols, bool max_b)
{
    int c_x = facebox.x + facebox.width / 2;
    int c_y = facebox.y + facebox.height / 2;
    int large = 0;
    if (max_b)
        large = (std::max)(facebox.height, facebox.width) / 2;
    else
        large = (std::min)(facebox.height, facebox.width) / 2;
    cv::Rect rectNot(c_x - large, c_y - large, c_x + large, c_y + large);
    rectNot.x = (std::max)(0, rectNot.x);
    rectNot.y = (std::max)(0, rectNot.y);
    rectNot.height = (std::min)(rectNot.height, margin_rows - 1);
    rectNot.width = (std::min)(rectNot.width, margin_cols - 1);
    if (rectNot.height - rectNot.y != rectNot.width - rectNot.x)
        return SquarePadding(cv::Rect(rectNot.x, rectNot.y, rectNot.width - rectNot.x, rectNot.height - rectNot.y), margin_rows, margin_cols, false);

    return cv::Rect(rectNot.x, rectNot.y, rectNot.width - rectNot.x, rectNot.height - rectNot.y);
}

void processImage(const std::string& imagePath, cv::VideoWriter& videoWriter, const cv::Size& targetSize) {
    cv::Mat image = cv::imread(imagePath);

    // 调整图片大小
    cv::resize(image, image, targetSize);

    videoWriter.write(image);
}

//读取文件夹下的图片合并成视频
void processFolder(const std::string& folderPath, cv::VideoWriter& videoWriter, const cv::Size& targetSize) {
    cv::String pattern = folderPath + "/*.jpg"; // 匹配 JPG 格式的图片
    std::vector imagePaths;
    cv::glob(pattern, imagePaths);

    for (const auto& imagePath : imagePaths) {
        processImage(imagePath, videoWriter, targetSize);
    }
}

//读取文件夹下的所有子文件夹路径
void getDirectoryNames(const std::string& folderPath, std::vector& directoryNames)
{
    std::string searchPattern = folderPath + "\\*";

    WIN32_FIND_DATAA findData;
    HANDLE hFind = FindFirstFileA(searchPattern.c_str(), &findData);

    if (hFind != INVALID_HANDLE_VALUE)
    {
        do
        {
            std::string entryName = findData.cFileName;

            if ((findData.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY) && entryName != "." && entryName != "..")
            {
                directoryNames.push_back(folderPath + "/" + entryName);
            }
        } while (FindNextFileA(hFind, &findData));

        FindClose(hFind);
    }
}


struct Object_Label {    
    double o_x, o_y;  // 中心坐标
    double o_width, o_height;  // 长宽
    int name;
};

std::vector ReadObjectsFromTxt(const std::wstring& filePath)
{
    std::wifstream inputFile(filePath);

    if (!inputFile)
    {
        std::wcerr << L"Failed to open input file: " << filePath << std::endl;
        return {};
    }

    std::vector objects;
    std::wstring line;
    while (std::getline(inputFile, line))
    {
        Object_Label obj;
        std::wstringstream ss(line);
        std::wstring token;

        // Parse the line using comma as the delimiter
        std::getline(ss, token, L',');

        double picname = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');

        obj.o_x = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');
        obj.o_y = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');
        obj.o_width = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');
        obj.o_height = std::stod(token.substr(token.find(L',') + 1));

        objects.push_back(obj);
    }

    inputFile.close();

    return objects;
}


double calculateIOU(double x1, double y1, double w1, double h1, double x2, double y2, double w2, double h2) {
    double left = std::max(x1, x2);
    double top = std::max(y1, y2);
    double right = std::min(x1 + w1, x2 + w2);
    double bottom = std::min(y1 + h1, y2 + h2);

    double intersection = std::max(0.0, right - left) * std::max(0.0, bottom - top);
    double union_area = w1 * h1 + w2 * h2 - intersection;

    return intersection / union_area;
}


int main(int argc, char *argv[])
{

    std::string modelPath = "./models";
    ncnn::Net squeezenet;
    SCRFD* detector = new SCRFD(modelPath);
    ONet* detector_mtcnn = new ONet(modelPath);
    squeezenet.load_param("./models/mobilefacenet.param");
    squeezenet.load_model("./models/mobilefacenet.bin");
    ncnn::Extractor ex = squeezenet.create_extractor();


    ofstream out("xreal.txt");
    


    vector motaxreal;//存放mota 用于读取到txt文件中
    vector motpxreal;//存放motp 用于读取到txt文件中
    vector misxreal;//存放misDetection 用于读取到txt文件中
    vector falsexreal;//存放falseDetection 用于读取到txt文件中
    vector N_gtxreal;//存放N_gt 用于读取到txt文件中
    vector IDSWxreal;//存放IDSW 用于读取到txt文件中
    vector N_trxreal;//存放N_tr 用于读取到txt文件中
    vector IDF1xreal;//存放IDF1 用于读取到txt文件中
    vector HOTAaxreal;//存放HOTAa 用于读取到txt文件中






    // 设置输入文件夹和输出视频文件名
    std::string inputFolder = "./img";
    std::string outputVideo = "output_video.avi";
    std::wstring_convert> converter;

    std::vector onedirectoryNames;
    std::vector finaldirectoryNames;//存储指定文件夹下的子目录路径
    // 设置目标图片大小
    //cv::Size targetSize(640, 480);
    getDirectoryNames(inputFolder, onedirectoryNames);
    for (const auto& path : onedirectoryNames) {
        //读取子目录中的标注信息
        std::wstring directory = converter.from_bytes(path);
        std::wstring searchPath = directory + L"\\*.txt";
        std::vector objects_label;
        //以下参数用于计算MOTA(一个文件夹下的MOTA)
        int misDetection = 0;//漏检目标数FP
        int falseDetection = 0;//误检目标数FN
        int N_gt = 0;//实际目标总数
        int N_tr = 0;//检测到的目标总数TP
        double IDFP = 0.0;//整个过程id变化目标数
        double IDFN = 0.0;
        double IDSW = 0.0;//与上一帧对比id切换的次数；
        double IDTP = 1.0;//初始id为firstId ，整个过程为firstId的次数为IDTP,(TPA)
        double mota = 0.0;
        double sum_distance = 0.0;
        double motp = 0.0;
        double idf1 = 0.0;
        double Ac = 0.0;
        double HOTAa = 0.0;
        


        WIN32_FIND_DATAW fileData;
        HANDLE hFind = FindFirstFileW(searchPath.c_str(), &fileData);

        if (hFind != INVALID_HANDLE_VALUE)
        {
            do
            {
                std::wstring filePath = directory + L"\\" + fileData.cFileName;
                objects_label = ReadObjectsFromTxt(filePath);

                 Process the objects
                //for (const auto& obj : objects_label)
                //{
                //    // Do something with the object data
                //    std::cout << "Object: x=" << obj.o_x << ", y=" << obj.o_y
                //        << ", width=" << obj.o_width << ", height=" << obj.o_height << std::endl;
                //}
            } while (FindNextFileW(hFind, &fileData) != 0);

            FindClose(hFind);
        }


        getDirectoryNames(path, finaldirectoryNames);
        for (int i = 0; i < finaldirectoryNames.size(); i++) {
            
            // 读取第一张图像以获取视频的宽度和高度
            std::vector imagePaths;

            cv::glob(finaldirectoryNames[i], imagePaths);
            cv::Mat firstImage = cv::imread(imagePaths[0]);
            int width = firstImage.cols;
            int height = firstImage.rows;
            cv::Size targetSize(width, height);

            // 创建输出视频编写器
            cv::VideoWriter videoWriter(outputVideo, cv::VideoWriter::fourcc('M', 'J', 'P', 'G'), 25, cv::Size(width, height));

            if (!videoWriter.isOpened()) {
                std::cout << "无法创建输出视频编写器！" << std::endl;
                return 1;
            }

            // 处理文件夹中的图片
            processFolder(finaldirectoryNames[i], videoWriter, targetSize);


            // 释放资源
            videoWriter.release();

            cv::VideoCapture mVideoCapture(outputVideo);


            //cv::VideoCapture mVideoCapture(0);
            if (!mVideoCapture.isOpened()) {
                std::cout << "fail to openn!" << std::endl;
                return 1;
            }
            cv::Mat frame;
            mVideoCapture >> frame;
            int num_frames = 0;
            int fps = 30;
            BYTETracker tracker(fps, 3000);
            bool firstFrame = true;//判断是否是当前视频的检测到标注目标的第一帧
            int firstId = -1; //如果检测到标注目标的第一帧，把这第一帧的id记录下来，以备检查后面id是否变化
            

            while (true)
            {
                num_frames++;
                mVideoCapture >> frame;

                if (frame.empty()) {
                    // 处理视频帧读取完毕的情况
                    break;
                }

                std::vector faceobjects;
                std::vector finalBbox;
                std::vector bbox;



                auto start = std::chrono::system_clock::now();
                detector->detect_scrfd(frame, faceobjects);
                auto end = std::chrono::system_clock::now();
                auto detect_time = std::chrono::duration_cast(end - start).count();//ms
                //detector->draw_faceobjects(frame, faceobjects);

                for (int i = 0; i < faceobjects.size(); i++) {
                    cv::Mat faceROI_Image;
                    frame(faceobjects[i].rect).copyTo(faceROI_Image);
                    ncnn::Mat in = ncnn::Mat::from_pixels_resize(faceROI_Image.data,
                        ncnn::Mat::PIXEL_BGR, faceROI_Image.cols, faceROI_Image.rows, 48, 48);
                    // 传入onet
                    Bbox faceBbox = detector_mtcnn->onetDetect(in, faceobjects[i].rect.x,
                        faceobjects[i].rect.y, faceROI_Image.cols, faceROI_Image.rows);
                    //faceBbox.score = faceobjects[i].prob;
                    finalBbox.push_back(faceBbox);
                    /*for (int j = 0; j < 10; j++) {
                        std::cout << "faceBbox[0].ppoint[" < bbox;
                bbox.resize(num_box);
                bool matchLibrary = FALSE;

                for (int i = 0; i < num_box; i++) {
                    bbox[i] = cv::Rect(finalBbox[i].x1, finalBbox[i].y1,
                        finalBbox[i].x2 - finalBbox[i].x1 + 1, finalBbox[i].y2 - finalBbox[i].y1 + 1);
                    bbox[i] = SquarePadding(bbox[i], frame.rows, frame.cols, true);

                    //根据finalBbox[i]中关键点进行人脸对齐
                    cv::Mat alignedFace = faceAlign(frame, finalBbox[i]);
                    //cv::imshow("alignedFace", alignedFace);
                    float* featDetect = getFeatByMobileFaceNetNCNN(ex, alignedFace);
                    for (int j = 0; j < 128; j++)
                    {
                        finalBbox[i].fects[j] = featDetect[j];
                        //cout << i << " " << featDetect[i] << "\n";
                    }
                }

                //detector->draw_faceobjects(frame, faceobjects);
                //std::cout << "--------------detecting---------------" << std::endl;

                start = std::chrono::system_clock::now();
                std::vector output_stracks = tracker.update(finalBbox);
                end = std::chrono::system_clock::now();
                auto track_time = std::chrono::duration_cast(end - start).count();//us

                //std::cout << "output_stracks.size()" << output_stracks.size() << std::endl;

                //处理跟踪得来的数据，计算MOTA
                std::vector detections;
                Object_Label object_label;
                bool correct_detection = false;
                N_gt++;
                int lastId;//上一帧的id,用判断与前一帧id是否变化
                double TPA = 1;
                double FNA = 0;
                double FPA = 0;


                bbox.resize(output_stracks.size());
                for (unsigned long i = 0; i < output_stracks.size(); i++)
                {
                    std::vector tlwh = output_stracks[i].tlwh;
                    bool vertical = tlwh[2] / tlwh[3] > 1.6;
                    if (tlwh[2] * tlwh[3] > 30 && !vertical)
                    {
                        bbox[i] = cv::Rect(tlwh[0], tlwh[1], tlwh[2] + 1, tlwh[3] + 1);
                        bbox[i] = SquarePadding(bbox[i], frame.rows, frame.cols, true);
                        cv::Scalar s = tracker.get_color(output_stracks[i].track_id);
                        cv::putText(frame, cv::format("%d %.1f%%", output_stracks[i].track_id, 100 * output_stracks[i].score),
                            cv::Point(bbox[i].x, bbox[i].y - 5), 0, 0.6, cv::Scalar(0, 0, 255), 1, cv::LINE_AA);

                        cv::rectangle(frame, cv::Rect(bbox[i].x, bbox[i].y, bbox[i].width, bbox[i].height), s, 2);

                        object_label.name = output_stracks[i].track_id;
                        object_label.o_x = static_cast(tlwh[0] + tlwh[2] / 2.0);
                        object_label.o_y = static_cast(tlwh[1] + tlwh[3] / 2.0);
                        object_label.o_width = static_cast(tlwh[2]);
                        object_label.o_height = static_cast(tlwh[3]);
                        detections.push_back(object_label);
                    }

                }

                cv::putText(frame, cv::format("detect ms:%ld  track us:%ld  current frame:%d", detect_time, track_time, num_frames),
                    cv::Point(1, 40), cv::FONT_HERSHEY_PLAIN, 1, cv::Scalar(255, 255, 255), 1, 8);
                cv::imshow("bytetracker", frame);

                
                
                
                for (const Object_Label& det : detections) {
                    double iou = calculateIOU(
                        det.o_x - det.o_width / 2.0, 
                        det.o_y - det.o_height / 2.0, 
                        det.o_width, det.o_height,
                        objects_label[0].o_x - objects_label[0].o_width / 2.0,
                        objects_label[0].o_y - objects_label[0].o_height / 2.0,
                        objects_label[0].o_width, objects_label[0].o_height);
                    double distance = 
                        std::sqrt(std::pow(det.o_x - objects_label[0].o_x, 2) + std::pow(det.o_y - objects_label[0].o_y, 2));
                   
                    if (iou >= 0.5 && distance <= 20.0) {
                        correct_detection = true;
                        N_tr++; //检测匹配成功的数量TP
                        sum_distance += distance;
                        if (firstFrame == true) {
                            firstId = det.name;
                            lastId = det.name;
                            firstFrame = false;
                        }else {
                            if (firstId != det.name) {
                                IDFP++;
                                IDFN++;

                                FPA ++;
                                FNA ++;

                            }
                            else {
                                IDTP++; 

                                TPA ++;
                            }
                        }
                        if (firstFrame == false) {
                            if (det.name != lastId) {
                                IDSW++;
                            }
                        }
                        Ac += (abs(TPA) / (abs(TPA) + abs(FNA) + abs(FPA)));
                    }
                }
                
                if (correct_detection == false) {
                    misDetection++;
                    falseDetection++;
                }
                if (cv::waitKey(30) == 27) // Wait for 'esc' key press to exit
                {
                    break;
                }
                //将标注信息的第一行删除，以便后面的匹配
                objects_label.erase(objects_label.begin());
                faceobjects.clear();
                finalBbox.clear();
            }
            mVideoCapture.release();

            std::cout << "视频播放完成！" << std::endl;
        }

        mota = 1 - (double)(misDetection + falseDetection + 2 * IDSW) / (double)N_gt;
        motp = sum_distance / (double)N_tr;

        
        idf1 = (2 * IDTP ) / (2 * IDTP + IDFP + IDFN);

        HOTAa = std::sqrt(abs(Ac / (double)(abs(N_tr) + abs(misDetection) + abs(falseDetection))));

        std::cout << "mota = " << mota << std::endl;
        std::cout << "motp = " << motp << std::endl;
        std::cout << "idf1 = " << idf1 << std::endl;
        std::cout << "HOTAa = " << HOTAa << std::endl;





        motaxreal.push_back(mota);
        motpxreal.push_back(motp);
        misxreal.push_back(misDetection);
        falsexreal.push_back(falseDetection);
        N_gtxreal.push_back(N_gt);
        IDSWxreal.push_back(IDSW);
        N_trxreal.push_back(N_tr);
        IDF1xreal.push_back(idf1);
        HOTAaxreal.push_back(HOTAa);


        finaldirectoryNames.clear();

    }


    for (int i = 0; i < onedirectoryNames.size(); i++)
    {
        //MOTA  MOTP  IDF1  HOTA  FP  FN  N_gt  IDs  N_tr
        out << i << "  " << motaxreal[i] 
                 << "  " << motpxreal[i]
                 << "  " << IDF1xreal[i]
                 << "  " << HOTAaxreal[i]
                 << "  " << misxreal[i]
                 << "  " << falsexreal[i]
                 << "  " << N_gtxreal[i]
                 << "  " << IDSWxreal[i]
                 << "  " << N_trxreal[i]               
                 <<"\n";
    }
  
   
    cv::destroyAllWindows();
}

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

#include 
#include 
#include 


#include "BYTETracker.h"
#include "scrfd.h"
#include "mtcnn.h"
//近似的仿射变换
cv::Mat getsrc_roi(std::vector x0, std::vector dst)
{
    int size = dst.size();
    cv::Mat A = cv::Mat::zeros(size * 2, 4, CV_32FC1);
    cv::Mat B = cv::Mat::zeros(size * 2, 1, CV_32FC1);

    //[ x1 -y1 1 0] [a]       [x_1]
    //[ y1  x1 0 1] [b]   =   [y_1]
    //[ x2 -y2 1 0] [c]       [x_2]
    //[ y2  x2 0 1] [d]       [y_2]	

    for (int i = 0; i < size; i++)
    {
        A.at(i << 1, 0) = x0[i].x;// roi_dst[i].x;
        A.at(i << 1, 1) = -x0[i].y;
        A.at(i << 1, 2) = 1;
        A.at(i << 1, 3) = 0;
        A.at(i << 1 | 1, 0) = x0[i].y;
        A.at(i << 1 | 1, 1) = x0[i].x;
        A.at(i << 1 | 1, 2) = 0;
        A.at(i << 1 | 1, 3) = 1;

        B.at(i << 1) = dst[i].x;
        B.at(i << 1 | 1) = dst[i].y;
    }

    cv::Mat roi = cv::Mat::zeros(2, 3, A.type());
    cv::Mat AT = A.t();
    cv::Mat ATA = A.t() * A;
    cv::Mat R = ATA.inv() * AT * B;

    //roi = [a -b c;b a d ];

    roi.at(0, 0) = R.at(0, 0);
    roi.at(0, 1) = -R.at(1, 0);
    roi.at(0, 2) = R.at(2, 0);
    roi.at(1, 0) = R.at(1, 0);
    roi.at(1, 1) = R.at(0, 0);
    roi.at(1, 2) = R.at(3, 0);
    return roi;

}

//人脸对齐
cv::Mat faceAlign(cv::Mat& imageAlign, Bbox& finalBboxAlign)
{
    double dst_landmark[10] = {
        38.2946, 73.5318, 55.0252, 41.5493, 70.7299,
        51.6963, 51.5014, 71.7366, 92.3655, 92.2041 };
    vectorcoord5points;
    vectorfacePointsByMtcnn;
    for (int i = 0; i < 5; i++) {
        coord5points.push_back(cv::Point2f(dst_landmark[i], dst_landmark[i + 5]));
    }

    for (int j = 0; j < 5; j = j + 1)
    {
        //cv::circle(image, cvPoint(finalBbox[i].ppoint[j], finalBbox[i].ppoint[j + 5]), 2, CV_RGB(0, 255, 0), CV_FILLED);
        facePointsByMtcnn.push_back(cv::Point(finalBboxAlign.ppoint[j], finalBboxAlign.ppoint[j + 5]));
    }

    cv::Mat warp_mat = cv::estimateAffinePartial2D(facePointsByMtcnn, coord5points);
    if (warp_mat.empty()) {
        warp_mat = getsrc_roi(facePointsByMtcnn, coord5points);
    }
    warp_mat.convertTo(warp_mat, CV_32FC1);
    cv::Mat alignFace = cv::Mat::zeros(112, 112, imageAlign.type());
    warpAffine(imageAlign, alignFace, warp_mat, alignFace.size());
    return alignFace;
}



float* getFeatByMobileFaceNetNCNN(ncnn::Extractor ex, cv::Mat img)
{
    //cout << "getFeatByMobileFaceNetNCNN" << endl;
    float* feat = new float[128];
    ncnn::Mat in = ncnn::Mat::from_pixels_resize(img.data, ncnn::Mat::PIXEL_BGR, img.cols, img.rows, 112, 112);
    ex.input("data", in);
    ncnn::Mat out;
    ex.extract("fc1", out);

    for (int j = 0; j < out.w; j++)
    {
        feat[j] = out[j];
    }
    return feat;
}


//正方形化
static cv::Rect SquarePadding(cv::Rect facebox, int margin_rows, int margin_cols, bool max_b)
{
    int c_x = facebox.x + facebox.width / 2;
    int c_y = facebox.y + facebox.height / 2;
    int large = 0;
    if (max_b)
        large = (std::max)(facebox.height, facebox.width) / 2;
    else
        large = (std::min)(facebox.height, facebox.width) / 2;
    cv::Rect rectNot(c_x - large, c_y - large, c_x + large, c_y + large);
    rectNot.x = (std::max)(0, rectNot.x);
    rectNot.y = (std::max)(0, rectNot.y);
    rectNot.height = (std::min)(rectNot.height, margin_rows - 1);
    rectNot.width = (std::min)(rectNot.width, margin_cols - 1);
    if (rectNot.height - rectNot.y != rectNot.width - rectNot.x)
        return SquarePadding(cv::Rect(rectNot.x, rectNot.y, rectNot.width - rectNot.x, rectNot.height - rectNot.y), margin_rows, margin_cols, false);

    return cv::Rect(rectNot.x, rectNot.y, rectNot.width - rectNot.x, rectNot.height - rectNot.y);
}

void processImage(const std::string& imagePath, cv::VideoWriter& videoWriter, const cv::Size& targetSize) {
    cv::Mat image = cv::imread(imagePath);

    // 调整图片大小
    cv::resize(image, image, targetSize);

    videoWriter.write(image);
}

//读取文件夹下的图片合并成视频
void processFolder(const std::string& folderPath, cv::VideoWriter& videoWriter, const cv::Size& targetSize) {
    cv::String pattern = folderPath + "/*.jpg"; // 匹配 JPG 格式的图片
    std::vector imagePaths;
    cv::glob(pattern, imagePaths);

    for (const auto& imagePath : imagePaths) {
        processImage(imagePath, videoWriter, targetSize);
    }
}

//读取文件夹下的所有子文件夹路径
void getDirectoryNames(const std::string& folderPath, std::vector& directoryNames)
{
    std::string searchPattern = folderPath + "\\*";

    WIN32_FIND_DATAA findData;
    HANDLE hFind = FindFirstFileA(searchPattern.c_str(), &findData);

    if (hFind != INVALID_HANDLE_VALUE)
    {
        do
        {
            std::string entryName = findData.cFileName;

            if ((findData.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY) && entryName != "." && entryName != "..")
            {
                directoryNames.push_back(folderPath + "/" + entryName);
            }
        } while (FindNextFileA(hFind, &findData));

        FindClose(hFind);
    }
}


struct Object_Label {    
    double o_x, o_y;  // 中心坐标
    double o_width, o_height;  // 长宽
    int name;
};

std::vector ReadObjectsFromTxt(const std::wstring& filePath)
{
    std::wifstream inputFile(filePath);

    if (!inputFile)
    {
        std::wcerr << L"Failed to open input file: " << filePath << std::endl;
        return {};
    }

    std::vector objects;
    std::wstring line;
    while (std::getline(inputFile, line))
    {
        Object_Label obj;
        std::wstringstream ss(line);
        std::wstring token;

        std::getline(ss, token, L',');
        obj.o_x = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');
        obj.o_y = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');
        obj.o_width = std::stod(token.substr(token.find(L',') + 1));

        std::getline(ss, token, L',');
        obj.o_height = std::stod(token.substr(token.find(L',') + 1));

        objects.push_back(obj);
    }

    inputFile.close();

    return objects;
}



double calculateIOU(double x1, double y1, double w1, double h1, double x2, double y2, double w2, double h2) {
    double left = std::max(x1, x2);
    double top = std::max(y1, y2);
    double right = std::min(x1 + w1, x2 + w2);
    double bottom = std::min(y1 + h1, y2 + h2);

    double intersection = std::max(0.0, right - left) * std::max(0.0, bottom - top);
    double union_area = w1 * h1 + w2 * h2 - intersection;

    return intersection / union_area;
}




int main(int argc, char *argv[])
{

    std::string modelPath = "./models";
    ncnn::Net squeezenet;
    SCRFD* detector = new SCRFD(modelPath);
    ONet* detector_mtcnn = new ONet(modelPath);
    squeezenet.load_param("./models/mobilefacenet.param");
    squeezenet.load_model("./models/mobilefacenet.bin");
    ncnn::Extractor ex = squeezenet.create_extractor();


    ofstream out("xreal1.txt");
    


    vector motaxreal;//存放mota 用于读取到txt文件中
    vector motpxreal;//存放motp 用于读取到txt文件中
    vector misxreal;//存放misDetection 用于读取到txt文件中
    vector falsexreal;//存放falseDetection 用于读取到txt文件中
    vector N_gtxreal;//存放N_gt 用于读取到txt文件中
    vector IDSWxreal;//存放IDSW 用于读取到txt文件中
    vector N_trxreal;//存放N_tr 用于读取到txt文件中
    vector IDF1xreal;//存放IDF1 用于读取到txt文件中
    vector HOTAaxreal;//存放HOTAa 用于读取到txt文件中




    // 设置输入文件夹和输出视频文件名
    std::string inputFolder = "./video";
    std::string outputVideo = "output_video.avi";
    std::wstring_convert> converter;

    std::vector onedirectoryNames;
    std::vector finaldirectoryNames;//存储指定文件夹下的子目录路径
    // 设置目标图片大小
    //cv::Size targetSize(640, 480);
    getDirectoryNames(inputFolder, onedirectoryNames);
    for (const auto& path : onedirectoryNames) {
        //以下参数用于计算MOTA(一个文件夹下的MOTA)
        int misDetection = 0;//漏检目标数FP  指未被跟踪器检测到的实际存在的目标数。
        int falseDetection = 0;//误检目标数FN  指被跟踪器错误地检测为目标的虚假目标数。
        int N_gt = 0;//实际目标总数
        int N_tr = 0;//检测到的目标总数TP
        double IDFP = 0.0;//整个过程id变化目标数
        double IDFN = 0.0;
        double IDSW = 0.0;//与上一帧对比id切换的次数；
        double IDTP = 0.0;//初始id为firstId ，整个过程为firstId的次数为IDTP,(TPA)
        double mota = 0.0;
        double sum_distance = 0.0;
        double motp = 0.0;
        double idf1 = 0.0;
        double Ac = 0.0;
        double HOTAa = 0.0;




        //读取子目录中的标注信息
        std::wstring directory = converter.from_bytes(path);
        std::wstring searchPath = directory + L"\\*.txt";
        
       

        WIN32_FIND_DATAW fileData;
        HANDLE hFind = FindFirstFileW(searchPath.c_str(), &fileData);
        std::vector> allObjects;  // 存储所有文件的对象数据
        if (hFind != INVALID_HANDLE_VALUE)
        {
            

            do
            {
                std::wstring filePath = directory + L"\\" + fileData.cFileName;
                std::vector objects_Label = ReadObjectsFromTxt(filePath);

                // Process the objects
                allObjects.push_back(objects_Label);  // 将对象数据存入容器

            } while (FindNextFileW(hFind, &fileData) != 0);

            FindClose(hFind);

            // //遍历容器中的所有对象数据
            //for (const auto& objects : allObjects)
            //{
            //    // 处理每个文件的对象数据
            //    for (const auto& obj : objects)
            //    {
            //        // Do something with the object data
            //        std::cout << "Object: x=" << obj.o_x << ", y=" << obj.o_y
            //            << ", width=" << obj.o_width << ", height=" << obj.o_height << std::endl;
            //    }
            //}
        }


        getDirectoryNames(path, finaldirectoryNames);
        for (int i = 0; i < finaldirectoryNames.size(); i++) {
            
            // 读取第一张图像以获取视频的宽度和高度
            std::vector imagePaths;

            cv::glob(finaldirectoryNames[i], imagePaths);
            cv::Mat firstImage = cv::imread(imagePaths[0]);
            int width = firstImage.cols;
            int height = firstImage.rows;
            cv::Size targetSize(width, height);

            // 创建输出视频编写器
            cv::VideoWriter videoWriter(outputVideo, cv::VideoWriter::fourcc('M', 'J', 'P', 'G'), 10, cv::Size(width, height));

            if (!videoWriter.isOpened()) {
                std::cout << "无法创建输出视频编写器！" << std::endl;
                return 1;
            }

            // 处理文件夹中的图片
            processFolder(finaldirectoryNames[i], videoWriter, targetSize);


            // 释放资源
            videoWriter.release();

            cv::VideoCapture mVideoCapture(outputVideo);


            //cv::VideoCapture mVideoCapture(0);
            if (!mVideoCapture.isOpened()) {
                std::cout << "fail to openn!" << std::endl;
                return 1;
            }
            cv::Mat frame;
            mVideoCapture >> frame;
            int num_frames = 0;
            int fps = 30;
            BYTETracker tracker(fps, 3000);
            bool firstFrame = true;//判断是否是当前视频的检测到标注目标的第一帧
            vector first_ids; //如果检测到标注目标的第一帧，把这第一帧的id记录下来，以备检查后面id是否变化
            first_ids.resize(1);

            while (true)
            {
                num_frames++;
                mVideoCapture >> frame;

                if (frame.empty()) {
                    // 处理视频帧读取完毕的情况
                    break;
                }

                std::vector faceobjects;
                std::vector finalBbox;
                std::vector bbox;



                auto start = std::chrono::system_clock::now();
                detector->detect_scrfd(frame, faceobjects);
                auto end = std::chrono::system_clock::now();
                auto detect_time = std::chrono::duration_cast(end - start).count();//ms
                //detector->draw_faceobjects(frame, faceobjects);

                for (int i = 0; i < faceobjects.size(); i++) {
                    cv::Mat faceROI_Image;
                    frame(faceobjects[i].rect).copyTo(faceROI_Image);
                    ncnn::Mat in = ncnn::Mat::from_pixels_resize(faceROI_Image.data,
                        ncnn::Mat::PIXEL_BGR, faceROI_Image.cols, faceROI_Image.rows, 48, 48);
                    // 传入onet
                    Bbox faceBbox = detector_mtcnn->onetDetect(in, faceobjects[i].rect.x,
                        faceobjects[i].rect.y, faceROI_Image.cols, faceROI_Image.rows);
                    //faceBbox.score = faceobjects[i].prob;
                    finalBbox.push_back(faceBbox);
                    /*for (int j = 0; j < 10; j++) {
                        std::cout << "faceBbox[0].ppoint[" < bbox;
                bbox.resize(num_box);
                bool matchLibrary = FALSE;

                for (int i = 0; i < num_box; i++) {
                    bbox[i] = cv::Rect(finalBbox[i].x1, finalBbox[i].y1,
                        finalBbox[i].x2 - finalBbox[i].x1 + 1, finalBbox[i].y2 - finalBbox[i].y1 + 1);
                    bbox[i] = SquarePadding(bbox[i], frame.rows, frame.cols, true);

                    //根据finalBbox[i]中关键点进行人脸对齐
                    cv::Mat alignedFace = faceAlign(frame, finalBbox[i]);
                    //cv::imshow("alignedFace", alignedFace);
                    float* featDetect = getFeatByMobileFaceNetNCNN(ex, alignedFace);
                    for (int j = 0; j < 128; j++)
                    {
                        finalBbox[i].fects[j] = featDetect[j];
                        //cout << i << " " << featDetect[i] << "\n";
                    }
                }

                //detector->draw_faceobjects(frame, faceobjects);
                //std::cout << "--------------detecting---------------" << std::endl;

                start = std::chrono::system_clock::now();
                std::vector output_stracks = tracker.update(finalBbox);
                end = std::chrono::system_clock::now();
                auto track_time = std::chrono::duration_cast(end - start).count();//us

               // std::cout << "output_stracks.size()=" << output_stracks.size() << std::endl;

                //处理跟踪得来的数据，计算MOTA
                std::vector detections;
                Object_Label object_det;
                
                
                

                bbox.resize(output_stracks.size());
                for (unsigned long i = 0; i < output_stracks.size(); i++)
                {
                    std::vector tlwh = output_stracks[i].tlwh;
                    bool vertical = tlwh[2] / tlwh[3] > 1.6;
                    if (tlwh[2] * tlwh[3] > 30 && !vertical)
                    {
                        bbox[i] = cv::Rect(tlwh[0], tlwh[1], tlwh[2] + 1, tlwh[3] + 1);
                        bbox[i] = SquarePadding(bbox[i], frame.rows, frame.cols, true);
                        cv::Scalar s = tracker.get_color(output_stracks[i].track_id);
                        cv::putText(frame, cv::format("%d %.1f%%", output_stracks[i].track_id, 100 * output_stracks[i].score),
                            cv::Point(bbox[i].x, bbox[i].y - 5), 0, 0.6, cv::Scalar(0, 0, 255), 1, cv::LINE_AA);

                        cv::rectangle(frame, cv::Rect(bbox[i].x, bbox[i].y, bbox[i].width, bbox[i].height), s, 2);

                        object_det.name = output_stracks[i].track_id;
                        object_det.o_x = static_cast(tlwh[0] + tlwh[2] / 2.0);
                        object_det.o_y = static_cast(tlwh[1] + tlwh[3] / 2.0);
                        object_det.o_width = static_cast(tlwh[2]);
                        object_det.o_height = static_cast(tlwh[3]);
                        detections.push_back(object_det);
                    }

                }

                cv::putText(frame, cv::format("detect ms:%ld  track us:%ld  current frame:%d", detect_time, track_time, num_frames),
                    cv::Point(1, 40), cv::FONT_HERSHEY_PLAIN, 1, cv::Scalar(255, 255, 255), 1, 8);
                cv::imshow("bytetracker", frame);

                
                int objects_Label_size = allObjects[0].size();
                N_gt += objects_Label_size;
                int detections_size = detections.size();
                vector last_ids;//上一帧的id,用判断与前一帧id是否变化
                last_ids.resize(1);
                vector det_names;
                double TPA = 0;
                double FNA = 0;
                double FPA = 0;
               

                for (int ii = 0; ii < detections.size(); ii++)
                {               
                    const Object_Label& det = detections[ii];
                    for (auto& object_label : allObjects[0]) {

                        double iou = calculateIOU(
                            det.o_x - det.o_width / 2.0,
                            det.o_y - det.o_height / 2.0,
                            det.o_width, det.o_height,
                            object_label.o_x - object_label.o_width / 2.0,
                            object_label.o_y - object_label.o_height / 2.0,
                            object_label.o_width, object_label.o_height);
                        double distance =
                            std::sqrt(std::pow(det.o_x - object_label.o_x, 2) + std::pow(det.o_y - object_label.o_y, 2));

                        if (iou >= 0.7 && distance <= 20.0) {                           
                            N_tr++; //检测匹配成功的数量TP
                            sum_distance += distance;
                            objects_Label_size--;
                            detections_size--;
                            object_label.o_height = 0; //匹配上了，就将其置零，防止二次匹配
                            object_label.o_width = 0;
                            
                            if (firstFrame == true) {                                                                                                
                                first_ids.push_back(det.name);
                                last_ids.push_back(det.name);
                                IDTP++;
                                TPA++;
                            }
                            else {                                                            
                                det_names.push_back(det.name);                                
                            }
                        }
                    }
                }
                                
                if(firstFrame == false){
                    for (int x = 0; x < det_names.size(); x++) {                        
                        if (x <= first_ids.size()) {
                            if (det_names[x] != first_ids[x]) {
                                IDFP++;
                                IDFN++;

                                FPA++;
                                FNA++;
                            }
                            else {
                                IDTP++;

                                TPA++;
                            }
                        }
                        if (x <= last_ids.size()) {
                            if (det_names[x] != last_ids[x]) {
                                IDSW++;
                            }
                        }
                    }
                    if (det_names.size() > first_ids.size()) {
                        for (int x = 0; x < det_names.size() - first_ids.size(); x++) {
                            first_ids.push_back(det_names[first_ids.size()]);
                        }
                    }
                    last_ids.clear();
                    for (int x = 0; x < det_names.size(); x++) {
                        last_ids.push_back(det_names[x]);
                    }
                    det_names.clear();
                }
                Ac += ((abs(TPA)+0.001) / ((abs(TPA) + abs(FNA) + abs(FPA)+0.001)));
                misDetection += objects_Label_size;
                falseDetection += detections_size;
                
                if(cv::waitKey(30) == 27) // Wait for 'esc' key press to exit
                {
                    break;
                }
                firstFrame = false;
                //将标注信息的第一行删除，以便后面的匹配
                allObjects.erase(allObjects.begin());
                faceobjects.clear();
                finalBbox.clear();
            }
            mVideoCapture.release();

            std::cout << "视频播放完成！" << std::endl;
        }

        mota = 1 - (double)(misDetection + falseDetection + 2 * IDSW) / (double)N_gt;
        motp = sum_distance / (double)N_tr;

        
        idf1 = (2 * IDTP ) / (2 * IDTP + IDFP + IDFN);

        HOTAa = std::sqrt(abs(Ac / (double)(abs(N_tr) + abs(misDetection) + abs(falseDetection)+0.001)));

        std::cout << "mota = " << mota << std::endl;
        std::cout << "motp = " << motp << std::endl;
        std::cout << "idf1 = " << idf1 << std::endl;
        std::cout << "HOTAa = " << HOTAa << std::endl;





        motaxreal.push_back(mota);
        motpxreal.push_back(motp);
        misxreal.push_back(misDetection);
        falsexreal.push_back(falseDetection);
        N_gtxreal.push_back(N_gt);
        IDSWxreal.push_back(IDSW);
        N_trxreal.push_back(N_tr);
        IDF1xreal.push_back(idf1);
        HOTAaxreal.push_back(HOTAa);


        finaldirectoryNames.clear();

    }


    for (int i = 0; i < onedirectoryNames.size(); i++)
    {
        //MOTA  MOTP  IDF1  HOTA  FP  FN  N_gt  IDs  N_tr
        out << i << "  " << motaxreal[i] 
                 << "  " << motpxreal[i]
                 << "  " << IDF1xreal[i]
                 << "  " << HOTAaxreal[i]
                 << "  " << misxreal[i]
                 << "  " << falsexreal[i]
                 << "  " << N_gtxreal[i]
                 << "  " << IDSWxreal[i]
                 << "  " << N_trxreal[i]               
                 <<"\n";
    }
  
   
    cv::destroyAllWindows();
}

你可能感兴趣的:(opencv,计算机视觉,人工智能,c++)

AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
Python 学习第五册深度学习第1章什么是深度学习 weixin_38135241 python 学习深度学习人工智能
----用教授的方式学习。目录1.1人工智能、机器学习与深度学习1.1.1人工智能1.1.2机器学习1.1.3从数据中学习表示1.1.4深度学习之“深度”1.1.5用三张图理解深度学习的工作原理1.2深度学习之前：机器学习简史1.2.1概率建模1.2.2核方法1.2.3决策树、随机森林与梯度提升机1.2.4深度学习有何不同什么是深度学习？1.1人工智能、机器学习与深度学习三者关系：1.1.1人工智
当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅步子哥 AGI通用人工智能语言模型人工智能自然语言处理
在浩如烟海的人工智能技术中，构建和调教大语言模型（LLMs）的过程就像是一场精心策划的奇幻冒险。本文带您走进一个鲜为人知的领域——如何利用“量身定制”的数据，让模型在知识的海洋中游刃有余。我们将透过一篇最新的研究《TheBestInstruction-TuningDataareThoseThatFit》，探索如何通过选择与目标模型分布高度契合的数据来优化监督式微调（SFT）的效果，以及这一方法如何
第十三届蓝桥杯大赛软件赛省赛 C/C++ 大学 B 组C题刷题统计我是小趴菜一枚算法蓝桥杯 c++c语言
问题描述小明决定从下周一开始努力刷题准备蓝桥杯竞赛。他计划周一至周五每天做aa道题目,周六和周日每天做bb道题目。请你帮小明计算,按照计划他将在第几天实现做题数大于等于nn题?输入格式输入一行包含三个整数a,ba,b和nn.输出格式输出一个整数代表天数。样例输入102099样例输出8评测用例规模与约定对于50%50%的评测用例,1≤a,b,n≤1061≤a,b,n≤106.对于100%100%的评
基于Python+Django的可视化学习系统设计与实现（毕业设计源码+技术文档+系统部署）逐梦设计 Python毕业设计实战案例 python django 课程设计 vue.js 毕业设计源码
博主简介作者简介：Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验，被多个学校常年聘为校外企业导师，指导学生毕业设计并参与学生毕业答辩指导，有较为丰富的相关经验。期待与各位高校教师、企业讲师以及同行交流合作主要内容：Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能与大数据、
编写有内存漏洞的 C++ 代码，并实现内存注入的示例（一个程序注入另一个程序） SmartGridequation C/C++c++开发语言内存漏洞内存注入
实现思路在Windows平台下，可以使用WindowsAPI编写一个程序来对另一个目标程序进行内存注入。基本步骤如下：查找目标进程：通过进程名找到目标进程的ID。打开目标进程：使用OpenProcess函数打开目标进程，获取进程句柄。在目标进程中分配内存：使用VirtualAllocEx函数在目标进程的地址空间中分配一块内存。将数据写入目标进程的内存：使用WriteProcessMemory函数将
AI 生成 PPT 网站介绍与优缺点分析 KL_lililli 人工智能 powerpoint
随着人工智能技术不断发展，利用AI自动生成PPT已成为提高演示文稿制作效率的热门方式。本文将介绍几款主流的AIPPT工具，重点列出免费使用机会较多的网站，并对各平台的优缺点进行详细分析，帮助用户根据自身需求选择合适的工具。1.免费及免费试用机会较多的网站1.1Tome网址：Tome–TheAIassistantforsales简介：Tome是一款专注于AI助力讲故事与演示制作的工具，用户只需输入简
机器学习驱动的智能化电池管理技术与应用满木悦电池化学机器人化学电池机器学习人工智能硕博研究生
在人工智能与电池管理技术融合的背景下，电池科技的研究和应用正迅速发展，创新解决方案层出不穷。从电池性能的精确评估到复杂电池系统的智能监控，从数据驱动的故障诊断到电池寿命的预测优化，人工智能技术正以其强大的数据处理能力和模式识别优势，推动电池管理领域的技术进步。据最新研究动态，目前在电池管理领域的人工智能应用主要集中在以下几个方面：1.状态估计：包括电池的荷电状态（SOC）和健康状态（SOH）的实时
QML与C++集成之道 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 QT教程 c++
QML与C++集成之道补天云火鸟博客创作软件1QML基础和C++整合入门1.1QML语言概览1.1.1QML语言概览QML语言概览QML语言概览QML简介及用途QML（QuickModelLanguage）是Qt库中的一种声明式编程语言，主要用于构建复杂的用户界面。它是一种面向对象的语言，但使用场景和传统面向对象编程有所不同。QML允许开发者以XML或JSON格式编写代码来描述UI组件、它们的属性
C++ 的内存管理有哪些改进？ c++
C++20引入了对协程的官方支持，这是C++语言发展的一个重要里程碑。协程为异步编程、并发任务处理以及复杂的控制流提供了一种更高效、更简洁的解决方案。以下是C++20中协程支持的主要优势：一、简化异步编程在传统的异步编程中，开发者通常需要使用回调函数、std::future和std::promise等机制来处理异步任务。这些方法虽然有效，但代码往往难以阅读和维护，且容易出错。C++20的协程提供了
富途证券C++面试题及参考答案大模型大数据攻城狮 c++java 后端面试大厂面试 Epoll 智能指针数据库索引
C++中堆和栈的区别在C++中，堆和栈是两种不同的内存区域，它们有许多区别。从内存分配方式来看，栈是由编译器自动分配和释放的内存区域。当一个函数被调用时，函数内的局部变量、函数参数等会被压入栈中，这些变量的内存空间在函数执行结束后会自动被释放。例如，在下面的函数中：voidfunc(){inta=5;//这里的变量a存储在栈中，当func函数结束后，a所占用的栈空间会自动释放}而堆是由程序员手动分
OpenCV 基础模块 Python 版 ice_junjun OpenCV opencv python 计算机视觉
OpenCV基础模块权威指南（Python版）一、模块全景图plaintextOpenCV架构(v4.x+)├─核心层│├─core：基础数据结构与操作（Mat/Scalar/Point）│└─imgproc：图像处理流水线（滤波→变换→检测）├─交互层│├─highgui：GUI与媒体I/O（显示/捕获/交互）│└─video：视频分析（运动检测/目标跟踪）├─3D视觉层│└─calib3d：相
unique_ptr 和 shared_ptr 有什么区别？
std::unique_ptr和std::shared_ptr是C++中两种主要的智能指针类型，它们都用于自动管理动态分配的内存，但在所有权模型、使用场景和性能上有显著的区别。以下是它们的详细对比：一、所有权模型std::unique_ptr独占所有权：std::unique_ptr表示对资源的独占所有权。一个资源在同一时间只能被一个std::unique_ptr所拥有。禁止复制：std::uni
AI算力要变天了？一文搞懂ASIC和GPU asicgpuai芯片
近期，全球股市的动荡中，ASIC和GPU这两个科技股概念突然变得火热，引起了市场的高度关注。博通作为ASIC的代表，股价一路猛涨，而英伟达作为GPU的代表，股价却一路下跌。这是否意味着AI算力市场即将变天？随着人工智能技术的飞速发展，AI算力的重要性日益凸显。从早期的简单模型训练到如今的大规模语言模型如ChatGPT等的出现，对算力的需求呈爆发式增长。01那什么是ASIC和GPU？ASIC：定制化
云智慧：拥抱AI算法驱动的智能运维服务创新引擎
随着信息化、数字化、智能化的加码，企业对人工智能、大数据等技术应用呈现出明显兴趣，海笔研究对国内中型规模企业调研表明，在2020年，54.1%的企业选择购买人工智能类应用，41.9%的企业选择购买大数据及BI类应用，各类产品软件的应用大幅提升了企业信息系统复杂度，以及运维管理难度。业务发展催生服务需求从系统管理者角度出发，信息系统从“单机Excel表格”到“集中式单系统”再到“微服务、云架构”等，
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
C++开发内存监控工具推荐点云SLAM 开发工具开发环境 c++开发语言 AddProperty gperftools Address 内存监控访问越界
在C++开发中，内存管理是至关重要的，尤其是当程序处理大数据或长时间运行时，内存泄漏或不当使用可能导致性能下降或崩溃。以下是几种常见且有效的内存监控工具，它们可以帮助开发者实时分析、诊断和优化程序的内存使用。1.ValgrindValgrind是一个广泛使用的内存调试和性能分析工具，它的Memcheck工具可以帮助你检查程序中的内存泄漏、内存越界、未初始化内存使用等问题。特点：检测内存泄漏。检查内
AI大模型产品经理学习路线，2025最新，从AI产品经理零基础入门到精通，非常详细收藏我这一篇够了！ AGI-杠哥人工智能产品经理学习语言模型 agi 自然语言处理
随着人工智能技术的发展，尤其是大模型（LargeModel）的兴起，越来越多的企业开始重视这一领域的投入。作为大模型产品经理，你需要具备一系列跨学科的知识和技能，以便有效地推动产品的开发、优化和市场化。以下是一份详细的大模型产品经理学习路线，旨在帮助你构建所需的知识体系，从零基础到精通。一、基础知识阶段1.计算机科学基础数据结构与算法：理解基本的数据结构（如数组、链表、树、图等）和常用算法（如排序
2025年第二届机器学习与神经网络国际学术会议(MLNN 2025) 分享学术科研与论文的禁小默机器学习神经网络人工智能
重要信息官网：www.icmlnn.org时间：2025年4月22-24日地点：中国-重庆简介2025年第二届机器学习与神经网络国际学术会议（MLNN2025）围绕学习系统与神经网络的核心理论、关键技术和应用展开讨论，涵盖深度学习、计算机视觉、自然语言处理、强化学习等多个子领域，通过特邀报告、主题演讲、海报展示等形式，展示相关领域的最新研究成果和技术创新。征稿主题神经网络机器学习深度学习算法及应用
别只会用别人的模型了，自学Ai大模型，顺序千万不要搞反了！刚入门的小白必备！鸡腿爱学习人工智能学习自然语言处理服务器数据库
大家好，我是JackBytes，一个专注于将人工智能应用于日常生活的半吊子程序猿，平时主要分享AI、NAS、Docker、搞机技巧、开源项目等。在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余，你是否知道这些大模型背后的技术原理是什么？假如让你从头开始学习大模型，你知道应该遵循什么样的路线嘛？今天给大家介绍一下Ai大模型的学习路线，顺序千万不要搞反了！，大家可以按照这个路线进
【视频】OpenCV：色彩空间转换、灰度转伪彩郭老二视频 opencv 人工智能
1、颜色空间转换使用OpenCV的函数cv::applyColorMap可以将灰度或者正常的RGB格式图片，转换成其它伪彩色，代码很简单：1）使用cv::imread加载图片；2）使用std::vectormatrices暂存转换后的所有图像；3）使用cv::applyColorMap转换图片颜色；4）使用cv::vconcat拼接所有的图片；5）使用cv::imwrite保存图片；#includ
国内外的网络安全成难题，IPLOOK 2022年用产品筑起“护城墙” 爱浦路 IPLOOK 网络安全安全架构
《爱尔兰时报》和爱尔兰国家广播电台（RTE）于12月31日对2021年爱尔兰科技行业的赢家和弱点进行了年终盘点。双方纷纷表示，2021年爱尔兰科技行业最大的弱点是爱尔兰的网络安全，这一年是一场前所未有的灾难。随着人工智能、大数据、5G等新兴技术的发展，企业面临的威胁日益增加，信息安全的重要性变得越来越突显。现在我们把视线从爱尔兰的网络安全问题拉回到国内的网络安全现状。我国对网络安全问题保持时刻警惕
OpenRAND可重复的随机数生成库 novanova2009 elasticsearch 大数据搜索引擎
OpenRAND是一个C++库，旨在通过提供强大且可复制的随机数生成解决方案来促进可重复的科学研究。它是一个简单的仅头文件库，性能可移植，统计稳健，并且易于集成到任何HPC计算项目中。特征跨平台支持：OpenRAND旨在跨各种平台无缝工作，包括CPU和GPU。其仅标题库设计使其能够轻松集成到您的项目中。用户友好的API：OpenRAND提供了一个用户友好的API，可以直接在您的应用程序中生成随机数
专业课笔记——（第一章：C、C++基础知识）大小胖虎 C/C++基础知识笔记算法 C C++数据类型操作类型笔记
目录一、数据类型二、不同格式输出的含义三、运算符优先级四、计算机基础知识五、零碎基础知识点一、数据类型1、C语言中的最简单的数据类型：整数类型、字符类型、浮点类型（C语言没有逻辑型(bool)它是C++特有的，而c语言它是通过0、1表示实现的）构造类型：枚举型、数组类型、结构体类型、共用体类型、类类型(C++特有)2、计算字符串长度：strlen()：c语言中的函数length()：c++中的函数
ubuntu 20.04安装visual studio code并配置C++编译环境 Android Coder #NDK与音视频 ubuntu
1.下载安装visualstudiocode我的系统是Ubuntu20.04，首先是下载安装包。进入官网，直接下载压缩包。https://code.visualstudio.com/Download下载完成后双击安装即可。2.C++运行环境配置插件的安装汉化：过于简单，直接按照教程操作：https://jingyan.baidu.com/article/7e44095377c9d12fc1e2ef
Visual Studio Code官网下载地址及使用技巧（含常用的拓展插件推荐） ITCTCSDN vscode ide 编辑器
VisualStudioCode（简称“VSCode”）是Microsoft于2015年4月发布的可运行于MacOS、Windows和Linux之上的跨平台源代码编辑器，它具有对JavaScript，TypeScript和Node.js的内置支持，并具有丰富的其他语言（例如C++，C＃，Java，Python，PHP，Go）和运行时（例如.NET和Unity）扩展的生态系统。VisualStudi
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
opencv python rgb转yuv_OpenCV之色彩空间与色彩空间转换 xiao fei opencv python rgb转yuv
python代码：importcv2ascvsrc=cv.imread("test.jpg")cv.namedWindow("rgb",cv.WINDOW_AUTOSIZE)cv.imshow("rgb",src)#RGBtoHSVhsv=cv.cvtColor(src,cv.COLOR_BGR2HSV)cv.imshow("hsv",hsv)#RGBtoYUVyuv=cv.cvtColor(sr
C++函数返回多个值：结构体、tuple @you_123 c++
C++函数一般可以返回一个值，但是在使用中常常需要一个函数返回多个值，因此可以使用结构体或tuple来进行实现。注意看代码里的注释！！！1.使用结构体返回多个值实现步骤：1.先定义一个结构体2.准备我们要实现的函数(需要返回多个值)3.在要实现的函数内调用结构体返回多个值4.使用函数返回结果代码示例：step1:定义结构体structPointStruct{floatwithout_floor;i
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo