Tom Hardy

一文详解OpenCV中的CUDA模块

如果您使用OpenCV已有一段时间，那么您应该已经注意到，在大多数情况下，OpenCV都使用CPU，这并不总能保证您所需的性能。为了解决这个问题，OpenCV在2010年增加了一个新模块，该模块使用CUDA提供GPU加速。您可以在下面找到一个展示GPU模块优势的基准测试：

简单列举下本文要交代的几个事情：

概述已经支持CUDA的OpenCV模块。
看一下cv :: gpu :: GpuMat（cv2.cuda_GpuMat）。
了解如何在CPU和GPU之间传输数据。
了解如何利用多个GPU。
编写一个简单的演示（C ++和Python），以了解OpenCV提供的CUDA API接口并计算我们可以获得的性能提升。

一、支持的模块

据称，尽管并未涵盖所有库的功能，但该模块“仍在继续增长，并正在适应新的计算技术和GPU架构。”

让我们看一下CUDA加速的OpenCV的官方文档。在这里，我们可以看到已支持的模块：

Core part
Operations on Matrices
Background Segmentation
Video Encoding/Decoding
Feature Detection and Description
Image Filtering
Image Processing
Legacy support
Object Detection
Optical Flow
Stereo Correspondence
Image Warping
Device layer

二、GpuMat

为了将数据保留在GPU内存中，OpenCV引入了一个新的类cv :: gpu :: GpuMat（或Python中的cv2.cuda_GpuMat）作为主要数据容器。其界面类似于cv :: Mat（cv2.Mat），从而使向GPU模块的过渡尽可能平滑。值得一提的是，所有GPU函数都将GpuMat接收为输入和输出参数。通过这种在代码中链接了GPU算法的设计，您可以减少在CPU和GPU之间复制数据的开销。

三、CPU/GUP数据传递

要将数据从GpuMat传输到Mat，反之亦然，OpenCV提供了两个函数：

上传，将数据从主机内存复制到设备内存
下载，将数据从设备内存复制到主机内存。

以下是用C ++写的一个简单示例：

#include  
#include  
 
cv::Mat img = cv::imread("image.png", IMREAD_GRAYSCALE); 
cv::cuda::GpuMat dst, src; 
src.upload(img); 
 
cv::Ptr ptr_clahe = cv::cuda::createCLAHE(5.0, cv::Size(8, 8)); 
ptr_clahe->apply(src, dst); 
 
cv::Mat result; 
dst.download(result); 
 
cv::imshow("result", result); 
cv::waitKey();

四、多个GPU的使用

默认情况下，每种OpenCV CUDA算法都使用单个GPU。如果需要利用多个GPU，则必须在GPU之间手动分配工作。要切换活动设备，请使用cv :: cuda :: setDevice（cv2.cuda.SetDevice）函数。

五、代码示例

OpenCV提供了有关如何使用C ++ API在GPU支持下与已实现的方法一起使用的示例。让我们在使用Farneback的算法进行密集光流计算的示例中，实现一个简单的演示，演示如何将CUDA加速的OpenCV与C ++一起使用。

我们首先来看一下如何使用CPU来完成此操作。然后，我们将使用GPU进行相同的操作。最后，我们将比较经过的时间以计算获得的加速比。

FPS计算

由于我们的主要目标是找出算法在不同设备上的运行速度，因此我们需要选择测量方法。在计算机视觉中，这样做的常用方法是计算每秒处理的帧数（FPS）。

CPU端

1.视频及其属性

我们将从视频捕获初始化开始，并获取其属性，例如帧频和帧数。这部分是CPU和GPU部分的通用部分：

// init video capture with video 
VideoCapture capture(videoFileName); 
if (!capture.isOpened()) 
{ 
    // error in opening the video file 
    cout << "Unable to open file!" << endl; 
    return; 
} 
 
// get default video FPS 
double fps = capture.get(CAP_PROP_FPS); 
 
// get total number of video frames 
int num_frames = int(capture.get(CAP_PROP_FRAME_COUNT));

2.读取第一帧

由于算法的特殊性，该算法使用两帧进行计算，因此我们需要先读取第一帧，然后再继续。还需要一些预处理，例如调整大小并转换为灰度：

// read the first frame 
cv::Mat frame, previous_frame; 
capture >> frame; 
 
if (device == "cpu") 
{ 
    // resize frame 
    cv::resize(frame, frame, Size(960, 540), 0, 0, INTER_LINEAR); 
 
    // convert to gray 
    cv::cvtColor(frame, previous_frame, COLOR_BGR2GRAY); 
 
    // declare outputs for optical flow 
    cv::Mat magnitude, normalized_magnitude, angle; 
    cv::Mat hsv[3], merged_hsv, hsv_8u, bgr; 
 
    // set saturation to 1 
    hsv[1] = cv::Mat::ones(frame.size(), CV_32F);

3.读取并预处理其他帧

在循环读取其余帧之前，我们启动两个计时器：一个计时器将跟踪整个流程的工z作时间，第二个计时器–读取帧时间。由于Farneback的光流法适用于灰度帧，因此我们需要确保将灰度视频作为输入传递。这就是为什么我们首先对其进行预处理以将每帧从BGR格式转换为灰度的原因。另外，由于原始分辨率可能太大，因此我们将其调整为较小的尺寸，就像对第一帧所做的一样。我们再设置一个计时器来计算在预处理阶段花费的时间：

while (true) 
{ 
    // start full pipeline timer 
    auto start_full_time = high_resolution_clock::now(); 
 
    // start reading timer 
    auto start_read_time = high_resolution_clock::now(); 
 
    // capture frame-by-frame 
    capture >> frame; 
 
    if (frame.empty()) 
        break; 
 
    // end reading timer 
    auto end_read_time = high_resolution_clock::now(); 
 
    // add elapsed iteration time 
    timers["reading"].push_back(duration_cast(end_read_time - start_read_time).count() / 1000.0); 
 
    // start pre-process timer 
    auto start_pre_time = high_resolution_clock::now(); 
 
    // resize frame 
    cv::resize(frame, frame, Size(960, 540), 0, 0, INTER_LINEAR); 
 
    // convert to gray 
    cv::Mat current_frame; 
    cv::cvtColor(frame, current_frame, COLOR_BGR2GRAY); 
 
    // end pre-process timer 
    auto end_pre_time = high_resolution_clock::now(); 
 
    // add elapsed iteration time 
    timers["pre-process"].push_back(duration_cast(end_pre_time - start_pre_time).count() / 1000.0);

4.计算密集光流

我们使用称为calcOpticalFlowFarneback的方法来计算两帧之间的密集光流：

// start optical flow timer 
auto start_of_time = high_resolution_clock::now(); 
 
// calculate optical flow 
cv::Mat flow; 
calcOpticalFlowFarneback(previous_frame, current_frame, flow, 0.5, 5, 15, 3, 5, 1.2, 0); 
 
// end optical flow timer 
auto end_of_time = high_resolution_clock::now(); 
 
// add elapsed iteration time 
timers["optical flow"].push_back(duration_cast(end_of_time - start_of_time).count() / 1000.0);

5.后处理

Farneback的“光流法“输出二维流矢量。我们将这些输出转换为极坐标，以通过色相获得流动的角度（方向），并通过HSV颜色表示的值获得流动的距离（幅度）。对于可视化，我们现在要做的就是将结果转换为BGR空间。之后，我们停止所有剩余的计时器以获取经过的时间：

// start post-process timer 
auto start_post_time = high_resolution_clock::now(); 
 
// split the output flow into 2 vectors 
cv::Mat flow_xy[2], flow_x, flow_y; 
split(flow, flow_xy); 
 
// get the result 
flow_x = flow_xy[0]; 
flow_y = flow_xy[1]; 
 
// convert from cartesian to polar coordinates 
cv::cartToPolar(flow_x, flow_y, magnitude, angle, true); 
 
// normalize magnitude from 0 to 1 
cv::normalize(magnitude, normalized_magnitude, 0.0, 1.0, NORM_MINMAX); 
 
// get angle of optical flow 
angle *= ((1 / 360.0) * (180 / 255.0)); 
 
// build hsv image 
hsv[0] = angle; 
hsv[2] = normalized_magnitude; 
merge(hsv, 3, merged_hsv); 
 
// multiply each pixel value to 255 
merged_hsv.convertTo(hsv_8u, CV_8U, 255); 
 
// convert hsv to bgr 
cv::cvtColor(hsv_8u, bgr, COLOR_HSV2BGR); 
 
// update previous_frame value 
previous_frame = current_frame; 
 
// end post pipeline timer 
auto end_post_time = high_resolution_clock::now(); 
 
// add elapsed iteration time 
timers["post-process"].push_back(duration_cast(end_post_time - start_post_time).count() / 1000.0); 
 
// end full pipeline timer 
auto end_full_time = high_resolution_clock::now(); 
 
// add elapsed iteration time 
timers["full pipeline"].push_back(duration_cast(end_full_time - start_full_time).count() / 1000.0);

6.可视化

我们将尺寸调整为960×540的原始帧可视化，并使用imshow函数显示结果：

// visualization 
imshow("original", frame); 
imshow("result", bgr); 
int keyboard = waitKey(1); 
if (keyboard == 27) 
    break;

这是一个示例“ boat.mp4”视频的内容：

7.时间和FPS计算

我们要做的就是计算流程中每一步花费的时间，并测量光流部分和整个流程的FPS：

// elapsed time at each stage 
cout << "Elapsed time" << std::endl; 
for (auto const& timer : timers) 
{ 
    cout << "- " << timer.first << " : " << accumulate(timer.second.begin(),         timer.second.end(), 0.0) << " seconds"<< endl; 
} 
 
// calculate frames per second 
cout << "Default video FPS : "  << fps << endl; 
float optical_flow_fps  = (num_frames - 1) / accumulate(timers["optical flow"].begin(),  timers["optical flow"].end(),  0.0); 
cout << "Optical flow FPS : "   << optical_flow_fps  << endl; 
 
float full_pipeline_fps = (num_frames - 1) / accumulate(timers["full pipeline"].begin(), timers["full pipeline"].end(), 0.0); 
cout << "Full pipeline FPS : "  << full_pipeline_fps << endl;

GPU端

该算法在将其移至CUDA时保持不变，但在GPU使用方面存在一些差异。让我们再次遍历整个流程，看看有什么变化：

1.视频及其属性

此部分在CPU和GPU部分都是通用的，因此保持不变。

2.读取第一帧

注意，我们使用相同的CPU函数来读取和调整大小，但是将结果上传到cv :: cuda :: GpuMat（cuda_GpuMat）实例：

// resize frame 
cv::resize(frame, frame, Size(960, 540), 0, 0, INTER_LINEAR); 
 
// convert to gray 
cv::cvtColor(frame, previous_frame, COLOR_BGR2GRAY); 
 
// upload pre-processed frame to GPU 
cv::cuda::GpuMat gpu_previous; 
gpu_previous.upload(previous_frame); 
 
// declare cpu outputs for optical flow 
cv::Mat hsv[3], angle, bgr; 
 
// declare gpu outputs for optical flow 
cv::cuda::GpuMat gpu_magnitude, gpu_normalized_magnitude, gpu_angle; 
cv::cuda::GpuMat gpu_hsv[3], gpu_merged_hsv, gpu_hsv_8u, gpu_bgr; 
 
// set saturation to 1 
hsv[1] = cv::Mat::ones(frame.size(), CV_32F); 
gpu_hsv[1].upload(hsv[1]);

3.读取和预处理其它帧

while (true) 
{ 
    // start full pipeline timer 
    auto start_full_time = high_resolution_clock::now(); 
 
    // start reading timer 
    auto start_read_time = high_resolution_clock::now(); 
 
    // capture frame-by-frame 
    capture >> frame; 
 
    if (frame.empty()) 
        break; 
 
    // upload frame to GPU 
    cv::cuda::GpuMat gpu_frame; 
    gpu_frame.upload(frame); 
 
    // end reading timer 
    auto end_read_time = high_resolution_clock::now(); 
 
    // add elapsed iteration time 
    timers["reading"].push_back(duration_cast(end_read_time - start_read_time).count() / 1000.0); 
 
    // start pre-process timer 
    auto start_pre_time = high_resolution_clock::now(); 
 
    // resize frame 
    cv::cuda::resize(gpu_frame, gpu_frame, Size(960, 540), 0, 0, INTER_LINEAR); 
 
    // convert to gray 
    cv::cuda::GpuMat gpu_current; 
    cv::cuda::cvtColor(gpu_frame, gpu_current, COLOR_BGR2GRAY); 
 
    // end pre-process timer 
    auto end_pre_time = high_resolution_clock::now(); 
 
    // add elapsed iteration time 
    timers["pre-process"].push_back(duration_cast(end_pre_time - start_pre_time).count() / 1000.0);

4.计算密集光流

我们首先使用cv :: cuda :: FarnebackOpticalFlow :: create（cv2.cudaFarnebackOpticalFlow.create）创建cudaFarnebackOpticalFlow类的实例，然后调用cv :: cuda：FarnebackOpticalFlow :: calc（cv2.cuda_FarnebackOpticalFlow.calc）计算两个帧之间的光流，而不是使用cv :: calcOpticalFlowFarneback（cv2.calcOpticalFlowFarneback）函数调用。

// start optical flow timer 
auto start_of_time = high_resolution_clock::now(); 
 
// create optical flow instance 
Ptr ptr_calc = cuda::FarnebackOpticalFlow::create(5, 0.5, false, 15, 3, 5, 1.2, 0); 
// calculate optical flow 
cv::cuda::GpuMat gpu_flow; 
ptr_calc->calc(gpu_previous, gpu_current, gpu_flow); 
 
// end optical flow timer 
auto end_of_time = high_resolution_clock::now(); 
 
// add elapsed iteration time 
timers["optical flow"].push_back(duration_cast(end_of_time - start_of_time).count() / 1000.0);

5.后处理

对于后处理，我们使用与CPU端使用的功能相同的GPU变体：

// start post-process timer 
auto start_post_time = high_resolution_clock::now(); 
 
// split the output flow into 2 vectors 
cv::cuda::GpuMat gpu_flow_xy[2]; 
cv::cuda::split(gpu_flow, gpu_flow_xy); 
 
// convert from cartesian to polar coordinates 
cv::cuda::cartToPolar(gpu_flow_xy[0], gpu_flow_xy[1], gpu_magnitude, gpu_angle, true); 
 
// normalize magnitude from 0 to 1 
cv::cuda::normalize(gpu_magnitude, gpu_normalized_magnitude, 0.0, 1.0, NORM_MINMAX, -1); 
 
// get angle of optical flow 
gpu_angle.download(angle); 
angle *= ((1 / 360.0) * (180 / 255.0)); 
 
// build hsv image 
gpu_hsv[0].upload(angle); 
gpu_hsv[2] = gpu_normalized_magnitude; 
cv::cuda::merge(gpu_hsv, 3, gpu_merged_hsv); 
 
// multiply each pixel value to 255 
gpu_merged_hsv.cv::cuda::GpuMat::convertTo(gpu_hsv_8u, CV_8U, 255.0); 
 
// convert hsv to bgr 
cv::cuda::cvtColor(gpu_hsv_8u, gpu_bgr, COLOR_HSV2BGR); 
 
// send original frame from GPU back to CPU 
gpu_frame.download(frame); 
 
// send result from GPU back to CPU 
gpu_bgr.download(bgr); 
 
// update previous_frame value 
gpu_previous = gpu_current; 
 
// end post pipeline timer 
auto end_post_time = high_resolution_clock::now(); 
 
// add elapsed iteration time 
timers["post-process"].push_back(duration_cast(end_post_time - start_post_time).count() / 1000.0); 
 
// end full pipeline timer 
auto end_full_time = high_resolution_clock::now(); 
 
// add elapsed iteration time 
timers["full pipeline"].push_back(duration_cast(end_full_time - start_full_time).count() / 1000.0);

可视化、时间和FPS计算与CPU端相同。

结果

现在，我们可以在示例视频中比较来自CPU和GPU版本的指标。

我们用于CPU的配置为：

Intel Core i7-8700

Configuration
- device : cpu
- video file : video/boat.mp4
Number of frames: 320
Elapsed time
- full pipeline : 37.355 seconds
- reading : 3.327 seconds
- pre-process : 0.027 seconds
- optical flow : 32.706 seconds
- post-process : 0.641 seconds
Default video FPS : 29.97
Optical flow FPS : 9.75356
Full pipeline FPS : 8.53969

用于GPU的配置为：

Nvidia GeForce GTX 1080 Ti

Configuration
- device : gpu
- video file : video/boat.mp4
Number of frames: 320
Elapsed time
- full pipeline : 8.665 seconds
- reading : 4.821 seconds
- pre-process : 0.035 seconds
- optical flow : 1.874 seconds
- post-process : 0.631 seconds
Default video FPS : 29.97
Optical flow FPS : 170.224
Full pipeline FPS : 36.8148

当我们使用CUDA加速时，这使光流计算的速度提高了约17倍！但是不幸的是，我们生活在现实世界中，并不是所有的流程阶段都可以加速。因此，对于整个流程，我们只能获得约4倍的加速。

总结

本文我们概述了GPU OpenCV模块并编写了一个简单的演示，以了解如何加速Farneback的Optical Flow算法。我们研究了OpenCV为该模块提供的API，您也可以重用该API来尝试使用CUDA加速OpenCV算法。

本文仅做学术分享，如有侵权，请联系删文。

下载1

在「计算机视觉工坊」公众号后台回复：深度学习，即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。

下载2

在「计算机视觉工坊」公众号后台回复：计算机视觉，即可下载计算机视觉相关17本pdf书籍，包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。

下载3

在「计算机视觉工坊」公众号后台回复：SLAM，即可下载独家SLAM相关视频课程，包含视觉SLAM、激光SLAM精品课程。

重磅！计算机视觉工坊-学习交流群已成立
扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群，目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近3000星球成员为创造更好的AI世界共同进步，知识星球入口：
学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

一文详解OpenCV中的CUDA模块

圈里有高质量教程资料、可答疑解惑、助你高效解决问题觉得有用，麻烦给个赞和在看~

你可能感兴趣的:(人工智能,编程语言,opencv,大数据,机器学习)

圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~