计算机视觉视频云音视频视频编码

无人机动态追踪技术难点与距离分析！

传统计算机视觉方法（如光流法、卡尔曼滤波）易受干扰，需结合深度学习（如YOLO、SiamRPN++）提升抗干扰能力。

云卓SKYDROID·2025-03-12 01:15

仿射变换矩阵应用

目录1原理介绍2数学公式推导3计算流程4示例代码仿射变换是计算机视觉、图像处理和点云处理中常用的几何变换之一。它不仅包括旋转和平移，还包括缩放和剪切等线性变换。仿射变换保持了点、直线和平面的平行性。

点云学习·2025-03-11 23:57

H800实战应用深度解析endofsentence

下表展示了H800在不同场景下的性能表现对比：场景类型训练速度提升推理延迟降低能效比提升自然语言处理35%22%40%计算机视觉28%18%33%推荐系统41%29%37%资深系统架构师指出："H800

智能计算研究中心·2025-03-11 22:12

Windows Bili23 Downloader-v1.56.1-开源B站视频下载工具[支持视频/番剧/电影/纪录片等资源]

pwd=npve#支持投稿视频\剧集\课程\直播链接解析支持短链接\活动页（如拜年祭、二游新春会）链接解析支持弹幕\字幕\封面下载支持修改剧集列表显示方式，一键显示全部视频支持自定义清晰度\音质\视频编码支持仅下载音频

私人珍藏库·2025-03-11 20:36

Html5学习教程，从入门到精通， HTML5超链接应用的详细语法知识点和案例代码（18）

超链接的定义超链接是指从一个网页指向一个目标的连接关系，这个目标可以是另一个网页，也可以是相同网页上的不同位置，还可以是一个图片、动画、程序、电子邮件地址、文件，甚至是一个音视频文件。

知识分享小能手·2025-03-11 20:33

NTIRE比赛：技术前沿、国内企业表现与计算机视觉未来展望

一、NTIRE比赛概述：图像恢复与增强领域的全球竞技场1.1NTIRE的定位与历史NTIRE（NewTrendsinImageRestorationandEnhancement）是计算机视觉领域最具影响力的国际赛事之一

AndrewHZ·2025-03-11 19:21

Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化

想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习

是Dream呀·2025-03-11 17:35

HarmonyNext实战：基于ArkTS的高性能音视频播放器开发

HarmonyNext实战：基于ArkTS的高性能音视频播放器开发引言在HarmonyNext生态系统中，音视频播放是一个复杂且具有挑战性的领域。

·2025-03-11 15:00

HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发

HarmonyNext实战案例：基于ArkTS的高性能音视频处理应用开发引言在HarmonyNext生态系统中，ArkTS作为新一代的编程语言，为开发者提供了强大的工具来构建高性能、跨平台的应用。

·2025-03-11 15:00

《 YOLOv5、YOLOv8、YOLO11训练的关键文件：data.yaml文件编写全解》

走进YOLOv5、YOLOv8、YOLO11的data.yaml在计算机视觉领域的广袤星空中，目标检测无疑是一颗璀璨的明星，它广泛应用于自动驾驶、智能安防、工业检测、医疗影像分析等众多关键领域，发挥着不可或缺的作用

空云风语·2025-03-11 15:51

机器学习之线性代数

矩阵：AI数据的强大容器（一）矩阵的定义（二）矩阵运算（三）矩阵特性（四）矩阵分解（五）Python示例（使用NumPy库）四、线性代数在AI中的应用（一）数据表示（二）降维：PCA（三）线性回归（四）计算机视觉

珠峰日记·2025-03-11 15:20

深度解析：DETR的多尺度特征融合

"深度解析：DETR的多尺度特征融合"作者：禅与计算机程序设计艺术1.背景介绍1.1目标检测的挑战与传统方法的局限性目标检测是计算机视觉领域中的一个基本任务，其目标是识别图像或视频中所有感兴趣的目标，并确定它们的位置和类别

AI天才研究院·2025-03-11 15:17

目标检测项目

识别图片中有哪些物体并且找到物体的存在位置多任务：位置+类别目标种类与数量繁多的问题目标尺度不均的问题遮挡、噪声等外部环境干扰VOC数据集：PASCALVOC挑战赛(ThePASCALVisualObjectClasses)是一个世界级的计算机视觉挑战赛

sho_re·2025-03-11 11:51

HarmonyNext实战：基于ArkTS的跨平台音视频流媒体应用开发

HarmonyNext实战：基于ArkTS的跨平台音视频流媒体应用开发引言在HarmonyNext生态系统中，音视频流媒体应用是一个复杂且技术含量较高的领域。

·2025-03-11 11:50

点云语义分割：PointNet++在S3DIS数据集上的训练

点云语义分割：PointNet++在S3DIS数据集上的训练点云语义分割是计算机视觉领域的一个重要任务，旨在将点云数据中的每个点分配给其对应的语义类别。

完美代码·2025-03-11 00:25

基于YOLOv5的烟雾检测系统：从数据集准备到UI界面实现

因此，烟雾检测的研究一直是计算机视觉领域中的一个热点问题。

深度学习&目标检测实战项目·2025-03-11 00:52

计算机视觉｜3D 点云处理黑科技：PointNet++ 原理剖析与实战指南

一、引言在当今数字化与智能化快速发展的时代，3D点云处理技术在多个前沿领域中发挥着重要作用。特别是在自动驾驶和机器人视觉等领域，这项技术已成为实现智能化的关键支撑。以自动驾驶为例，车辆需要实时感知周围复杂的环境信息，包括行人、车辆、交通标志和路况等。3D点云数据能够提供高精度的三维空间信息，使自动驾驶车辆更准确地识别和定位周围物体，从而做出安全、合理的行驶决策。在城市街道上，自动驾驶车辆通过3D点

紫雾凌寒·2025-03-10 23:19

【基于手势识别的音量控制系统】

基于手势识别的音量控制系统github项目效果这是一个结合了计算机视觉和系统控制的实用项目，通过识别手势来实现音量的无接触控制，同时考虑到了用户隐私，加入了实时人脸遮罩功能。

合肥玉安人工智能工作室·2025-03-10 21:31

openharmony 富对富 WiFi投屏设计

拥有流媒体协议接入、媒体预览、媒体转分发能力，受投播管理服务管理和调用，是音视频投播子系统重要的流媒体能力部件。

月上柳青·2025-03-10 21:31

利用CUDA与OpenCV实现高效图像处理：全面指南

利用CUDA与OpenCV实现高效图像处理：全面指南前言在现代计算机视觉领域，图像处理的需求日益增加。无论是自动驾驶、安防监控，还是医疗影像分析，图像处理技术都扮演着至关重要的角色。

快撑死的鱼·2025-03-10 16:25

【无标题】

1.计算机视觉与图像处理计算机视觉技术涵盖从图像预处理到目标检测的全流程，是工业视觉系统的核心部分。

东东就是我·2025-03-10 16:54

解析：婚恋交友系统APP源码开发攻略,语音视频聊天功能实现步骤核心功能

系统功能特点1.自定义小程序管理：本系统提供完整的后台管理功能，开发者可以根据自己的需求进行定制和修改，包括但不限于论坛版块管理、帖子管理、用户管理等功能。后台管理界面简洁明了，操作方便，大大降低了开发门槛。2.完整的安装代码包：本系统提供完整的安装代码包，包括小程序前端代码、后端服务代码以及数据库结构等。开发者只需按照说明进行安装和配置，即可快速搭建起一个功能完备的社区论坛小程序。3.丰富的功能

·2025-03-10 13:42

PSPNet在图像超分辨率中的应用

PSPNet在图像超分辨率中的应用1.背景介绍图像超分辨率(ImageSuper-Resolution,ISR)是计算机视觉领域的一个重要研究方向,旨在从低分辨率图像中重建高分辨率图像。

AI天才研究院·2025-03-10 12:55

多宠识别：基于计算机视觉的智能宠物管理系统架构解析

一、行业痛点与技术方案演进在多宠家庭场景中，传统方案面临三大技术瓶颈：1.生物特征混淆：同品种/毛色宠物识别准确率低于65%2.动态场景适应：进食/奔跑状态下的误检率达30%+3.数据孤岛问题：离线设备无法实现持续学习优化快瞳科技采用**双模态视觉融合架构**，结合轻量化YOLOv7-Tiny模型与CLIP多模态大模型，实现：-98.7%的跨品种宠物识别准确率（CVPR2024最新测试数据）-单次

深圳市快瞳科技有限公司·2025-03-10 11:49

Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）

代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。

境心镜·2025-03-10 08:54

优化UDP在实时传输中的可靠性

虽然UDP（用户数据报协议）本身是无连接的、不可靠的传输协议，但在实时音视频传输等需要低延迟的应用中，可以通过一些机制来优化其可靠性。

白总Server·2025-03-10 05:05

构建一个完整的视觉Transformer（ViT）图像分类模型 VIT （vision transformer）图像分类

计算机视觉、图像处理、毕业辅导、作业帮助、代码获取，远程协助，代码

Jackie_AI·2025-03-10 04:29

【人工智能基础】生成模型：让数据“无中生有”的神奇魔法

生成对抗网络（GAN）2、变分自编码器（VAE）3、扩散模型（DPM）4、基于能量的模型（EBM）5、正规化流（NF）四、生成模型对比分析五、生成模型的应用拓展一、生成模型的发展脉络在深度学习尚未兴起的时期，计算机视觉领域的传统图像生成算法主要依赖纹理合成和纹理映射等技术

roman_日积跬步-终至千里·2025-03-10 03:49

C语言基础系列【20】内存管理

博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章

程序喵大人·2025-03-09 23:43

Imagen原理与代码实例讲解

传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。

AI天才研究院·2025-03-09 22:05

PyTorch：Python深度学习框架使用详解

PyTorch是一个开源的机器学习库，广泛用于计算机视觉和自然语言处理领域。它由Facebook的AI研究团队开发，因其动态计算图、易用性以及与Python的紧密集成而受到开发者的青睐。

零度°·2025-03-09 21:25

大规模语言模型构建流程

2.预训练语言模型受到计算机视觉领域采用ImageNet对模型进行一次预训练，使得模型可以通过海量图像充分学习如何提取特征，然后再根据任务目标进行模型精调的预训练范式影响，自然语言处理

人工智能技术笔记·2025-03-09 15:34

新一代 AI 软件Manus 将重新将AI市场大洗牌

Manus是一家专注于手部追踪、虚拟现实（VR）和增强现实（AR）技术的公司，其新一代AI软件结合了先进的机器学习和计算机视觉技术，致力于提升人机交互的自然性和效率。

CircuitWizard·2025-03-09 13:23

在 PiscTrace 上使用 YOLO 进行预测与 MiDaS 景深补偿：体验纯视觉自动驾驶的数据分析

PiscTrace作为一款支持高效视图处理的桌面应用，集成了先进的计算机视觉工具，如YOLO目标检测模型和MiDaS景深估计模型，能够为纯视觉自动驾驶的实现提供强大的支持。

那雨倾城·2025-03-09 10:30

专业英语

4)编译原理(5)离散数学2.软件开发(1)编程词汇(2)开发术语(3)Linux(4)软件3.就业领域(1)职场(2)芯片(3)自动驾驶(4)嵌入式硬件4.深度学习(1)论文(2)深度学习DL(3)计算机视觉

程序员爱德华·2025-03-09 08:55

基于FPGA的图像中值滤波Verilog实现及MATLAB辅助验证

基于FPGA的图像中值滤波Verilog实现及MATLAB辅助验证图像处理是计算机视觉和图像识别领域的重要组成部分。

CodeWG·2025-03-09 04:26

基于YOLOv5的无人机农田监测系统实现与UI界面设计

无人机农田监测结合了无人机的高空拍摄能力和计算机视觉技术，能够实时获取农田的图像数据，并对作物生长状态、病虫害检测、土地使用情况等进行智能分析。

深度学习&目标检测实战项目·2025-03-08 16:52

【Hugging Face】datasets 库：加载、处理和分享大规模数据集

HuggingFaceDatasets库HuggingFace的datasets库是一个轻量级、高性能的库，用于加载、处理和分享大规模数据集，特别适用于自然语言处理（NLP）、计算机视觉（CV）和语音任务

彬彬侠·2025-03-08 15:28

WebRTC简介及实战应用 — 从0到1实现实时音视频聊天等功能

一、WebRTC简介WebRTC是由一家名为GobalIPSolutions，简称GIPS的瑞典公司开发的。Google在2011年收购了GIPS，并将其源代码开源。然后又与IETF和W3C的相关标准机构合作，以确保行业达成共识。其中：WebReal-TimeCommunications(WEBRTC)W3C组织：定义浏览器API。Real-TimeCommunicationinWeb-brows

不怕麻烦的鹿丸·2025-03-08 13:34

EasyRTC嵌入式音视频通话SDK：基于ICE与STUN/TURN的实时音视频通信解决方案

在当今数字化时代，实时音视频通信技术已成为人们生活和工作中不可或缺的一部分。

EasyCVR·2025-03-08 12:23

WebRTC简介

WebRTC简介WebRTC（WebReal-TimeCommunication）是一种支持浏览器之间进行实时音视频通信和数据传输的开放标准和技术。

小柒的博客·2025-03-08 12:53

抖音采集工具Gui版：高效无水印下载抖音视频的神器

它专为抖音视频下载设计，能够帮助用户轻松获取抖音平台上的各种视频资源，支持批量下载，极大地提升了下载效率。全面的资源采集支持采集抖音作品、Webp动态封面、短剧、喜欢、话题、音乐等多种内容。

东风西巷·2025-03-08 11:33

【Python运维】实现高效的自动化备份与恢复：Python脚本从入门到实践

《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！

蒙娜丽宁·2025-03-08 10:59

颜永红:大模型时代的智能音频处理 | 演讲嘉宾公布

大会由中国电子音响行业协会、上海市浦东新区先进音视频技术协会共同主办，上海国展展览中心有限公司承办。

声光界·2025-03-08 09:24

目标检测YOLO实战应用案例100讲-TDI线阵相机

计算机视觉就是让计算机去理解获取数字图像与视频中的信息。最终实现一个与人类视觉系统实现相同功能的自动化系统。什么是机器视觉中的图像的前置知识——颜色模型？最为常用的颜色模型，分别是RGB颜

林聪木·2025-03-08 08:49

人工智能与深度学习的应用案例：从技术原理到实践创新

从计算机视觉到自然语言处理，从医疗诊断到工业制造，深度学习通过模拟人脑神经网络的层次化学习机制，实现了对复杂数据的高效分析与决策。

accurater·2025-03-08 08:07

双目立体视觉（6.1）测距

在计算机视觉领域，双目相机测距是一项关键技术，它通过模拟人类双眼的视觉机制，利用两个相机从不同角度拍摄同一场景，进而计算出物体的深度信息。

2501_90596733·2025-03-08 08:01

FFmpeg 4.3 音视频-多路H265监控录放C++开发十三：将AVFrame转换成AVPacket。视频编码原理.编码相关api，H264特殊参数说明

前提：从前面的学习我们知道AVFrame中是最原始的视频数据，这一节开始我们需要将这个最原始的视频数据压缩成AVPacket数据，我们前面，将YUV数据或者RGBA数据装进入了AVFrame里面，并且在SDL中显示。也就是说：对于安防项目来说，我们将原始从摄像头数据(YUV,RGB)转换成AVFrame后，可以直接显示出来。但是如果我们将要数据存储，则要将AVFrame转成AVPacket.视频编

hunandede·2025-03-08 07:51

音视频入门基础：RTP专题（13）——SDP的packetization-mode

一、引言由《音视频入门基础：RTP专题（3）——SDP简介》可以知道，SDP中的packetization-mode表示RTP有效载荷类型的属性或接收器实现的功能。

崔杰城·2025-03-08 05:39

B站自研的第二代视频连麦系统（上）

导读本系列文章将从客户端、服务器以及音视频编码优化三个层面，介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解，帮助开发者更全面地了解WebRTC的核心技术与实践应用。

哔哩哔哩技术·2025-03-08 05:25

推荐频道