计算机视觉视频云音视频视频编码第25页

深度学习常见数据集格式解析

VOCVOC（VisualObjectClasses）是一个流行的计算机视觉数据集，用于目标检测、图像分类和语义分割等任务。VOC数据集包含了多个类别的物体，如人、汽车、动物等，每个物体类别都有其对

不想动脑筋的亮亮·2024-01-17 04:15

H264/AVC的句法和语义

所有的视频编码标准都是通过定义句法和语义来规范编解码器的工作流程。句法元素的分层结构句法元素的分层结构：编码器输出的比特码流中，每个比特都隶属某个句法元素，也就是说，码流是由一个个句法

DogDaoDao·2024-01-17 03:53

国内镜像：极速下载编译WebRTC源码(For Android/Linux/IOS)(二十四)

简介：CSDN博客专家，专注Android/Linux系统，分享多mic语音方案、音视频、编解码等技术，与大家一起成长！

Android系统攻城狮·2024-01-17 01:03

[易语言]使用易语言部署工业级人脸检测模型

【框架地址】https://github.com/ShiqiYu/libfacedetection【算法介绍】Libfacedetection是一个开源的计算机视觉库，主要用于实时的人脸检测。

FL1623863129·2024-01-17 00:00

智能分析网关V4基于AI视频智能分析技术的周界安全防范方案

A智能分析网关V4基于深度学习和计算机视觉技术，可以通过多种AI周界防范算法，实时、精准地监测人员入侵行为，及时发现异常情况并发出警报，保障周界安全。

TSINGSEE·2024-01-16 23:38

CNN和Transformer相结合的模型

©作者|小欣CNN广泛应用于计算机视觉的各种任务中，比如分类，检测，分割，CNN通过共享卷积核提取特征，减少网络参数数量，提高模型效率，另一方面CNN具有平移不变性，即无论特征被移动到图像的哪个位置，网络都能检测到这些特征

CV案例精选·2024-01-16 23:01

自动驾驶二维激光雷达标定板

自动驾驶是人类智慧的结晶，它融合了多种高科技技术，包括传感器技术、计算机视觉、人工智能等，它让汽车具备了自主感知和决策的能力，可以在复杂多变的道路环境中自如应对。

JYGD686868·2024-01-16 23:04

Android Media3 ExoPlayer 如何正确设置缓存大小

在播放音视频时，如何开启AndroidMedia3ExoPlayer缓存，请参考笔者另外一篇文章：AndroidMedia3Exoplayer开启缓存功能笔者在设置ExoPlayer的缓存大小时，遇到一个非常奇怪的问题

思涛的博客·2024-01-16 23:56

大模型背景下计算机视觉年终思考小结（一）

1.引言在过去的十年里，出现了许多涉及计算机视觉的项目，举例如下：使用射线图像和其他医学图像领域的医学诊断应用使用卫星图像分析建筑物和土地利用率相关应用各种环境下的目标检测和跟踪，如交通流统计、自然环境垃圾检测估计等上述应用所采用的计算机视觉的方法遵循统一的标准流程

赵卓不凡·2024-01-16 22:05

大模型背景下计算机视觉年终思考小结（二）

1.引言尽管在过去的一年里大模型在计算机视觉领域取得了令人瞩目的快速发展，但是考虑到大模型的训练成本和对算力的依赖，更多切实的思考是如果在我们特定的小规模落地场景下的来辅助我们提升开发和落地效率。

赵卓不凡·2024-01-16 22:01

高省_飞智666600·2024-01-16 21:27

音视频-SDL的简单使用

使用SDL进行音视频的播放SDL（SimpleDirectMediaLayer）是一套开放源代码的跨平台多媒体开发库，使用C语言写成。

星辰有行·2024-01-16 20:44

智能时代下的我们

2015年微软的ResNet提出，取得了当时图像识别比赛上面最好的成绩，到目前为止，深度残差网络在计算机视觉的研究中被广泛应用，并且被集成到微软还有其他大公司的产品中。

jimyang1ss·2024-01-16 19:41

【音视频基础】(八)：CIE颜色空间四之从CIE xyY到CIE YUV

本篇隶属于文集：《零基础入门音视频开发》，查看文集全部文章，请点击文字链接。

金架构·2024-01-16 19:18

飞凌RZ/G2L的开发板实上的时视频编码推流设计与实现

飞凌RZ/G2L的开发板测评--实时视频编码推流设计与实现大信(QQ:8125036)在完成RZ/G2L板上视频采集的试用测试基础上，逐渐熟悉了RZ/G2L开发板的SDK，在研究过它的音视频硬件与软件包后

lutherluov·2024-01-16 18:09

也谈人工智能——AI科普入门

文章目录1.科普入门人工智能的定义人工智能的类型-弱AI与强AI人工智能、深度学习与机器学习人工智能的应用和使用场景语音识别计算机视觉客户服务建议引擎数据分析网络安全行业应用人工智能发展史!

星猿杂谈·2024-01-16 18:51

反光衣识别摄像机

反光衣识别摄像机是一种利用计算机视觉和图像识别技术结合反光材料的特性来识别反光衣的装置。

博瓦科技·2024-01-16 18:13

【小智好书分享• 第一期】深度学习计算机视觉

目录一、内容简介二、内页插图三、书籍目录四、粉丝福利博客主页：小智_x0___0x_欢迎关注：点赞收藏✍️留言系列专栏：好书分享代码仓库：小智的代码仓库一、内容简介计算机视觉有多先进?

.小智·2024-01-16 18:09

计算机视觉的应用

计算机视觉（ComputerVision）是一门研究如何让计算机能够理解和分析数字图像或视频的学科。简单来说，计算机视觉的目标是让计算机能够像人类一样对视觉信息进行处理和理解。

人工智能技术与咨询·2024-01-16 17:42

人工智能工程师证书怎么考的呢

人工智能技术与咨询·2024-01-16 17:38

标准卷积、深度可分离卷积与GSConv，YOLOv8引入SlimNeck

摘要：目标检测是计算机视觉中一项重要的下游任务。对于嵌入式边缘计算平台来说，很难实现实时检测的要求，使用巨大的模型也是困难的。此外，由大量深度可分离卷积层构建的轻量级模型无法达到足够的准确性。

masterMono·2024-01-16 16:31

AIGC必备知识点：你不可不知的CNN（卷积神经网络）-知识全解析！

(ConvolutionalNeuralNetwork，CNN)是一类主要用于计算机视觉领域的深度学习算法，它被广泛地运用于包括图像和视频识别、自然语言处理等，以游戏领域为例，CNN可以用于训练NPC（

OJAC近屿智能·2024-01-16 14:03

佛像控制点质心提取（附代码）

计算机视觉老师让写空间后方交会求解相机外部参数的代码。具体就是老师会给一张相片，相片上

司徒北·2024-01-16 13:31

WebRTC视频会议/视频客服系统EasyRTC进入会议室密码验证的开发与实现

基于WebRTC技术的EasyRTC视频会议系统，建设目标是让用户随时随地、快捷方便地进行视频会议，并根据行业需求有针对性地提供多样化、个性化功能，该系统是覆盖全球的实时音视频开发平台，支持一对一、一对多等视频通话

TSINGSEE·2024-01-16 12:21

OpenCV-Python(43):姿势估计

目标学习了解calib3D模块学习在图像中创建3D效果calib3D模块OpenCV-Python的calib3D模块是OpenCV库中的一个重要模块，用于摄像头标定和三维重建等计算机视觉任务。

图灵追慕者·2024-01-16 11:32

计算机视觉实践案例-漫画翻译

知识点VisualStudioToolsforAIMicrosoftAzure上的服务申请流程微软认知服务（影像服务/文本翻译服务）的申请与使用小型客户端软件的界面设计与实现概述微软认知服务包括了影像、语音、语言、搜索、知识五大领域，通过对这些认知服务的独立或者组合使用，可以解决很多现实世界中的问题。作为AI小白，我们可以选择艰难地攀登崇山峻岭，也可以选择像牛顿一样站在巨人的肩膀上。本章节的内容就

xiaoshun007～·2024-01-16 10:36

imgaug库指南（25）：从入门到精通的【图像增强】之旅

引言在深度学习和计算机视觉的世界里，数据是模型训练的基石，其质量与数量直接影响着模型的性能。然而，获取大量高质量的标注数据往往需要耗费大量的时间和资源。

高斯小哥·2024-01-16 10:56

Halcon和opencv的区别

问题描述：Halcon和opencv的区别问题解答：Halcon（由MVTecSoftwareGmbH开发）和OpenCV（OpenSourceComputerVisionLibrary）都是计算机视觉领域常用的工具库

神笔馬良·2024-01-16 10:17

书生·浦语大模型实战2

这些模型在各种任务中展现出惊人的性能，比如自然语言处理、计算机视觉、语音识别等。这种模型通常采用深

__如果·2024-01-16 09:54

优化的实时换脸项目——DeepFaceLive

它利用深度学习和计算机视觉算法，能够以惊人的准确度和速度将脸部特征无缝地映射到任何人的脸上。

m1chiru·2024-01-16 07:56

君莫笑lucky·2024-01-16 07:25

计算机视觉市场分析：预计2029年将达到870亿元

计算机视觉在人工智能里可以类比于人类的眼睛，是在感知层上最为重要的核心技术之一。计算机视觉技术模拟生物视觉，将捕捉到的图像中的数据及信息进行分析识别、检测、跟踪等，真正去"识别"和"理解"这些图像。

QYR市场调研所·2024-01-16 06:36

《计算机视觉处理设计开发工程师》

计算机视觉（ComputerVision）是一门研究如何让计算机能够理解和分析数字图像或视频的学科。简单来说，计算机视觉的目标是让计算机能够像人类一样对视觉信息进行处理和理解。

人工智能技术与咨询·2024-01-16 06:05

【EI会议征稿通知】第四届图像处理与智能控制国际学术会议（IPIC 2024）

IPIC2024将围绕“图像处理”、“智能控制”及“计算机视觉”等研究领域展开讨论。此会议旨在为世界

搞科研的小刘选手·2024-01-16 06:58

利用C++进行图像处理与计算机视觉

在C++中进行图像处理与计算机视觉是一个有趣且具有挑战性的任务。C++是一种高效的编程语言，能够提供足够的灵活性和性能，以处理复杂的图像处理和计算机视觉算法。

naer_chongya·2024-01-16 06:49

竞赛保研基于计算机视觉的身份证识别系统

0前言优质竞赛项目系列，今天要分享的是基于机器视觉的身份证识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1实现方法1.1原理1.1.1字符定位在Android移动端摄像头拍摄的图片是彩色图像，上传到服务器后为了读取到身份证上的主要信息，就要去除其他无关的元素，因此对身份证图

iuerfee·2024-01-16 05:42

语义分割数据集

KITTI（KarlsruheInstituteofTechnologyandToyotaTechnologicalInstitute）数据集是一个用于计算机视觉和自动驾驶研究的公开数据集。

TechMasterPlus·2024-01-16 04:27

视频剪辑批量工作流程：视频色调调整让影片更出色，视频制作的方法

操作2、把要调整的视频导入到列表中，先点击面板上的“添加音视频”，然后找到视频先选中文件，再点击“打开”自动导入。

尘隐神明·2024-01-16 01:59

基于AI视频智能分析技术的周界安全防范方案

A智能分析网关V4基于深度学习和计算机视觉技术，可以通过多种AI周界防范算法，实时、精准地监测人员入侵行为，及时发现异常情况并发出警报，保障周界安全。

Black蜡笔小新·2024-01-16 01:54

MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model

MedSegDiff:基于扩散概率模型的医学图像分割摘要：扩散概率模型(Diffusionprobabilisticmodel,DPM)是近年来计算机视觉研究的热点之一。

我在努力学习分割（禁止说我水平差）·2024-01-15 22:17

当我们看手机是在看什么

手机和网络带来的便捷方便是有目共睹有了手机网络世界也变小了，距离也变短了，时间则变快了我们每经过一个场合，大家的姿态差不多都在看手机现在的交往也会从面对面的谈论逐渐转变为手机语音视频的谈论我们原来经常看的书籍

涛声已遥远·2024-01-15 20:21

基于Python实现地标景点识别

目录前言简介地标景点识别的背景地标景点识别的原理卷积神经网络（CNN）的基本原理地标景点识别的工作流程使用Python实现地标景点识别的步骤数据收集数据预处理构建卷积神经网络模型模型训练参考文献前言简介地标景点识别是一种基于计算机视觉技术的应用

摔跤猫子·2024-01-15 19:52

Powershell利用FFmpeg批量合并音视频文件

需求：B站缓存教程类视频p数多，需要对其进行批量合并拼视频。条件：FFmpeg和Powershell根据：ffmpeg-y-i视频文件-i音频文件-codeccopy输出文件代码#获取该目录下所有文件夹完整路径$DirArray=Get-ChildItem-Directory|ForEach-Object{$_.FullName}#开始遍历foreach($nin$DirArray){#视频分流$

Owlious·2024-01-15 18:47

中原焦点团队焦点解决网络初级23期王丹坚持原创分享第221天本周约练第次总第35次（2021.2.17）

家长不注意自己的言行，出口成脏，却责骂孩子说脏话没礼貌；家长沉迷手机游戏，刷抖音视频无法自拔，却在关上手机的时候对冲着玩手机的孩子大发脾气；指责孩子不努力学习事事不如别人家孩子，却在孩子离开的时候大骂他不争气只会躲避

8ede3d21a1c3·2024-01-15 17:21

音视频PTS、DTS

下面是自己的一点理解，如有错误，请指正。I帧，P帧和B帧是MPEG-2的编码规范规定的图像编码首先要理解i、p、bi帧：关键帧，根据当前帧解析视频p帧：帧图像只采用前向时间预测，根据前一帧，解析当前帧。b帧：B帧图像采用双向时间预测，可以大大提高压缩倍数。根据前几帧、本帧、后帧解析当前帧，也就是需要先解码后面的帧才能再解码当前帧。或称双向预测图像，根据临近的前几帧、本帧、后几帧的I或者P图像预测得

小~小·2024-01-15 17:21

音视频中的PTS和DTS及同步

说明：此页是所有索引的集合，从此出发，可以找到博客的所有链接。网络相关索引：https://blog.csdn.net/knowledgebao/article/details/84626184linux基础相关索引：https://blog.csdn.net/knowledgebao/article/details/84315842GStreamer专栏索引：https://blog.csdn.

SoLucky2017·2024-01-15 17:51

视频编码中的I、B、P帧

空余时间下，对之前的工作中所掌握的知识整理以下。一、帧类别概念在H.264压缩标准中I帧、P帧、B帧⽤于表⽰传输的视频画⾯。在视频压缩中，每帧都代表着一幅静止的图像。在实际的视频压缩编码时，会采取各种算法减少数据的容量，其中IPB帧就是最常见的一种算法。二、预测编码预测编码分为帧内预测编码和帧间预测编码1、帧内预测编码I帧I帧⼜称帧内编码帧，又称全帧压缩编码帧，是⼀种⾃带全部信息的独⽴帧，⽆需参考

Eason风云·2024-01-15 17:17

音视频包的pts,dts,duration的由来.

音视频包的pts,dts,duration的由来.pts:演播时间戳dts:解码时间戳duration:播放时长怎样深刻理解这些概念,它们具体代表了什么?

hjjdebug·2024-01-15 17:17

突破二维，迈入三维

作者：小柠檬|来源：3DCV在公众号「3DCV」后台，回复「原论文」可获取论文pdf多视图立体几何（Multi-ViewStereo，MVS）是计算机视觉中重要的研究领域，也是迈入三维计算机视觉研究的重点问题

3DCV·2024-01-15 17:15

推荐频道

计算机视觉视频云音视频视频编码