计算机视觉视频云音视频视频编码第15页

计算机视觉深度学习训练推理框架

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达前言本文整理了一些深度学习训练推理框架，涉及计算机视觉、语音、时序任务上的框架，共计20多种。

小白学视觉·2024-01-31 21:50

2022-04-07 总结与复盘

做得好的地方：1，听力有在坚持；2，开了一场直播，虽然是在尬聊，但是有在坚持，而且比上次熟练多了，没怯场可以做得更好：1，对看不惯的同事应该多点包容心2，资料提交还是有点拖拉今天取得的成就：1，发现了抖音视频下午发的播放率比晚上的还高

吹风筒的_猪·2024-01-31 20:52

使用Mediapipe实现CPU上的实时人脸检测（每秒30帧）

对计算机视觉和人脸检测感兴趣吗？在这个初学者指南中，我们将探讨如何使用Mediapipe和Python进行实时人脸检测。

小北的北·2024-01-31 20:55

使用OpenCV为视频中美女加上眼线

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达计算机视觉是最令人兴奋的领域之一，其应用范围非常广泛。从医学成像到创建最有趣的面部滤镜等各个领域都充分见证了计算机视觉技术的强大。

小白学视觉·2024-01-31 20:54

我一直都在等你

29岁的姑娘小丽正拿着手机刷抖音视频，忽然间露出惊讶的表情，一时怔住了：自己什么时候发过这样的视频？从没有呀！可眼前屏幕里那个女孩怎么和自己长得一模一样？

风萧萧兮兮·2024-01-31 19:06

三维重建经典论文合集汇总

三维重建涉及计算机视觉、图形学等多门知识，是一套非常复杂的系统。

深蓝学院·2024-01-31 18:11

视频编码全流程

视频编解码用到的一些算法：正反傅里叶变换、fft算法dct变换、快速dct变换如何自己实现一个视频编解码器：(1)取一帧作为I帧，类似jpeg压缩编码，也就是rgb转yuv，然后dct去除高频信息。因为这种压缩会造成边界block通常使用插值让边界模糊。(2)运动预测来计算P帧，新的一帧同样做yuv、dct之后，划分为n个宏快(16*16)，与上一个参考值的n个宏快(16*16)进行n*n的双重循

0x13·2024-01-31 17:06

视频编码流程详解

1、视频编码整体流程2、FFmpeg视频编码详细流程从本地读取YUV数据编码为H264格式的数据，然后再存入到本地，编码后的数据有带startcode。与FFmpeg示例音频编码的流程基本一致。

夏之七·2024-01-31 17:06

视频编码结构

VVCVVC标准对应的参考软件平台是VTM(VVCTestModel)两个基本目标1.高压缩性能，定义一套视频编码技术，其压缩性能要远优于以往的同类标准。

一箭辰空·2024-01-31 17:35

如何降低视频编码延迟

降低视频编码延迟可以从多个方面进行优化，这里有一些常见的方法：选择低延迟的编码器：一些编码器专为低延迟设计，如H.264或H.265的低延迟模式。这些编码器通过减少帧间的依赖性来减少延迟。

LittroInno·2024-01-31 17:04

FFmpeg添加MediaCodec硬编码

音视频文章汇总接到需求，做一个iOS和Android两端的编码测试工具，可选编码器，分辨率，帧率，码率控制ABR或CBR，GOP进行转码,查看软编码libx264和硬编码MediaCodec的编码效率和画质以及查看是否少帧

一亩三分甜·2024-01-31 17:30

ffmpeg入门篇-滤镜的基本使用

image从图中可以看到滤镜前后画的是虚线，表示可有可无，在术语中，滤镜指的是在编码之前针对解码器解码出来的原始数据（即音视频帧）进行处理的动作，我们还可以称它为过滤器。

白狼栈·2024-01-31 16:32

抖音上热门的五个小技巧，学会这几个技巧,抖音上热门很简单

高省_飞智666600·2024-01-31 15:03

像素级别图像级别区域级别的疑问

像素级和图片级都是计算机视觉中常用的概念。像素级是指对每个像素进行处理和分析，以便了解图像中的细节信息。在处理过程中，每个像素的颜色和强度都会被考虑进去，因此像素级处理非常精细和准确。

：）�东东要拼命·2024-01-31 11:13

基于YOLOv8深度学习的水稻叶片病害智能诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战

专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！

阿_旭·2024-01-31 10:34

图对比1：GCC

受自然语言处理和计算机视觉在预训练方面的最新进展的启发，我们设计了一个自监督图神经网络预训

Valar_Morghulis·2024-01-31 10:27

浅谈：完成一篇论文的科研历程与经验

作者：彭思达|CCF专业会员浙江大学研究员主要研究方向为三维计算机视觉|本文版权归作者所有文章目录引言阶段1：想idea阶段2：如何做实验阶段3：如何写论文引言完成一篇论文的常见科研历程包括三大阶段：想

猛码Memmat·2024-01-31 09:28

yolov5 deepsort 行人/车辆（检测 +计数+跟踪+测距+测速）

YOLOv5和DeepSORT是两种常用的计算机视觉技术，它们可以结合使用以实现行人和车辆的目标检测和跟踪。这种技术在交通监控、智慧城市等领域中具有广泛的应用。

毕设阿力·2024-01-31 09:37

yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计

该算法在计算机视觉领域具有广泛的应用。首先，YOLOv8算法采用了YouOnlyLookOnce（YOLO）的思想，通过单次前向传递将目标检测问题转化为回归问题。

毕设阿力·2024-01-31 09:06

图卷积网络（Graph Convolution Network，GCN）

图神经网络的出现使其在上述任务中取得了重大突破，比如在社交网络、自然语言处理、计算机视觉甚至生命科学等领域得到了非常广泛的应用。图神经

唯余木叶下弦声·2024-01-31 09:04

音视频数字化（数字与模拟-音频广播）

在互联网飞速发展的今天，每晚能坐在电视机前面的人越来越少，但是每天收听广播仍旧是很多人的习惯。从1906年美国费森登在实验室首次进行无线电广播算起，“广播”系统已经陪伴人们115年了。1916年，收音机开始上市，收音机核心是“矿石”。1920年开始“调幅”广播，1941年开始“调频”广播。我国上海在1923年1月23日首次播送广播节目，全市大约有500多台收音机开始接收广播。1933年“电子管”收

beiger·2024-01-31 08:49

智能音频能力移动端落地实践

文/马金龙整理/LiveVideoStack大家好，我是马金龙，在多媒体算法开发方面有10年的经验，涉及音视频图像文本，音

LiveVideoStack_·2024-01-31 08:47

音视频数字化（数字与模拟-录音机）

之前我们说了【数字与模拟-照相机】照相机的数字化，今天聊聊录音机。说录音机之前，必须说说留声机。留声机是爱迪生1877年宣布发明成功的，研发过程相当复杂，但原理是简单的。声音的本质是“波”，是物体振动产生的。以乐器为例，打击乐就是敲击（鼓、钹、木鱼、木琴、三角铁、编钟……）后产生振动，声音就开始传播了；吹管类乐器，也是一样，气流由唇吹出，流经乐器（孔、缝等），产生振动发声；弹拨类乐器（吉他、琵琶…

beiger·2024-01-31 08:15

《计算机视觉处理设计开发工程师》

近日我们刚刚结束了《计算机视觉处理设计开发工程师》证书第一期培训，培训效果良好，所有学员均通过工信部统一线上考试，坐等证书了。鉴于学员们的反应我们第二期课程如约而至。

人工智能技术与咨询·2024-01-31 08:37

基于Qt 视频播放器mp4/wav/avi/等等（进阶）

Qt历险记·2024-01-31 07:44

有没有好用的语音转文字软件？

1.网易见外这是一个音视频转写的在线平台，不用下载，电脑上进入网页就可以使用。使用方法也很简单：先上传你的视频或音频文件，选择要生成的语言（中文或英文），然后等待文字生成即可。

柚子不是幼稚·2024-01-31 07:56

Opencv + MediaPipe -＞手势识别

一、概述OpenCV（OpenSourceComputerVisionLibrary）是一个跨平台的计算机视觉库，它提供了许多用于图像和视频处理的功能，包括图像和视频的读取、预处理、特征提取、特征匹配、

大大Cameo·2024-01-31 06:51

【OpenCV 编程指南】

OpenSourceComputerVisionLibrary）■OpenCV简介■■■■■■■■OpenCV简介Opencv（OpenSourceComputerVisionLibrary）是一个基于开源发行的跨平台计算机视觉库

光芒Shine·2024-01-31 06:18

opencv+mediapipe 手势识别控制电脑音量(详细注释解析)

识别手掌关键点像素坐标3、根据拇指和食指指尖的坐标，利用勾股定理计算距离4、将距离等比例转为音量大小，控制电脑音量最终的效果是这样的：库首先介绍一下应用的几个库opencvOpenCV是Intel开源计算机视觉库

yf743909·2024-01-31 06:32

OpenCV4.3+VS2017+外部库 win10 64位手动编译x64库

VisualStudio2017步骤4:安装CMake步骤5：CMake加载工程步骤6：OpenCV编译配置步骤7：生成VS2017工程步骤8：编译步骤9：安装参考文献：编译步骤OpenCV是一个开源的计算机视觉库

一个代码工·2024-01-31 06:48

音视频探索(7)：FLV协议在RTMP中的使用

RTMP和HTTP_FLV内部使用FLV协议封装H.264和AAC音视频包，FLV属于大端字节序。FLV格式由FLVHeader+F

老张音视频开发进阶·2024-01-31 06:17

PR转场 700+抖音视频转场素材包含PR调色预设和音效素材

PR转场700+抖音短视频转场过效果PR调色预设模板包（含音效素材）快速，方便，轻松地使您的视频在视觉上变得有趣而令人赞叹！幻灯片，预告片，促销，音乐剪辑，广播，电影，纪录片或演示文稿；助您的每个项目都将更加吸引人！将您的视频提升到一个新的水平！将这些超酷的相机缩放和平移或形状过渡添加到您的视频作品中吧！视频预览及原文链接：https://prmuban.com/12220.html更多：pr转场

电脑周边·2024-01-31 06:37

支付宝应用的开源组件

它包括了目前领先的音/视频编码库libavcodec。

夜风月圆·2024-01-31 05:16

基于PaddleDetection的锥桶检测并在Gazebo环境中实现部署

感兴趣的方向有：计算机视觉、迁移学习、推理部署。

飞桨PaddlePaddle·2024-01-31 03:18

多媒体测试资源

目录简介自己整理的文件测试资源列表简介音视频测试时,需要许多源文件,这里整理了一些.会持续更新.当然可以使用ffmpeg转换获得需要的文件.如果知道的这方面资源的,在评论区留言.自己整理的文件有视频,图片

ketaotech·2024-01-31 02:51

udp（无连接）客户端和服务端代码

我的以后的努力方向：数据库或者音视频开发。。。

warmingsummer·2024-01-31 01:04

OpenGL ES 如何实现图像锐化?

通过增强图像的高频细节，图像锐化可以改善图像在人类视觉系统和计算机视觉系统中的感知效果。图像锐化处理的目的是为了使图像的边缘、轮廓线以及图像的细节变得清

字节流动·2024-01-31 00:14

OpenGL ES 实现图像腐蚀、膨胀、边缘检测

前文我们详细讲了图像锐化的基本原理，本文再介绍一下图像基本处理之腐蚀、膨胀和边缘检测，它们在图像处理和计算机视觉领域有着广泛的应用。

字节流动·2024-01-31 00:14

最强机器学习入门博客（吴恩达机器学习课程总结）

机器学习的概述诞生现实生活许多领域的问题不能通过显式编程实现，比如制造自动驾驶汽车、智能工厂、规模农业、计算机视觉等等，一种好的实现方式是通过学习算法让计算机自己学习如何做。

PengHao666999·2024-01-30 23:32

教书那些事儿（5）幸运数字

说在班里讨论了作文《幸运数字》，全班从开始的无人说话到讨论的热闹非凡，全是因为她放了个抖音视频。学生看了视频，马上活跃起来，举手的，叫老师的，从座位上站起来的，大声接茬的，都愿意发言了！

爱看ABC·2024-01-30 21:25

Matlab图像平滑滤波学习笔记——卷积、中值滤波、排序滤波以及自适应滤波

1.引言图像处理是计算机视觉领域中的一个重要分支，其目标是通过对图像进行各种操作来改善图像的质量或提取出特定的信息。

MatpyMaster·2024-01-30 20:12

利用OpenCV实现物流与生产线自动化的革命性突破

为了解决这一问题，越来越多的企业开始寻求利用计算机视觉技术实现自动化。OpenCV作为计算机视觉领域的翘楚，已被广泛应用于各种自动化项目。

GT开发算法工程师·2024-01-30 18:56

利用OpenCV检测物流过程中的暴力拆箱和暴力拿放行为

因此，利用计算机视觉技术来自动检测这些行为成为了一个迫切的需求。实现步骤：平台搭建：选择一个可靠的云服务器供应商，并购买一台具有GPU支持的云服务器。使

GT开发算法工程师·2024-01-30 18:24

机器学习复习（3）——分类神经网络与drop out

完整的神经网络以分类任务为例，神经网络一般包括backbone和head（计算机视觉领域）下面的BasicBlock不是一个标准的backbone,标准的应该是复杂的CNNs构成的Classfier是一个标准的

不会写代码！！·2024-01-30 16:12

android 仿抖音编辑视频,Android 仿抖音之使用OpenGL实现抖音视频录制

前言在之前写了仿抖音的第一步，就是使用OpenGL显示摄像头数据，今天这篇就是在之前的基础上来录制视频，并且对之前的代码的结构进行了简单的整理，然后进行了仿抖音的视频录制。工程结构整理在仿抖音的第一步中封装了ScreenFilter类来实现渲染屏幕的操作，我们都知道在抖音的视频录制过程中，可以添加很多的效果进行显示，比如说磨皮、美颜、大眼以及滤镜等效果，如果把这些效果都放在ScreenFilter

吃个生煎包·2024-01-30 15:18

Javacv 音视频小工具 - 下载抖音视频

一、前言大家好，俗话说的好，学习新的知识后要学以致用，在学习音视频的过程中，你有没有疑问，不知道音视频可以用来做什么。

声网·2024-01-30 15:47

如何将抖音API应用于抖音视频的录制和上传

要将抖音API应用于抖音视频的录制和上传，你需要遵循以下步骤：获取抖音API密钥：首先，你需要从抖音官网注册一个开发者账号，并创建一个应用以获得API密钥。

数据小爬虫·2024-01-30 15:46

UniAdapter: Unified Parameter-Efficient Transfer Learning for Cross-modal Modeling

UnifiedParameter-EfficientTransferLearningforCross-modalModeling论文链接：https://arxiv.org/pdf/2302.06605.pdf源码链接：https://hub.nuaa.cf/RERV/UniAdapter简介预训练-微调范式在自然语言处理，计算机视觉和多模态建模中取得了巨大的成功

qgh1223·2024-01-30 15:41

大模型日报-20240115

社区的图生视频插件I2V-Adapter来了https://mp.weixin.qq.com/s/tlOWaMi0e6By__MUT414xA图像到视频生成（I2V）任务旨在将静态图像转化为动态视频，这是计算机视觉领域的一大挑战

程序无涯海·2024-01-30 15:54

支持音视频的消息服务Databag

可实现企业内音视频服务，保护企业通信隐私。

杨浦老苏·2024-01-30 11:52

推荐频道

计算机视觉视频云音视频视频编码