E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
计算机视觉视频云音视频视频编码
计算机视觉
深度学习训练推理框架
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达前言本文整理了一些深度学习训练推理框架,涉及
计算机视觉
、语音、时序任务上的框架,共计20多种。
小白学视觉
·
2024-01-31 21:50
深度学习
计算机视觉
python
人工智能
开发语言
2022-04-07 总结与复盘
做得好的地方:1,听力有在坚持;2,开了一场直播,虽然是在尬聊,但是有在坚持,而且比上次熟练多了,没怯场可以做得更好:1,对看不惯的同事应该多点包容心2,资料提交还是有点拖拉今天取得的成就:1,发现了抖
音视频
下午发的播放率比晚上的还高
吹风筒的_猪
·
2024-01-31 20:52
使用Mediapipe实现CPU上的实时人脸检测(每秒30帧)
对
计算机视觉
和人脸检测感兴趣吗?在这个初学者指南中,我们将探讨如何使用Mediapipe和Python进行实时人脸检测。
小北的北
·
2024-01-31 20:55
使用OpenCV为视频中美女加上眼线
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达
计算机视觉
是最令人兴奋的领域之一,其应用范围非常广泛。从医学成像到创建最有趣的面部滤镜等各个领域都充分见证了
计算机视觉
技术的强大。
小白学视觉
·
2024-01-31 20:54
算法
python
人工智能
java
机器学习
我一直都在等你
29岁的姑娘小丽正拿着手机刷抖
音视频
,忽然间露出惊讶的表情,一时怔住了:自己什么时候发过这样的视频?从没有呀!可眼前屏幕里那个女孩怎么和自己长得一模一样?
风萧萧兮兮
·
2024-01-31 19:06
三维重建经典论文合集汇总
三维重建涉及
计算机视觉
、图形学等多门知识,是一套非常复杂的系统。
深蓝学院
·
2024-01-31 18:11
人工智能
三维重建
视觉
视频编码
全流程
视频编解码用到的一些算法:正反傅里叶变换、fft算法dct变换、快速dct变换如何自己实现一个视频编解码器:(1)取一帧作为I帧,类似jpeg压缩编码,也就是rgb转yuv,然后dct去除高频信息。因为这种压缩会造成边界block通常使用插值让边界模糊。(2)运动预测来计算P帧,新的一帧同样做yuv、dct之后,划分为n个宏快(16*16),与上一个参考值的n个宏快(16*16)进行n*n的双重循
0x13
·
2024-01-31 17:06
音视频处理算法
算法
人工智能
音视频
视频
视频编码
流程详解
1、
视频编码
整体流程2、FFmpeg
视频编码
详细流程从本地读取YUV数据编码为H264格式的数据,然后再存入到本地,编码后的数据有带startcode。与FFmpeg示例音频编码的流程基本一致。
夏之七
·
2024-01-31 17:06
音视频
音视频
编码
视频编码
结构
VVCVVC标准对应的参考软件平台是VTM(VVCTestModel)两个基本目标1.高压缩性能,定义一套
视频编码
技术,其压缩性能要远优于以往的同类标准。
一箭辰空
·
2024-01-31 17:35
音视频
如何降低
视频编码
延迟
降低
视频编码
延迟可以从多个方面进行优化,这里有一些常见的方法:选择低延迟的编码器:一些编码器专为低延迟设计,如H.264或H.265的低延迟模式。这些编码器通过减少帧间的依赖性来减少延迟。
LittroInno
·
2024-01-31 17:04
音视频
视频编解码
FFmpeg添加MediaCodec硬编码
音视频
文章汇总接到需求,做一个iOS和Android两端的编码测试工具,可选编码器,分辨率,帧率,码率控制ABR或CBR,GOP进行转码,查看软编码libx264和硬编码MediaCodec的编码效率和画质以及查看是否少帧
一亩三分甜
·
2024-01-31 17:30
ffmpeg入门篇-滤镜的基本使用
image从图中可以看到滤镜前后画的是虚线,表示可有可无,在术语中,滤镜指的是在编码之前针对解码器解码出来的原始数据(即
音视频
帧)进行处理的动作,我们还可以称它为过滤器。
白狼栈
·
2024-01-31 16:32
抖音上热门的五个小技巧,学会这几个技巧,抖音上热门很简单
一、抖
音视频
上热门的技巧是什么?1、选安静且光清晰的环境,因为嘈杂会影响观众的观感,导致流失严重。2、需要保持画面稳定,可以用固定机位或者稳定杆,基本是一个支架就可以实现这点。
高省_飞智666600
·
2024-01-31 15:03
像素级别 图像级别 区域级别 的疑问
像素级和图片级都是
计算机视觉
中常用的概念。像素级是指对每个像素进行处理和分析,以便了解图像中的细节信息。在处理过程中,每个像素的颜色和强度都会被考虑进去,因此像素级处理非常精细和准确。
:)�东东要拼命
·
2024-01-31 11:13
CV基础知识
计算机视觉
图像处理
opencv
基于YOLOv8深度学习的水稻叶片病害智能诊断系统【python源码+Pyqt5界面+数据集+训练代码】深度学习实战
专注于人工智能、AIGC、python、
计算机视觉
相关分享研究。✌更多学习资源,可关注公-仲-hao:【阿旭算法与机器学习】,共同学习交流~感谢小伙伴们点赞、关注!
阿_旭
·
2024-01-31 10:34
深度学习实战
AI应用软件开发实战
计算机视觉
深度学习
python
YOLOv8
水稻病害检测
深度学习实战
图对比1:GCC
受自然语言处理和
计算机视觉
在预训练方面的最新进展的启发,我们设计了一个自监督图神经网络预训
Valar_Morghulis
·
2024-01-31 10:27
浅谈:完成一篇论文的科研历程与经验
作者:彭思达|CCF专业会员浙江大学研究员主要研究方向为三维
计算机视觉
|本文版权归作者所有文章目录引言阶段1:想idea阶段2:如何做实验阶段3:如何写论文引言完成一篇论文的常见科研历程包括三大阶段:想
猛码Memmat
·
2024-01-31 09:28
master
人工智能
论文
计算机视觉
yolov5 deepsort 行人/车辆(检测 +计数+跟踪+测距+测速)
YOLOv5和DeepSORT是两种常用的
计算机视觉
技术,它们可以结合使用以实现行人和车辆的目标检测和跟踪。这种技术在交通监控、智慧城市等领域中具有广泛的应用。
毕设阿力
·
2024-01-31 09:37
YOLO
目标跟踪
目标检测
yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计
该算法在
计算机视觉
领域具有广泛的应用。首先,YOLOv8算法采用了YouOnlyLookOnce(YOLO)的思想,通过单次前向传递将目标检测问题转化为回归问题。
毕设阿力
·
2024-01-31 09:06
计算机视觉
YOLO
目标检测
图卷积网络(Graph Convolution Network,GCN)
图神经网络的出现使其在上述任务中取得了重大突破,比如在社交网络、自然语言处理、
计算机视觉
甚至生命科学等领域得到了非常广泛的应用。图神经
唯余木叶下弦声
·
2024-01-31 09:04
深度学习
深度学习
人工智能
音视频
数字化(数字与模拟-音频广播)
在互联网飞速发展的今天,每晚能坐在电视机前面的人越来越少,但是每天收听广播仍旧是很多人的习惯。从1906年美国费森登在实验室首次进行无线电广播算起,“广播”系统已经陪伴人们115年了。1916年,收音机开始上市,收音机核心是“矿石”。1920年开始“调幅”广播,1941年开始“调频”广播。我国上海在1923年1月23日首次播送广播节目,全市大约有500多台收音机开始接收广播。1933年“电子管”收
beiger
·
2024-01-31 08:49
音视频
智能音频能力移动端落地实践
文/马金龙整理/LiveVideoStack大家好,我是马金龙,在多媒体算法开发方面有10年的经验,涉及
音视频
图像文本,音
LiveVideoStack_
·
2024-01-31 08:47
音视频
音视频
数字化(数字与模拟-录音机)
之前我们说了【数字与模拟-照相机】照相机的数字化,今天聊聊录音机。说录音机之前,必须说说留声机。留声机是爱迪生1877年宣布发明成功的,研发过程相当复杂,但原理是简单的。声音的本质是“波”,是物体振动产生的。以乐器为例,打击乐就是敲击(鼓、钹、木鱼、木琴、三角铁、编钟……)后产生振动,声音就开始传播了;吹管类乐器,也是一样,气流由唇吹出,流经乐器(孔、缝等),产生振动发声;弹拨类乐器(吉他、琵琶…
beiger
·
2024-01-31 08:15
音视频数字化
音视频
《
计算机视觉
处理设计开发工程师》
近日我们刚刚结束了《
计算机视觉
处理设计开发工程师》证书第一期培训,培训效果良好,所有学员均通过工信部统一线上考试,坐等证书了。鉴于学员们的反应我们第二期课程如约而至。
人工智能技术与咨询
·
2024-01-31 08:37
计算机视觉
人工智能
自然语言处理
基于Qt 视频播放器mp4/wav/avi/等等(进阶)
##Qt
音视频
相关Qt多媒体音频模拟按钮发音(
音视频
启动)基于Qt音乐播放器mp3(进阶)##项目工具工具名
Qt历险记
·
2024-01-31 07:44
Qt
高级开发工程师
qt
音视频
开发语言
c++
QML
有没有好用的语音转文字软件?
1.网易见外这是一个
音视频
转写的在线平台,不用下载,电脑上进入网页就可以使用。使用方法也很简单:先上传你的视频或音频文件,选择要生成的语言(中文或英文),然后等待文字生成即可。
柚子不是幼稚
·
2024-01-31 07:56
Opencv + MediaPipe -> 手势识别
一、概述OpenCV(OpenSourceComputerVisionLibrary)是一个跨平台的
计算机视觉
库,它提供了许多用于图像和视频处理的功能,包括图像和视频的读取、预处理、特征提取、特征匹配、
大大Cameo
·
2024-01-31 06:51
计算机视觉
人工智能
计算机视觉
opencv
视觉检测
【OpenCV 编程指南】
OpenSourceComputerVisionLibrary)■OpenCV简介■■■■■■■■OpenCV简介Opencv(OpenSourceComputerVisionLibrary)是一个基于开源发行的跨平台
计算机视觉
库
光芒Shine
·
2024-01-31 06:18
#
OpenCV
opencv
人工智能
计算机视觉
opencv+mediapipe 手势识别控制电脑音量(详细注释解析)
识别手掌关键点像素坐标3、根据拇指和食指指尖的坐标,利用勾股定理计算距离4、将距离等比例转为音量大小,控制电脑音量最终的效果是这样的:库首先介绍一下应用的几个库opencvOpenCV是Intel开源
计算机视觉
库
yf743909
·
2024-01-31 06:32
opencv
人工智能
计算机视觉
OpenCV4.3+VS2017+外部库 win10 64位手动编译x64库
VisualStudio2017步骤4:安装CMake步骤5:CMake加载工程步骤6:OpenCV编译配置步骤7:生成VS2017工程步骤8:编译步骤9:安装参考文献:编译步骤OpenCV是一个开源的
计算机视觉
库
一个代码工
·
2024-01-31 06:48
Qt
c++
opencv
音视频
探索(7):FLV协议在RTMP中的使用
RTMP和HTTP_FLV内部使用FLV协议封装H.264和AAC
音视频
包,FLV属于大端字节序。FLV格式由FLVHeader+F
老张音视频开发进阶
·
2024-01-31 06:17
音视频
PR转场 700+抖
音视频
转场素材包含PR调色预设和音效素材
PR转场700+抖音短视频转场过效果PR调色预设模板包(含音效素材)快速,方便,轻松地使您的视频在视觉上变得有趣而令人赞叹!幻灯片,预告片,促销,音乐剪辑,广播,电影,纪录片或演示文稿;助您的每个项目都将更加吸引人!将您的视频提升到一个新的水平!将这些超酷的相机缩放和平移或形状过渡添加到您的视频作品中吧!视频预览及原文链接:https://prmuban.com/12220.html更多:pr转场
电脑周边
·
2024-01-31 06:37
Premiere
pr转场
抖音转场
抖音素材
视频转场
视频素材
支付宝应用的开源组件
它包括了目前领先的音/
视频编码
库libavcodec。
夜风月圆
·
2024-01-31 05:16
基于PaddleDetection的锥桶检测并在Gazebo环境中实现部署
感兴趣的方向有:
计算机视觉
、迁移学习、推理部署。
飞桨PaddlePaddle
·
2024-01-31 03:18
python
人工智能
深度学习
大数据
编程语言
多媒体测试资源
目录简介自己整理的文件测试资源列表简介
音视频
测试时,需要许多源文件,这里整理了一些.会持续更新.当然可以使用ffmpeg转换获得需要的文件.如果知道的这方面资源的,在评论区留言.自己整理的文件有视频,图片
ketaotech
·
2024-01-31 02:51
音视频编解码和流媒体
多媒体测试文件
udp(无连接)客户端和服务端代码
我的以后的努力方向:数据库或者
音视频
开发。。。
warmingsummer
·
2024-01-31 01:04
就业班视频学习
udp
linux
c++
OpenGL ES 如何实现图像锐化?
通过增强图像的高频细节,图像锐化可以改善图像在人类视觉系统和
计算机视觉
系统中的感知效果。图像锐化处理的目的是为了使图像的边缘、轮廓线以及图像的细节变得清
字节流动
·
2024-01-31 00:14
OpenGL
ES
3.0
计算机视觉
人工智能
OpenGLES
图形渲染
着色器
Android
OpenGL ES 实现图像腐蚀、膨胀、边缘检测
前文我们详细讲了图像锐化的基本原理,本文再介绍一下图像基本处理之腐蚀、膨胀和边缘检测,它们在图像处理和
计算机视觉
领域有着广泛的应用。
字节流动
·
2024-01-31 00:14
OpenGL
ES
3.0
OpenGLES
图形渲染
Android
c++
最强机器学习入门博客(吴恩达机器学习课程总结)
机器学习的概述诞生现实生活许多领域的问题不能通过显式编程实现,比如制造自动驾驶汽车、智能工厂、规模农业、
计算机视觉
等等,一种好的实现方式是通过学习算法让计算机自己学习如何做。
PengHao666999
·
2024-01-30 23:32
机器学习
人工智能
教书那些事儿(5)幸运数字
说在班里讨论了作文《幸运数字》,全班从开始的无人说话到讨论的热闹非凡,全是因为她放了个抖
音视频
。学生看了视频,马上活跃起来,举手的,叫老师的,从座位上站起来的,大声接茬的,都愿意发言了!
爱看ABC
·
2024-01-30 21:25
Matlab图像平滑滤波学习笔记——卷积、中值滤波、排序滤波以及自适应滤波
1.引言图像处理是
计算机视觉
领域中的一个重要分支,其目标是通过对图像进行各种操作来改善图像的质量或提取出特定的信息。
MatpyMaster
·
2024-01-30 20:12
图像处理
matlab
学习
笔记
利用OpenCV实现物流与生产线自动化的革命性突破
为了解决这一问题,越来越多的企业开始寻求利用
计算机视觉
技术实现自动化。OpenCV作为
计算机视觉
领域的翘楚,已被广泛应用于各种自动化项目。
GT开发算法工程师
·
2024-01-30 18:56
opencv
自动化
人工智能
python
tensorflow
利用OpenCV检测物流过程中的暴力拆箱和暴力拿放行为
因此,利用
计算机视觉
技术来自动检测这些行为成为了一个迫切的需求。实现步骤:平台搭建:选择一个可靠的云服务器供应商,并购买一台具有GPU支持的云服务器。使
GT开发算法工程师
·
2024-01-30 18:24
opencv
人工智能
计算机视觉
YOLO
机器学习复习(3)——分类神经网络与drop out
完整的神经网络以分类任务为例,神经网络一般包括backbone和head(
计算机视觉
领域)下面的BasicBlock不是一个标准的backbone,标准的应该是复杂的CNNs构成的Classfier是一个标准的
不会写代码!!
·
2024-01-30 16:12
人工智能
机器学习复习
机器学习算法
机器学习
神经网络
深度学习
android 仿抖音 编辑视频,Android 仿抖音之使用OpenGL实现抖
音视频
录制
前言在之前写了仿抖音的第一步,就是使用OpenGL显示摄像头数据,今天这篇就是在之前的基础上来录制视频,并且对之前的代码的结构进行了简单的整理,然后进行了仿抖音的视频录制。工程结构整理在仿抖音的第一步中封装了ScreenFilter类来实现渲染屏幕的操作,我们都知道在抖音的视频录制过程中,可以添加很多的效果进行显示,比如说磨皮、美颜、大眼以及滤镜等效果,如果把这些效果都放在ScreenFilter
吃个生煎包
·
2024-01-30 15:18
android
仿抖音
编辑视频
Javacv
音视频
小工具 - 下载抖
音视频
一、前言大家好,俗话说的好,学习新的知识后要学以致用,在学习
音视频
的过程中,你有没有疑问,不知道
音视频
可以用来做什么。
声网
·
2024-01-30 15:47
实时音视频互动应用开发教程
音视频
ffmpeg
Java
如何将抖音API应用于抖
音视频
的录制和上传
要将抖音API应用于抖
音视频
的录制和上传,你需要遵循以下步骤:获取抖音API密钥:首先,你需要从抖音官网注册一个开发者账号,并创建一个应用以获得API密钥。
数据小爬虫
·
2024-01-30 15:46
api
电商api
音视频
责任链模式
开发语言
大数据
java
前端
UniAdapter: Unified Parameter-Efficient Transfer Learning for Cross-modal Modeling
UnifiedParameter-EfficientTransferLearningforCross-modalModeling论文链接:https://arxiv.org/pdf/2302.06605.pdf源码链接:https://hub.nuaa.cf/RERV/UniAdapter简介预训练-微调范式在自然语言处理,
计算机视觉
和多模态建模中取得了巨大的成功
qgh1223
·
2024-01-30 15:41
有效参数迁移
人工智能
迁移学习
深度学习
大模型日报-20240115
社区的图生视频插件I2V-Adapter来了https://mp.weixin.qq.com/s/tlOWaMi0e6By__MUT414xA图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是
计算机视觉
领域的一大挑战
程序无涯海
·
2024-01-30 15:54
大模型资讯篇
大模型
chatgpt
日报
AIGC
论坛
人工智能
AI
支持
音视频
的消息服务Databag
可实现企业内
音视频
服务,保护企业通信隐私。
杨浦老苏
·
2024-01-30 11:52
群晖
docker
即时通讯
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他