E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
计算机视觉视频云音视频视频编码
深度学习常见数据集格式解析
VOCVOC(VisualObjectClasses)是一个流行的
计算机视觉
数据集,用于目标检测、图像分类和语义分割等任务。VOC数据集包含了多个类别的物体,如人、汽车、动物等,每个物体类别都有其对
不想动脑筋的亮亮
·
2024-01-17 04:15
深度学习
人工智能
H264/AVC的句法和语义
所有的
视频编码
标准都是通过定义句法和语义来规范编解码器的工作流程。句法元素的分层结构句法元素的分层结构:编码器输出的比特码流中,每个比特都隶属某个句法元素,也就是说,码流是由一个个句法
DogDaoDao
·
2024-01-17 03:53
H264(AVC)标准
H264
AVC
视频编解码
句法语义
实时音视频
H264
语法
x264
国内镜像:极速下载编译WebRTC源码(For Android/Linux/IOS)(二十四)
简介:CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、
音视频
、编解码等技术,与大家一起成长!
Android系统攻城狮
·
2024-01-17 01:03
WebRTC
Native实战系列
webrtc
android
linux
[易语言]使用易语言部署工业级人脸检测模型
【框架地址】https://github.com/ShiqiYu/libfacedetection【算法介绍】Libfacedetection是一个开源的
计算机视觉
库,主要用于实时的人脸检测。
FL1623863129
·
2024-01-17 00:00
易语言
人工智能
智能分析网关V4基于AI视频智能分析技术的周界安全防范方案
A智能分析网关V4基于深度学习和
计算机视觉
技术,可以通过多种AI周界防范算法,实时、精准地监测人员入侵行为,及时发现异常情况并发出警报,保障周界安全。
TSINGSEE
·
2024-01-16 23:38
智能分析网关V4
AI智能
解决方案
人工智能
音视频
安全
CNN和Transformer相结合的模型
©作者|小欣CNN广泛应用于
计算机视觉
的各种任务中,比如分类,检测,分割,CNN通过共享卷积核提取特征,减少网络参数数量,提高模型效率,另一方面CNN具有平移不变性,即无论特征被移动到图像的哪个位置,网络都能检测到这些特征
CV案例精选
·
2024-01-16 23:01
自动驾驶二维激光雷达标定板
自动驾驶是人类智慧的结晶,它融合了多种高科技技术,包括传感器技术、
计算机视觉
、人工智能等,它让汽车具备了自主感知和决策的能力,可以在复杂多变的道路环境中自如应对。
JYGD686868
·
2024-01-16 23:04
自动驾驶
人工智能
机器学习
Android Media3 ExoPlayer 如何正确设置缓存大小
在播放
音视频
时,如何开启AndroidMedia3ExoPlayer缓存,请参考笔者另外一篇文章:AndroidMedia3Exoplayer开启缓存功能笔者在设置ExoPlayer的缓存大小时,遇到一个非常奇怪的问题
思涛的博客
·
2024-01-16 23:56
Android
Java
android
缓存
java
大模型背景下
计算机视觉
年终思考小结(一)
1.引言在过去的十年里,出现了许多涉及
计算机视觉
的项目,举例如下:使用射线图像和其他医学图像领域的医学诊断应用使用卫星图像分析建筑物和土地利用率相关应用各种环境下的目标检测和跟踪,如交通流统计、自然环境垃圾检测估计等上述应用所采用的
计算机视觉
的方法遵循统一的标准流程
赵卓不凡
·
2024-01-16 22:05
计算机视觉
人工智能
大模型
多模态大模型
大模型背景下
计算机视觉
年终思考小结(二)
1.引言尽管在过去的一年里大模型在
计算机视觉
领域取得了令人瞩目的快速发展,但是考虑到大模型的训练成本和对算力的依赖,更多切实的思考是如果在我们特定的小规模落地场景下的来辅助我们提升开发和落地效率。
赵卓不凡
·
2024-01-16 22:01
深度学习
计算机视觉
人工智能
语言模型
多模态大模型
抖
音视频
上热门的技巧是什么
做了这么久的抖音,数据一直提不上去,你是否也有这样的疑惑呢?如何提高点赞、关注、评论、转发率等指标,获得更多的官方推荐和展示次数呢?今天我们就来一起聊聊抖音怎么上热门。一、怎样通过抖音的推荐算法提高数据指标呢?技巧一:调整发布时间统计数据显示,62%的用户在吃饭前和睡前使用抖音,而只有10.9%的用户在上班或上厕所等部分时间使用抖音。没有什么时候是最佳发布时间,要根据不同的行业进行调整。平日中午1
高省_飞智666600
·
2024-01-16 21:27
音视频
-SDL的简单使用
使用SDL进行
音视频
的播放SDL(SimpleDirectMediaLayer)是一套开放源代码的跨平台多媒体开发库,使用C语言写成。
星辰有行
·
2024-01-16 20:44
音视频
最近膝盖经常疼
我喜欢步行,每天一万步以上坚持了许多年,还喜欢骑行,现在看来要改变运动锻炼方式方法了,开始跟着抖
音视频
练习练习瑜伽,俗话说“筋长一寸寿长十年”,意思是筋骨好了,能增强身体免疫力,
小云朵的奶奶
·
2024-01-16 19:04
智能时代下的我们
2015年微软的ResNet提出,取得了当时图像识别比赛上面最好的成绩,到目前为止,深度残差网络在
计算机视觉
的研究中被广泛应用,并且被集成到微软还有其他大公司的产品中。
jimyang1ss
·
2024-01-16 19:41
【
音视频
基础】(八):CIE颜色空间四之从CIE xyY到CIE YUV
本篇隶属于文集:《零基础入门
音视频
开发》,查看文集全部文章,请点击文字链接。
金架构
·
2024-01-16 19:18
飞凌RZ/G2L的开发板实上的时
视频编码
推流设计与实现
飞凌RZ/G2L的开发板测评--实时
视频编码
推流设计与实现大信(QQ:8125036)在完成RZ/G2L板上视频采集的试用测试基础上,逐渐熟悉了RZ/G2L开发板的SDK,在研究过它的
音视频
硬件与软件包后
lutherluov
·
2024-01-16 18:09
音视频
实时音视频
arm
嵌入式硬件
也谈人工智能——AI科普入门
文章目录1.科普入门人工智能的定义人工智能的类型-弱AI与强AI人工智能、深度学习与机器学习人工智能的应用和使用场景语音识别
计算机视觉
客户服务建议引擎数据分析网络安全行业应用人工智能发展史!
星猿杂谈
·
2024-01-16 18:51
AI人工智能
人工智能
反光衣识别摄像机
反光衣识别摄像机是一种利用
计算机视觉
和图像识别技术结合反光材料的特性来识别反光衣的装置。
博瓦科技
·
2024-01-16 18:13
人工智能
安全
计算机视觉
【小智好书分享• 第一期】深度学习
计算机视觉
目录一、内容简介二、内页插图三、书籍目录四、粉丝福利博客主页:小智_x0___0x_欢迎关注:点赞收藏✍️留言系列专栏:好书分享代码仓库:小智的代码仓库一、内容简介
计算机视觉
有多先进?
.小智
·
2024-01-16 18:09
好书分享
深度学习
计算机视觉
人工智能
计算机视觉
的应用
计算机视觉
(ComputerVision)是一门研究如何让计算机能够理解和分析数字图像或视频的学科。简单来说,
计算机视觉
的目标是让计算机能够像人类一样对视觉信息进行处理和理解。
人工智能技术与咨询
·
2024-01-16 17:42
计算机视觉
人工智能
人工智能工程师证书怎么考的呢
2024年最新报考的有权威的就是由工业与信息化部电子工业标准化研究院颁发的证书:《
计算机视觉
处理设计开发工程师》中级2024年1月24日至28日-北京《自然语言与语音处理设计开发工程师》中级第二期2024
人工智能技术与咨询
·
2024-01-16 17:38
人工智能
自然语言处理
计算机视觉
标准卷积、深度可分离卷积与GSConv,YOLOv8引入SlimNeck
摘要:目标检测是
计算机视觉
中一项重要的下游任务。对于嵌入式边缘计算平台来说,很难实现实时检测的要求,使用巨大的模型也是困难的。此外,由大量深度可分离卷积层构建的轻量级模型无法达到足够的准确性。
masterMono
·
2024-01-16 16:31
笔记
人工智能
论文阅读
python
深度学习
卷积神经网络
AIGC必备知识点:你不可不知的CNN(卷积神经网络)-知识全解析!
(ConvolutionalNeuralNetwork,CNN)是一类主要用于
计算机视觉
领域的深度学习算法,它被广泛地运用于包括图像和视频识别、自然语言处理等,以游戏领域为例,CNN可以用于训练NPC(
OJAC近屿智能
·
2024-01-16 14:03
AIGC
cnn
人工智能
langchain
深度学习
chatgpt
神经网络
佛像控制点质心提取(附代码)
计算机视觉
老师让写空间后方交会求解相机外部参数的代码。具体就是老师会给一张相片,相片上
司徒北
·
2024-01-16 13:31
计算机视觉
c++
WebRTC视频会议/视频客服系统EasyRTC进入会议室密码验证的开发与实现
基于WebRTC技术的EasyRTC视频会议系统,建设目标是让用户随时随地、快捷方便地进行视频会议,并根据行业需求有针对性地提供多样化、个性化功能,该系统是覆盖全球的实时
音视频
开发平台,支持一对一、一对多等视频通话
TSINGSEE
·
2024-01-16 12:21
EasyRTC
音视频
webrtc
边缘计算
OpenCV-Python(43):姿势估计
目标学习了解calib3D模块学习在图像中创建3D效果calib3D模块OpenCV-Python的calib3D模块是OpenCV库中的一个重要模块,用于摄像头标定和三维重建等
计算机视觉
任务。
图灵追慕者
·
2024-01-16 11:32
opencv-python
opencv
calib3D模块
姿势估计
摄像机标定
立体视觉
3D重构
计算机视觉
实践案例-漫画翻译
知识点VisualStudioToolsforAIMicrosoftAzure上的服务申请流程微软认知服务(影像服务/文本翻译服务)的申请与使用小型客户端软件的界面设计与实现概述微软认知服务包括了影像、语音、语言、搜索、知识五大领域,通过对这些认知服务的独立或者组合使用,可以解决很多现实世界中的问题。作为AI小白,我们可以选择艰难地攀登崇山峻岭,也可以选择像牛顿一样站在巨人的肩膀上。本章节的内容就
xiaoshun007~
·
2024-01-16 10:36
计算机视觉
人工智能
imgaug库指南(25):从入门到精通的【图像增强】之旅
引言在深度学习和
计算机视觉
的世界里,数据是模型训练的基石,其质量与数量直接影响着模型的性能。然而,获取大量高质量的标注数据往往需要耗费大量的时间和资源。
高斯小哥
·
2024-01-16 10:56
数据增强指南
机器学习
深度学习
python
Halcon和opencv的区别
问题描述:Halcon和opencv的区别问题解答:Halcon(由MVTecSoftwareGmbH开发)和OpenCV(OpenSourceComputerVisionLibrary)都是
计算机视觉
领域常用的工具库
神笔馬良
·
2024-01-16 10:17
opencv
人工智能
计算机视觉
书生·浦语大模型实战2
这些模型在各种任务中展现出惊人的性能,比如自然语言处理、
计算机视觉
、语音识别等。这种模型通常采用深
__如果
·
2024-01-16 09:54
人工智能
优化的实时换脸项目——DeepFaceLive
它利用深度学习和
计算机视觉
算法,能够以惊人的准确度和速度将脸部特征无缝地映射到任何人的脸上。
m1chiru
·
2024-01-16 07:56
python
简单整理FFmpeg相关命令集
FFmpeg相关命令集简单整理了FFmpeg相关命令,主要包括ffplay播放控制和媒体播放命令、ffmpeg命令相关参数以及常用的提取
音视频
等命令。
君莫笑lucky
·
2024-01-16 07:25
音视频基础
ffmpeg
音视频
计算机视觉
市场分析:预计2029年将达到870亿元
计算机视觉
在人工智能里可以类比于人类的眼睛,是在感知层上最为重要的核心技术之一。
计算机视觉
技术模拟生物视觉,将捕捉到的图像中的数据及信息进行分析识别、检测、跟踪等,真正去"识别"和"理解"这些图像。
QYR市场调研所
·
2024-01-16 06:36
计算机视觉
人工智能
《
计算机视觉
处理设计开发工程师》
计算机视觉
(ComputerVision)是一门研究如何让计算机能够理解和分析数字图像或视频的学科。简单来说,
计算机视觉
的目标是让计算机能够像人类一样对视觉信息进行处理和理解。
人工智能技术与咨询
·
2024-01-16 06:05
计算机视觉
人工智能
【EI会议征稿通知】第四届图像处理与智能控制国际学术会议(IPIC 2024)
IPIC2024将围绕“图像处理”、“智能控制”及“
计算机视觉
”等研究领域展开讨论。此会议旨在为世界
搞科研的小刘选手
·
2024-01-16 06:58
学术会议
图像处理
人工智能
计算机视觉
深度学习
运维
信息与通信
利用C++进行图像处理与
计算机视觉
在C++中进行图像处理与
计算机视觉
是一个有趣且具有挑战性的任务。C++是一种高效的编程语言,能够提供足够的灵活性和性能,以处理复杂的图像处理和
计算机视觉
算法。
naer_chongya
·
2024-01-16 06:49
c++
图像处理
计算机视觉
竞赛保研 基于
计算机视觉
的身份证识别系统
0前言优质竞赛项目系列,今天要分享的是基于机器视觉的身份证识别系统该项目较为新颖,适合作为竞赛课题方向,学长非常推荐!更多资料,项目分享:https://gitee.com/dancheng-senior/postgraduate1实现方法1.1原理1.1.1字符定位在Android移动端摄像头拍摄的图片是彩色图像,上传到服务器后为了读取到身份证上的主要信息,就要去除其他无关的元素,因此对身份证图
iuerfee
·
2024-01-16 05:42
python
语义分割数据集
KITTI(KarlsruheInstituteofTechnologyandToyotaTechnologicalInstitute)数据集是一个用于
计算机视觉
和自动驾驶研究的公开数据集。
TechMasterPlus
·
2024-01-16 04:27
图像分割
人工智能
视频剪辑批量工作流程:视频色调调整让影片更出色,视频制作的方法
操作2、把要调整的视频导入到列表中,先点击面板上的“添加
音视频
”,然后找到视频先选中文件,再点击“打开”自动导入。
尘隐神明
·
2024-01-16 01:59
视频剪辑
经验分享
批量剪辑
视频剪辑
剪辑高手
自媒体
短视频
基于AI视频智能分析技术的周界安全防范方案
A智能分析网关V4基于深度学习和
计算机视觉
技术,可以通过多种AI周界防范算法,实时、精准地监测人员入侵行为,及时发现异常情况并发出警报,保障周界安全。
Black蜡笔小新
·
2024-01-16 01:54
解决方案
AI识别
人工智能
音视频
安全
边缘计算
大数据
MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model
MedSegDiff:基于扩散概率模型的医学图像分割摘要:扩散概率模型(Diffusionprobabilisticmodel,DPM)是近年来
计算机视觉
研究的热点之一。
我在努力学习分割(禁止说我水平差)
·
2024-01-15 22:17
神经网络
当我们看手机是在看什么
手机和网络带来的便捷方便是有目共睹有了手机网络世界也变小了,距离也变短了,时间则变快了我们每经过一个场合,大家的姿态差不多都在看手机现在的交往也会从面对面的谈论逐渐转变为手机语
音视频
的谈论我们原来经常看的书籍
涛声已遥远
·
2024-01-15 20:21
基于Python实现地标景点识别
目录前言简介地标景点识别的背景地标景点识别的原理卷积神经网络(CNN)的基本原理地标景点识别的工作流程使用Python实现地标景点识别的步骤数据收集数据预处理构建卷积神经网络模型模型训练参考文献前言简介地标景点识别是一种基于
计算机视觉
技术的应用
摔跤猫子
·
2024-01-15 19:52
python
地标景点识别
数据预处理
模型训练
Powershell利用FFmpeg批量合并
音视频
文件
需求:B站缓存教程类视频p数多,需要对其进行批量合并拼视频。条件:FFmpeg和Powershell根据:ffmpeg-y-i视频文件-i音频文件-codeccopy输出文件代码#获取该目录下所有文件夹完整路径$DirArray=Get-ChildItem-Directory|ForEach-Object{$_.FullName}#开始遍历foreach($nin$DirArray){#视频分流$
Owlious
·
2024-01-15 18:47
powershell脚本应用
powershell
ffmpeg
中原焦点团队焦点解决网络初级23期王丹坚持原创分享第221天 本周约练第次 总第35次(2021.2.17)
家长不注意自己的言行,出口成脏,却责骂孩子说脏话没礼貌;家长沉迷手机游戏,刷抖
音视频
无法自拔,却在关上手机的时候对冲着玩手机的孩子大发脾气;指责孩子不努力学习事事不如别人家孩子,却在孩子离开的时候大骂他不争气只会躲避
8ede3d21a1c3
·
2024-01-15 17:21
音视频
PTS、DTS
下面是自己的一点理解,如有错误,请指正。I帧,P帧和B帧是MPEG-2的编码规范规定的图像编码首先要理解i、p、bi帧:关键帧,根据当前帧解析视频p帧:帧图像只采用前向时间预测,根据前一帧,解析当前帧。b帧:B帧图像采用双向时间预测,可以大大提高压缩倍数。根据前几帧、本帧、后帧解析当前帧,也就是需要先解码后面的帧才能再解码当前帧。或称双向预测图像,根据临近的前几帧、本帧、后几帧的I或者P图像预测得
小~小
·
2024-01-15 17:21
音视频
音视频
音视频
中的PTS和DTS及同步
说明:此页是所有索引的集合,从此出发,可以找到博客的所有链接。网络相关索引:https://blog.csdn.net/knowledgebao/article/details/84626184linux基础相关索引:https://blog.csdn.net/knowledgebao/article/details/84315842GStreamer专栏索引:https://blog.csdn.
SoLucky2017
·
2024-01-15 17:51
音视频
视频编码
中的I、B、P帧
空余时间下,对之前的工作中所掌握的知识整理以下。一、帧类别概念在H.264压缩标准中I帧、P帧、B帧⽤于表⽰传输的视频画⾯。在视频压缩中,每帧都代表着一幅静止的图像。在实际的视频压缩编码时,会采取各种算法减少数据的容量,其中IPB帧就是最常见的一种算法。二、预测编码预测编码分为帧内预测编码和帧间预测编码1、帧内预测编码I帧I帧⼜称帧内编码帧,又称全帧压缩编码帧,是⼀种⾃带全部信息的独⽴帧,⽆需参考
Eason风云
·
2024-01-15 17:17
音视频
网络
音视频
包的pts,dts,duration的由来.
音视频
包的pts,dts,duration的由来.pts:演播时间戳dts:解码时间戳duration:播放时长怎样深刻理解这些概念,它们具体代表了什么?
hjjdebug
·
2024-01-15 17:17
#
ffmpeg
pts
dts
duration
突破二维,迈入三维
作者:小柠檬|来源:3DCV在公众号「3DCV」后台,回复「原论文」可获取论文pdf多视图立体几何(Multi-ViewStereo,MVS)是
计算机视觉
中重要的研究领域,也是迈入三维
计算机视觉
研究的重点问题
3DCV
·
2024-01-15 17:15
学习
计算机视觉
人工智能
算法
深度学习
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他