E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音识别论文笔记
Scaled-YOLOv4: Scaling Cross Stage Partial Network
论文笔记
Scaled-YOLOv4:ScalingCrossStagePartialNetwork论文链接:https://arxiv.org/abs/2011.08036一、ProblemStatementCSPNet的作者用其CSPNet的方法分别从网络的深度,宽度,结构和输入图像的分辨率改善YOLOV4。二、Direction作者发现在RegNet中,CNN最优的深度为60左右,且当bottlene
Tianchao龙虾
·
2023-11-04 20:37
2D目标检测论文笔记
神经网络
深度学习
全志R528核心板和开发板
板载WIFI和BT模块,具备在线
语音识别
/控制和无线音频输入功能;同时提供丰富的外设接口支持,如RGB/MIPI/LVDS显示屏、RMII以太网、USB、SDIO、UART、
lu968968
·
2023-11-04 20:53
语音识别
人工智能
物联网
02:智能视频分段加速,视频延时慢放 03:智能给视频加字幕,
语音识别
加字幕 04:给视频去水印功能,裁剪遮挡去字幕 05:视频加水印,图片水印,漂
02:智能视频分段加速,视频延时慢放03:智能给视频加字幕,
语音识别
加字幕04:给视频去水印功能,裁剪遮挡去字幕www.shipinshanshan.com05:视频加水印,图片水印,漂浮水印,文字水印
视频闪闪
·
2023-11-04 19:39
音视频
语音识别
人工智能
批量视频剪辑
视频剪辑
批量剪辑视频
批量剪辑
【VSLAM系列】三:Vins-Mono
论文笔记
VINs-Mono论文1.VINS-Mono的特点:1.未知初始状态的鲁棒性初始化过程2.带imu-camera外参校准和imu校准的紧耦合,基于非线性优化的单目VIO系统3.在线重定位和四个自由度的全局姿态图优化。4.姿态图可以保存,加载,并和局部姿态图进行合并。2.传感器数据处理摄像头和imu数据融合方法:1.松耦合法,imu是独立于摄像头的模块,常使用EKF算法,imu数据此时用于状态传播,
塞拉摩
·
2023-11-04 19:06
视觉SLAM
论文阅读
数码相机
人工智能
语音识别
学习
给自己挖了个坑,一个课程论文突然让我看起了
语音识别
TAT1.https://blog.csdn.net/lukabruce/article/details/82380511隐马尔可夫模型(HMM)mark
桉豆子
·
2023-11-04 18:38
论文笔记
| TIMESNET: TEMPORAL 2D-VARIATION MODELING FOR GENERAL TIME SERIES ANALYSIS 时序数据1D-2D
文章目录一、==*ThesisKeyMessages*==二、==*KeyPoints*==2.1、==*1D-2D*==2.2、==*TimesBlock*==三、==*ArticleReflection*==1、Motivations2、解决方案的关键3、论文工作成果四、总结与讨论CSDN欲寄:https://blog.csdn.net/qq_62631255一、ThesisKeyMessag
欲寄
·
2023-11-04 17:26
论文笔记
论文阅读
深度学习
神经网络
论文笔记
:TIMESNET: TEMPORAL 2D-VARIATION MODELINGFOR GENERAL TIME SERIES ANALYSIS
ICLR20231intro时间序列一般是连续记录的,每个时刻只会记录一些标量之前的很多工作着眼于时间维度的变化,以捕捉时间依赖关系——>可以反映出、提取出时间序列的很多内在特征,比如连续性、趋势、周期性等但是现实时间序列数据中的时间序列通常是由很复杂的时间特征组成,不同的时间维度上的变化会糅杂在一起,使得建模时间维度的变化异常困难在深度学习领域,很多模型有很强的建模非线性的能力,因而可以捕获时间
UQI-LIUWJ
·
2023-11-04 17:54
论文笔记
深度学习
人工智能
yolo v1
论文笔记
yolov1参考这篇文章https://zhuanlan.zhihu.com/p/46691043摘要weframeobjectdetectionasaregressionproblemtospatiallyseparatedboundingboxesandassociatedclassprobabilities.作者将目标检测问题变成一个回归问题,包括boundingboxes的计算和目标类别的
红鲤鱼遇绿鲤鱼
·
2023-11-04 13:58
论文学习
深度学习
自动驾驶
机器学习
YOLO学习笔记之YOLO v1
论文笔记
1(超详细:翻译+理解)
前言一、Abstract(概括)二、Introduction(介绍)三、UnifiedDetection(统一检测)1、NetworkDesign(网络设计)2、Training(训练)3、Inference(推论)4、LimitationsofYOLO(YOLO的局限性)前言看过很多的YOLO中文版学习笔记,干货比较多,但是,有点干,对于很多想要入门的童鞋来说,看着很难理解,一些概念晦涩难懂,一
bufengzj
·
2023-11-04 13:17
智能算法
深度学习
初学者也能看懂的隐马尔科夫模型介绍
隐马尔可夫模型(hiddenMarkovmodel,HMM)是时间序列的概率模型,常用于词性标注,
语音识别
,文本分析等领域。HMM是基于马尔科夫链进行标注的,我们对已经观察的数据序列O进行标
小白学视觉
·
2023-11-04 11:37
算法
python
机器学习
人工智能
java
TensorFlow什么意思?TensorFlow是什么?
Google开源深度学习系统TensorFlow在很多地方可以应用,如
语音识别
,自然语言理解,计算机视觉,广告等等。
AI小菜鸡一个
·
2023-11-04 09:08
AI
java
服务器
开发语言
人工智能的应用与发展趋势
人工智能技术的应用范围广泛,包括自然语言处理、机器视觉、
语音识别
、智能推荐、自动驾驶、智能医疗等领域。
泰海科技志胜
·
2023-11-04 07:11
人工智能
whisper部署与使用
Whisper的核心功能是
语音识别
,对应生活中可以有很多应用场景。虽然效果显著,但是其核心仅仅简单粗暴的使用了Transformer。具体细节这里不展开,可以通过阅读论文或源码的方式了解。
alberic_k
·
2023-11-04 07:56
模型部署
python
pytorch
AI:53-基于机器学习的字母识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-04 06:43
AI领域专栏
人工智能
机器学习
如何实现
语音识别
功能
native嵌套H5实现
语音识别
功能?看图说话,我采用的是mui框架所自带的功能!代码附上:
语音识别
语音识别
:mui.min.css文件:/*!
Rkatsiteli
·
2023-11-04 05:36
App内嵌套H5的那些事儿
语音识别
openai-whisper
whisper[博客][论文][模型卡][Colab示例]Whisper是一种通用
语音识别
模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言
语音识别
、语音翻译和语言识别。
sanbaofengs
·
2023-11-04 05:35
经验分享
whisper
开放词汇视觉定位 OV-VG: A Benchmark for Open-Vocabulary Visual Grounding
论文笔记
开放词汇视觉定位OV-VG:ABenchmarkforOpen-VocabularyVisualGrounding
论文笔记
一、Abstract二、Abstract三、相关工作A、视觉定位B、短语定位C、
乄洛尘
·
2023-11-04 04:28
目标检测研究
人工智能
论文阅读
笔记
观点|我离开AI行业的5个理由
从图像识别、
语音识别
,到自然语言生成、内容创作、自动驾驶等,AI貌似已经无处不在,尤其是深度学习算法的出现,让AI进一步融入了人类生活。但是,如今的AI真实可信吗?
Tom Hardy
·
2023-11-03 21:13
人工智能
编程语言
大数据
ai
深度学习
CoCa
论文笔记
摘要计算机视觉任务中,探索大规模预训练基础模型具有重要意义,因为这些模型可以可以极快地迁移到下游任务中。本文提出的CoCa(ContrastiveCaptioner),一个极简设计,结合对比损失和captioning损失预训练一个image-textencoder-decoder基础模型,该模型包含对比方法,如CLIP,和生成方法,如SimVLM,的学习能力。与基本的encoder-decoder
hello_dear_you
·
2023-11-03 18:28
自监督ViT
CoCa
多模态
探索“声音驱动唇形”技术的工作原理
语音合成技术是指将文字信息转换为人类可以理解的语音,它广泛应用于
语音识别
、虚拟人物的声音合成、游戏中的语音交互等领域。
小文智能
·
2023-11-03 16:05
语音识别
人工智能
声音驱动唇形
酷雷曼多种AI数字人形象,打造科技感VR虚拟展厅
△AI数字人导览如你所见,像上述全景作品中这种整合了动作驱动、唇形驱动技术、智能
语音识别
等众多人工智能技术的可视化虚拟人物,就是我们所说的AI数字人。再说简单点,所有
酷雷曼VR全景
·
2023-11-03 16:34
VR行业发展前景
vr
人工智能
科技
VR全景
AI数字人
AI:49-基于深度学习的杂草识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-03 10:34
AI领域专栏
人工智能
深度学习
坚持记录博客NO:1------------------>
论文笔记
:深度学习
1.词汇学习paradigm:典范;样式;引申为课题hierarchical:分层的;等级体系的2.小知识扩展:百度创始人李宏彦创办的第一个研究所就是深度学习研究所3.重点知识:(1)什么是机器学习?答:机器学习机器就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测.(2)BP算法?答:BP算法是人工神经网络的反向传播算法(BackPropgation)利用B
红心柚大果
·
2023-11-03 02:14
笔记
机器学习
深度学习
AI:46-基于深度学习的垃圾邮件识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-03 02:40
AI领域专栏
人工智能
深度学习
【
论文笔记
】U-BERT: Pre-training User Representations for Improved Recommendation
原文作者:ZhaopengQiu,XianWu,JingyueGao,WeiFan原文标题:U-BERT:Pre-trainingUserRepresentationsforImprovedRecommendation原文来源:AAAI2021原文链接:https://www.aaai.org/AAAI21Papers/AAAI-2116.QiuZ.pdfU-BERT:Pre-trainingUs
BodyCsoulN
·
2023-11-02 22:58
论文笔记
人工智能
推荐系统
bert
深度学习
RNN神经网络适用于什么,RNN神经网络基本原理
然而,样本出现的时间顺序对于自然语言处理、
语音识别
、手写体识别等应用非常重要。对了适应这种需求,就出现了另一种神经网络结构——循环神经网络RNN。
「已注销」
·
2023-11-02 21:32
神经网络
rnn
深度学习
聚类
AI:48-基于卷积神经网络的气象图像识别
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-02 16:55
AI领域专栏
人工智能
cnn
神经网络
AI:50-基于深度学习的柑橘类水果分类
本专栏包含以下学习方向:机器学习、深度学习、自然语言处理(NLP)、机器视觉、
语音识别
、强化学习、推荐系统、机器学习操作(MLOps)、计算机视觉、虚拟现实(VR)/增强现实(AR)等等✨✨✨在这个漫长
一见已难忘
·
2023-11-02 16:55
AI领域专栏
人工智能
深度学习
分类
介绍 TensorFlow 的基本概念和使用场景。
它可以用来建立深度学习模型,解决各种复杂的机器学习问题,如图像识别、
语音识别
、自然语言处理等。TensorFlow的基本概念是张量(Tensor),它是一个多维数组。
Stephen_CY666
·
2023-11-02 14:04
tensorflow
人工智能
python
AI智能
语音识别
模块(二)——基于Arduino的语音控制MP3播放器
文章目录简介离线语音控制模块MiniMP3模块0.96寸OLED模块实验准备安装库接线定义主要程序实验效果注意事项总结简介在前面一篇文章里我们对AI智能
语音识别
模块进行了介绍,并对离线语音模组下载固件的过程进行了一个简单描述
优信电子
·
2023-11-02 10:14
语音识别
单片机
Arduino
嵌入式硬件
模块测试
mcu
神经网络与监督式学习
除了我们之前看的预测房价的例子(标准的神经网络)比如图像识别(CNN:卷积神经网络),翻译和
语音识别
(RNN:循环神经网络),还有自动驾驶(将CNN和RNN结合起来的更定制化的神经网络)。
Ang陈
·
2023-11-02 09:42
基于深度学习的水果识别 计算机竞赛
/dancheng-senior/postgraduate2开发简介深度学习作为机器学习领域内新兴并且蓬勃发展的一门学科,它不仅改变着传统的机器学习方法,也影响着我们对人类感知的理解,已经在图像识别和
语音识别
等领域取得广泛的
Mr.D学长
·
2023-11-02 09:18
python
java
一键办公:PDF转换word、OCR识别、
语音识别
、教学办公一应俱全
前段时间,我在编辑文档时,发现自己电脑自带的word版本太低,打开同事传送过来的文件时,发现格式错乱(比如字体乱码),图片乱飞的情况,万般无奈之下,只好找到这款工具万彩办公大师以解燃眉之急。1.下载该软件最新版压缩包。image2.打开压缩包,在date文件夹里找到后缀为exe的程序,双击运行,也可以解压到桌面运行。image3.安装之后,打开桌面图标,可以看到整个界面清新,无广告,功能介绍也很完
星愿夜读
·
2023-11-02 07:39
STM32智能小车(循迹、跟随、避障、测速、蓝牙、wife、4g、
语音识别
)总结
目录1.电机模块开发1.1让小车动起来1.2串口控制小车方向1.3如何进行小车PWM调速1.4PWM方式实现小车转向2.循迹小车2.1循迹模块使用2.2循迹小车原理2.3循迹小车核心代码2.4循迹小车解决转弯平滑问题3.跟随/避障小车3.1红外壁障模块分析编辑3.2跟随小车的原理3.3跟随小车开发和调试代码3.4超声波模块介绍3.5舵机模块介绍3.6摇头避障小车开发和调试代码4.测速小车4.1测速
罗小白的干爹
·
2023-11-02 06:04
51跟32单片机
STM32
论文笔记
之Deep Neural Networks for YouTube Recommendations
DeepNeuralNetworksforYouTubeRecommendations文中把整个推荐过程分成两个步骤:•deepcandidategenerationmodel.即召回部分•deeprankingmodel.即精排部分文中指出YouTube推荐的三个主要挑战:•Scale.YouTube推荐的数据规模大,一些适合处理小规模数据的推荐算法效果不好。•Freshness.YouTube
小弦弦喵喵喵
·
2023-11-02 01:46
python
语音识别
库kaldi_Kaldi
语音识别
库在Linux下的安装和编译
1.介绍Kaldi
语音识别
工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。
岑依惜
·
2023-11-02 01:00
kaldi在linux上编译,Kaldi
语音识别
库linux环境下的安装和编译
介绍:Kaldi
语音识别
库可以说是,HTK数据库的整理加强版,将HTK比较零碎的各种各样的指令和功能进行整理,使用更加的方便,同时也加入了深度神经网络的分类器(DNN),本身由原来做HTK开发的人员制作而成
三上酱
·
2023-11-02 01:30
kaldi在linux上编译
linux编译aidl接口,ubuntu下安装kaidl实用教程
1.介绍Kaldi
语音识别
工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。
weixin_39779530
·
2023-11-02 01:30
linux编译aidl接口
ASRT从零搭建并测试
参考文章:从零开始搭建属于自己的
语音识别
API服务器(ASRT开源项目)_asrt_v0.6.1_志谦的博客-CSDN博客w我是用VM搭建使用的,用的Ubuntu20.04Server1.Server默认没有很多工具
胖多鱼
·
2023-11-02 01:25
语音识别
python
kaldi在Linux下的安装
1.介绍Kaldi
语音识别
工具将HTK比较零碎的各种各样的指令和功能进行整理集合,使用perl脚本调用。
ch977
·
2023-11-02 01:25
系统的说说语音机器人这回事--总章
语音识别
-ASR语义理解-NLU对话管理-对话状态跟踪DST\对话活动DA策略模型-通用模型GM\领域模型DM语言生成-NLG语音合成-TTS开源框架:AIML-ArtificialIntelligenceMarkupLanguagePython
胖多鱼
·
2023-11-02 01:23
Voice
Project
语音识别
人工智能
Fedora 32安装Kaldi
Kaldi的链接,讲的都比较明确,例如:kaldi的编译安装与报错解决方法_extras/check_dependencies.shextras/check_dependen-CSDN博客保姆级kaldi
语音识别
胖多鱼
·
2023-11-02 01:50
Kaldi
循环神经网络 - RNN
**利用RNN的这种能力,使深度学习模型在解决
语音识别
、语言模型、机器翻译以及时序分析等NLP领域的问题时有所突破。潜变量自回归模型使用潜变量hth_th
mango1698
·
2023-11-02 00:18
Python
rnn
人工智能
深度学习
论文笔记
——chatgpt评估+
文章目录1.chatgpt效果评估:EvaluatingChatGPT’sInformationExtractionCapabilities:AnAssessmentofPerformance,Explainability,Calibration,andFaithfulness文章简介文章结论2.事件抽取:OneEE:AOne-StageFrameworkforFastOverlappingand
YingJingh
·
2023-11-01 23:06
论文记录
论文阅读
chatgpt
人工智能
华为ICT——第五章语音处理理论与实践
语言信号预处理-预加重:语音信号预处理——分帧:语音信号预处理——加窗:语音特征(1):语音特征(2):语音信号分析(1)语音信号分析(2)语音信号的时域分析:语音信号的频域分析:语音特征:语音——文字:
语音识别
希斯奎
·
2023-11-01 22:15
华为ICT
语音识别
人工智能
华为
笔记
UE5
语音识别
和语音合成-阿里云智能语音-短视频-翻译-文章-AI角色等
阿里云智能语音一共分为语音合成,
语音识别
,什么是语音合成,它可以将您的文字转化成您设定的任何声音,并且播放出来。
人宅
·
2023-11-01 21:18
renzhai
AboutCG
C++
语音识别
人工智能
基础课15——语音标注
在语音数据标注中,标注员需要对语音数据进行分类、切分、转写等操作,让人工智能系统能够从中学习到正确的
语音识别
能力。
AI 智能服务
·
2023-11-01 21:55
AI训练师
人工智能
语音识别
深度学习
人机交互
大数据
基于深度学习的
语音识别
算法的设计与实现
收藏和点赞,您的关注是我创作的动力文章目录概要一、课题内容二、需求分析2.1算法需求分析2.2语音录制2.3声学模型2.4语言模型2.5训练集和测试集2.6深度神经网络三算法设计原理3.1
语音识别
系统3.1.1
01图灵科技
·
2023-11-01 17:46
深度学习
python
深度学习
语音识别
算法
大模型开启人工智能的新时代
大模型通常用于解决复杂的自然语言处理、计算机视觉和
语音识别
等任务。这些任务通常需要处理大量的输入数据,并从中提取复杂的特征和模式。
新知图书
·
2023-11-01 16:44
人工智能
【
论文笔记
2019-04-10】Libra R-CNN: Towards Balanced Learning for Object Detection
网络优化不平衡问题妨碍了充分利用设计良好的架构,进而限制其总体性能。可概括如下:1.采样级的不平衡:随机采样会使所选样本受简单样本的支配;复杂采样方法,如OHEM,会使注意力更向复杂样本集中,但是却对噪声标签敏感,并且会提升内存的占用和计算量。2.特征级的不平衡:深度高水平的特征具有更多语义,而浅层低水平特征更容易描述。近年来,基于横向连接的特征整合如FPN和PANet的使用,使得目标检测获得了进
EverydayRunning
·
2023-11-01 13:20
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他