E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
recognition
iOS 百度语音+二维码生成
import"BDRecognizerViewDelegate.h"#import"BDRecognizerViewController.h"#import"JSONKit.h"#import"BDVoice
Recognition
Client.h
YQ_苍穹
·
2023-04-19 01:26
whisper
RobustSpeech
Recognition
viaLarge-ScaleWeakSupervision介绍大规模弱监督的训练。
ctrlcvKing
·
2023-04-18 22:40
语音识别
语音识别
人工智能
Python实时音频识别与处理——让上网课不再单调
Python实时语音识别转字幕实现原理用speech_
recognition
库获得实时电脑音频输入,用requests和json库将生成的语音文件上传至百度的云语音识别服务器进行识别,返回结果用wx库显示为字幕
EricFrenzy
·
2023-04-18 22:36
奇怪的工具增加了!
python
语音识别
github
百度
学习实践-Whisper语音识别模型实战(部署+运行)
1、Whisper内容简单介绍OpenAI的语音识别模型Whisper,Whisper是一个自动语音识别(ASR,AutomaticSpeech
Recognition
)系统,OpenAI通过从网络上收集了
李卓璐
·
2023-04-18 22:33
实战
学习
语音识别
python
OCR技术大揭秘:纸质文档数字化的新选择
引言OCR(OpticalCharacter
Recognition
)即光学字符识别技术,是一种将纸质或电子文档中的印刷文字转化为可编辑和可搜索的数字文本的技术。
海碗吃饭
·
2023-04-18 15:40
实战分享
资料推荐
数据库
人工智能
深度学习
SlowFast Networks for Video
Recognition
速读笔记
(一)Title(二)KeyPoints提出结合使用slowpathway和fastpathway。slowpathway慢帧率,主要关注空间信息从图像或者稀疏的帧中提取语义信息fastpathway减少通道数,lightweight,快帧率,更多地关注动作随时间的变化信息时间速率很快,轻量级,较弱的处理空间信息的能力。不需要temporalpooling快慢结合带来了检测结果上的提升。(三)Me
不知道叫啥好一点
·
2023-04-18 14:26
深度学习
20组-Quo Vadis, Action
Recognition
? A New Model and the Kinetics Dataset
论文截图摘要由于目前行为分类(actionclassification)方面的数据集(UCF-101和HMDB-51)很缺乏,使得识别视频中的行为分类这一任务没有很好的解决方案,目前大多数的方法性能都很相近。基于此本文提出了一个新的行为分类的数据集——Kinetics。Kinetics比现有的数据集大两个数量级,包括400个行为类别,每个类别有超过400个片段,同时分析了现有方法在这个数据集上的性
召召召
·
2023-04-18 11:11
用于端到端语音识别的文本数据多任务训练
论文MULTITASKTRAININGWITHTEXTDATAFOREND-TO-ENDSPEECH
RECOGNITION
摘要论文提出了一种基于注意力的端到端语音识别模型的多任务训练方法,以更好地整合语言级别的信息
尚歌
·
2023-04-18 10:31
语音识别
人工智能
语音识别
多任务学习
ICASSP 2022 | 标点恢复——一套可以同时服务单模态和多模态文本的标点恢复框架
导读在信息时代,自动语音识别技术(AutomaticSpeech
Recognition
,ASR)已成为互联网领域一大典型应用,尤其是在智能手机等设备上,语音识别功能已经成为标配。
TechBeat人工智能社区
·
2023-04-18 10:30
技术文章
语音识别
人工智能
2020-08-17
FiberCeramicFerruleSpecialtyCarbonBlackAircraftAuxiliaryPowerUnit(APU)RigandOilfieldMatsFaucetFace
Recognition
SystemsElectricalDesignSoftwareFoundryBinderOutsourcedSemiconductorAssemblyandTest
安兮安兮
·
2023-04-18 09:57
An End-to-End Visual-Audio Attention Network for Emotion
Recognition
in User-Generated Videos阅读笔记
Abstract用户生成视频中的情感识别在以人为本的计算中起着重要的作用。现有的方法主要采用传统的两层浅层管道,即提取视觉和/或音频特征和训练分类器。在本文中,我们提出了一种基于卷积神经网络(CNNs)的端到端识别视频情绪的方法。具体来说,我们开发了一个深度视觉音频注意网络(VAANet),这是一种新的架构,它将空间、通道级和时间注意整合到视觉3DCNN中,并将时间注意整合到音频2DCNN中。此外
Encounter84
·
2023-04-18 09:54
笔记
人工智能
深度学习
Cross Attentional Audio-Visual Fusion for Dimensional Emotion
Recognition
阅读笔记
Abstract摘要——多模态分析最近引起了人们对情感计算的极大兴趣,因为它可以提高情感识别相对于孤立的单模态方法的整体准确性。最有效的多模态情绪识别技术有效地利用各种免费的信息源,例如面部、声音和生理模式,以提供全面的特征表示。在本文中,我们专注于基于从视频中提取的面部和声音模态融合的维度情绪识别,其中可以捕获复杂的时空关系。大多数现有的融合技术依赖于循环网络或传统的注意机制,这些机制不能有效地
Encounter84
·
2023-04-18 08:17
笔记
人工智能
深度学习
【附代码】SSVEP解码算法 - 多变量同步指数(MSI)
“Multivariatesynchronizationindexforfrequency
recognition
ofSSVEP-basedbrain–computerinterface.”Journalofneu
IT - 边缘人
·
2023-04-18 01:34
脑电信号识别
算法
matlab
开发语言
机器学习
VGG论文翻译及复现
details/127852595论文地址:https://arxiv.org/abs/1409.1556VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGE
RECOGNITION
fakerth
·
2023-04-17 22:27
论文
深度学习
人工智能
计算机视觉
2019-05-04 mac配置python开发环境
最近在看一些关于机器学习中人脸识别的内容,想要运行下face_
recognition
,因此需要Python的运行环境,所以搭建了Python开发环境,这里记录下,方便大家学习。
singleshen
·
2023-04-17 18:51
论文阅读:One-Shot Video Object Segmentation
论文名字One-ShotVideoObjectSegmentation来源2017IEEEConferenceonComputerVisionandPattern
Recognition
(CVPR)年份2017.4.13
三金samkam
·
2023-04-17 16:26
论文阅读
机器学习
神经网络
深度学习
语义分割
CNN
Rare Chinese Character
Recognition
by Radical Extraction Network 笔记
RareChineseCharacter
Recognition
byRadicalExtractionNetwork笔记声明:仅翻译部分内容,若阅读体验不佳,还请见谅摘要:首先提取和识别基础的Graphicalcomponents
rufuss
·
2023-04-17 10:15
树莓派python手势识别控制_树莓派opencv python 实例教程二 手势识别 Hand Gesture
Recognition
...
调整屏幕亮度会改变结果。尽量将手完全放在盒子里,避免手臂或手腕进入盒子(因为它会改变面积比)。使用范围值完成,因此可能适用于不同的人的不同颜色范围。importcv2importnumpyasnpimportmathcap=cv2.VideoCapture(0)while(1):try:#anerrorcomesifitdoesnotfindanythinginwindowasitcannotfi
weixin_39614754
·
2023-04-17 08:45
树莓派python手势识别控制
SFSpeech
Recognition
Task.error 错误码对照表
iOS语音识别引擎中常见错误对照表加注释了errorAnerrorobjectthatspecifiestheerrorthatoccurredduringaspeech
recognition
task.iOS10.0
司小文
·
2023-04-17 05:32
iOS-功能
ios
语音识别
引擎
NSError
半监督动作识别(Semi-Supervised Action Detection)部分论文汇总
TimeBalance:Temporally-InvariantandTemporally-DistinctiveVideoRepresentationsforSemi-SupervisedAction
Recognition
xiongxyowo
·
2023-04-17 02:50
划水
Easter2.0:tensorflow源码转pytorch
论文题目:Easter2.0:IMPROVINGCONVOLUTIONALMODELSFORHANDWRITTENTEXT
RECOGNITION
论文地址:https://arxiv.org/pdf/2205.14879
方水云
·
2023-04-17 01:56
pytorch
tensorflow
深度学习
whisper:robust speech
recognition
via large-sacle weak supervision
OpenAIWhisper精读【论文精读·45】_哔哩哔哩_bilibili更多论文:https://github.com/mli/paper-reading,视频播放量68331、弹幕量327、点赞数2332、投硬币枚数1192、收藏人数983、转发人数394,视频作者跟李沐学AI,作者简介,相关视频:自动识别讲座、访谈录音——Python开源whisper语音识别,ChatGPT原理剖析李宏毅
Kun Li
·
2023-04-16 21:14
视觉应用算法
whisper
人工智能
经典transformer视觉模型总结
VisionTransformer模型ViT:ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGE
RECOGNITION
ATSCALE是2020年Google团队提出的将
嵌入式视觉
·
2023-04-16 14:43
transformer
深度学习
人工智能
vit
注意力机制之Efficient Multi-Head Self-Attention
论文:lResT:AnEfficientTransformerforVisual
Recognition
模型示意图:本文解决的主要是SA的两个痛点问题:(1)Self-Attention的计算复杂度和n(
深度学习的学习僧
·
2023-04-16 13:39
深度学习
人工智能
如何大批量扫描的发票进行ocr识别导出Excel表格和WPS表格
OCR技术:OCR(OpticalCharacter
Recognition
,光学字符识别)是将数字图像中的文字识别成字符代码的技术,在发票识别中应用广泛。
帅气的咕嘎
·
2023-04-16 13:18
PDF图片处理
批量发票识别导出Excel表格
批量图片发票导出Excel表格
发票扫描自动生成表格
发票怎么导出来excel
发票数据转excel表格
Free for photo container detection, container damage detect PaaS
Thecontainernumber
recognition
APIisfree,CIMCAIENGINE™containerAIplatformcanbeuse
中集飞瞳CIMCAI
·
2023-04-16 10:55
paas
微信小程序
小程序
【论文阅读】Fully convolutional networks for semantic segmentation
DarrellT.Fullyconvolutionalnetworksforsemanticsegmentation[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpattern
recognition
w-here
·
2023-04-16 06:14
语义分割
计算机视觉
语义分割
demo
importface_
recognition
importcv2#获取面部numpy对象image=face_
recognition
.load_image_file('9无.jpg')#print(image
butters001
·
2023-04-16 00:59
【飞桨PaddleSpeech语音技术课程】— 语音唤醒
自动语音识别(AutomaticSpeech
Recognition
,ASR)是一种
小湉湉
·
2023-04-15 21:46
语音识别
MachineLearning
语音识别
人工智能
音频
3D点云识别安全吗? 学界提出健壮性分析数据集:ModelNet40-C
论文:BenchmarkingRobustnessof3DPointCloud
Recognition
AgainstCommonCorruptions论文地址:https://arxiv.org/abs/
Amusi(CVer)
·
2023-04-15 19:52
计算机视觉
机器学习
人工智能
深度学习
python
iOS开发-Siri预研
Siri介绍Siri是一款苹果iOS系统提供的智能语音助手软件,它的全名是SpeechInterpretationand
Recognition
Interface。
林神_iOS
·
2023-04-15 10:31
DFL-CNN
LearningaDiscriminativeFilterBankwithinaCNNforFine-grained
Recognition
--2018cvprGitHub:https://github.com
喜欢早起的陈萌
·
2023-04-15 04:31
ST-GCN 论文解读
论文名称:SpatialTemporalGraphConvolutionalNetworksforSkeleton-BasedAction
Recognition
论文下载:https://arxiv.org
想不出昵称呀
·
2023-04-15 03:15
基于骨骼动作识别的
AGCN
GCN
ST-GCN
### 论文精读——An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recogniti
论文精读——IIP-Transformer:Intra-Inter-PartTransformerforSkeleton-BasedAction
Recognition
近期在做基于关键点的人体动作识别研究
Jason_____Wang
·
2023-04-15 03:10
精读笔记
transformer
深度学习
计算机视觉
Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action
Recognition
[ICCV2021]
content/ICCV2021/papers/Chen_Channel-Wise_Topology_Refinement_Graph_Convolution_for_Skeleton-Based_Action_
Recognition
_ICCV
Iron_lyk
·
2023-04-15 03:40
论文阅读笔记
人工智能
深度学习
神经网络
CTR-GCN 论文解读
论文名称:Channel-wiseTopologyRefinementGraphConvolutionforSkeleton-BasedAction
Recognition
论文下载:https://arxiv.org
想不出昵称呀
·
2023-04-15 03:39
基于骨骼动作识别的
AGCN
CTR-GCN
GCN
gpt openai_OpenAI的GPT —第1部分:公开GPT模型
gptopenaiLanguagemodelinginNLPtriestosolveanumberoftaskssuchastextsummarization,speech
recognition
,OpticalCharacter
Recognition
weixin_26752075
·
2023-04-14 17:08
python
人工智能
机器学习
java
【毕业设计/Matlab系列】基于PCA和BP神经网络的人脸识别系统GUI
1、总体介绍Face
Recognition
ByBPneuralnetwork.m:采
飞翔的鲲
·
2023-04-14 14:44
【实用毕业设计】
matlab
神经网络
人脸识别
PCA
毕业设计
An Image is Worth 16×16 Words:Transformers for Image
Recognition
at Scale(ViT,ICLR2021)
ViT摘要引言相关工作方法实验结论摘要虽然Transformer架构已经成为自然语言处理任务的标准,但它在计算机视觉方面的应用仍然有限。在视觉领域,注意力机制要么与卷积网络结合使用,要么用于替换卷积网络的某些组件,但其整体结构并没有改变。本文表明,这种对CNN的依赖是不必要的,直接应用于图像块序列的纯Transformer架构可以很好地执行图像分类任务。利用大规模数据集进行预训练,再迁移到中小型数
写进メ诗的结尾。
·
2023-04-14 05:17
经典网络框架
深度学习
人工智能
神经网络
计算机视觉
transformer
Android动态库出错位置定位
toolchains/arm-linux-androideabi-4.9/prebuilt/darwin-x86_64/bin/arm-linux-androideabi-addr2line-elibgesture_
recognition
JustWonder
·
2023-04-14 04:47
PCA-LDA:PCA versus LDA for face
recognition
PCA-LDA:PCAversusLDAforface
recognition
PCA与LDA在人脸识别中的比较PCA-LDA:PCAversusLDAforface
recognition
Abstract1INTRODUCTION2LOCALIZATIONANDMORPHINGOFFACEIMAGES3THEPCASPACE4THELDASPACE5EXPERIMENTALRESULTS5.1Smal
显然易证
·
2023-04-14 02:03
论文精读
机器学习
python
计算机视觉
2022高考英语:108个高分句型,精心整理,满满成就感!
【英语“108”】开头句入门1.Nowthereisagrowingawareness/
recognition
ofthenecessityto...如今,人们越来越意识到……的必要性。
高中生惊喜社
·
2023-04-13 22:33
【赛事推荐】ICDAR2023国际学术竞赛,六大OCR未解难题等你来挑战!
关注公众号,发现CV技术之美ICDAR(InternationalConferenceonDocumentAnalysisand
Recognition
)是全球文档图像分析识别领域公认的权威学术会议,从1991
我爱计算机视觉
·
2023-04-13 17:28
人工智能
计算机视觉
【深度学习】经典算法解读及代码复现AlexNet-VGG-GoogLeNet-ResNet(一)
ILSVRC全称ImageNetLarge-ScaleVisual
Recognition
Challenge,是视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平。
Sciengineer-Mike
·
2023-04-12 23:18
深度学习
算法
人工智能
卷积神经网络
如何把表格做成源代码_首次同时开源表格检测和表格结构识别数据集
为了让机器“读”懂文档中的表格,微软亚洲研究院自然语言计算组发表了一篇论文“TableBank:TableBenchmarkforImage-basedTableDetectionand
Recognition
茜茜丁
·
2023-04-12 22:30
如何把表格做成源代码
OCR之表格结构识别综述
特定数据集上效果排行榜ICDAR2021TaskB团队算法介绍TEDSall开源地址海康威视Davar-LabLGPMA:ComplicatedTableStructure
Recognition
withLocalandGlobalPyramidMaskAlignment96.36LGPMA
Liekkas Kono
·
2023-04-12 22:56
深度学习
表格结构识别
OCR
深度解析MFCC特征提取
一、MFCC概述在语音识别(Speech
Recognition
)和话者识别(Speaker
Recognition
)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequencyCepstralCoefficients
SeaShawnChan
·
2023-04-12 22:14
语音信号处理
语音识别
人工智能
2022-01-04
论文阅读:《ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGE
RECOGNITION
ATSCALE》论文地址:https://arxiv.org/abs/2010.11929
queen坤坤女王
·
2023-04-12 20:23
Transformer for image
recognition
at scale论文阅读笔记
原论文链接:https://openreview.net/forum?id=YicbFdNTTy摘要因为transformer已经成为NLP任务中标准的方法了,但是在计算机视觉中的应用还是有限,但是注意力机制在图像中也可以应用,可以是纯attention,也可以是结合CNN的,所以CNN并不是必要的。VIT(visiontransformer)的提出已经在很多评价标准上成为了SOTA的方法,并且训
骑驴去学习
·
2023-04-12 14:23
transformer论文阅读
transformer
深度学习
自然语言处理
图像识别
Transformer论文阅读:ViT算法笔记
标题:AnImageisWorth16x16Words:TransformersforImage
Recognition
atScale会议:ICLR2021论文地址:https://openreview.net
Frankenstein@
·
2023-04-12 14:51
Transformer
transformer
论文阅读
深度学习
计算机视觉
神经网络
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他