E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
recognition
BEVFormerV2 论文阅读
论文链接BEVFormerv2:AdaptingModernImageBackbonestoBird’s-Eye-View
Recognition
viaPerspectiveSupervision0.Abstract
KrMzyc
·
2023-12-25 09:15
论文阅读
基于Skeleton的手势识别:SAM-SLR-v2
SignLanguage
Recognition
viaSkeleton-AwareMulti-ModelEnsemble解读摘要1.简介2.方法2.1SAM-SLR-v2框架概述2.2SL-GCNforSkeletonKeypoints2.3SSTCNforSkeletonFeatures2.43DCNNBaselinesfortheOtherModalities2.5Multi-modalLate
AIRV_Gao
·
2023-12-25 00:39
论文笔记
深度学习
人工智能
手势识别
基于骨骼的动作识别:DD-Net
MakeSkeleton-basedAction
Recognition
ModelSmaller,FasterandBetter论文解读概述1.简介2.relatedworks3.方法2.1基于关节的位置视点不变特征建模集合的距离
AIRV_Gao
·
2023-12-25 00:38
论文笔记
计算机视觉
动态手势识别
综述:基于骨骼(skeleton)的动作识别方法
Deeplearning‐basedaction
recognition
with3Dskeleton:Asurvey1.简介1.13DSkeleton‐basedAction
Recognition
1.简介
AIRV_Gao
·
2023-12-25 00:38
论文笔记
人工智能
计算机视觉
深度学习
face_
recognition
安装
GitHubhttps://github.com/ageitgey/face_
recognition
/blob/master/README_Simplified_Chinese.mddlib安装https
bluexiii
·
2023-12-24 13:51
android语音识别服务,使用语音服务 API 的语音识别 - Xamarin | Microsoft Docs
使用AzureSpeechService进行语音识别Speech
recognition
usingAzureSpeechService01/14/2020本文内容AzureSpeechService是一种基于云的
柯西饭
·
2023-12-24 10:52
android语音识别服务
自然语言处理(NLP):理解语言,赋能未来
目录前言1什么是NLP2NLP的用途3发展历史4NLP的基本任务4.1词性标注(Part-of-SpeechTagging)4.2命名实体识别(NamedEntity
Recognition
)4.3共指消解
cooldream2009
·
2023-12-24 09:53
大模型基础
NLP知识
自然语言处理
人工智能
大模型
基于GPU并行优化的实时全景视频拼接
GPUbasedparalleloptimizationforrealtimepanoramicvideostitching作者:ChengyaoDu;JinglingYuan;JianshengDong;LinLi;MinchengChen;TaoLi年份:2020机构:武汉大学期刊/会议:Pattern
Recognition
Letters
右除武
·
2023-12-24 01:57
阅读笔记-PRECISE ADJACENT MARGIN LOSS FOR DEEP FACE
RECOGNITION
PRECISEADJACENTMARGINLOSSFORDEEPFACE
RECOGNITION
深度人脸识别的精确相邻边缘损失1、这篇论文要解决什么问题?要验证一个什么科学假设?
蜡笔小祎在线学习
·
2023-12-23 15:24
深度学习
笔记
机器学习
计算机视觉
阅读笔记-GICOFACE: GLOBAL INFORMATION-BASED COSINE OPTIMAL LOSS FOR DEEP FACE
RECOGNITION
GICOFACE:GLOBALINFORMATION-BASEDCOSINEOPTIMALLOSSFORDEEPFACE
RECOGNITION
基于全局信息的余弦最优损失深度人脸识别算法1、这篇论文要解决什么问题
蜡笔小祎在线学习
·
2023-12-23 15:23
深度学习
人工智能
深度学习
机器学习
阅读笔记-Minimum margin loss for deep face
recognition
Minimummarginlossfordeepface
recognition
深度人脸识别的最小边缘损失1、这篇论文要解决什么问题?要验证一个什么科学假设?
蜡笔小祎在线学习
·
2023-12-23 15:53
深度学习
机器学习
深度学习
人工智能
【开放集检测】OpenGAN: Open-Set
Recognition
via Open Data Generation 论文阅读
文章目录英语积累为什么使用GAN系列网络进行开放集检测摘要1.前言2.相关工作开集检测基于GAN网络的开集检测基于暴露异常数据的开集检测3.OpenGAN3.1公式建模3.1.1二分类方法存在问题如何解决3.1.2使用合成数据存在问题如何解决3.1.3OpenGAN3.1.4模型验证3.2先前基于GAN方法的总结3.2.1生成器vs判别器3.2.2Featuresvs.Pixels3.2.3Cla
好喜欢吃红柚子
·
2023-12-23 13:24
模型详解与复现
论文阅读
VGG 论文学习
题目:VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGE
RECOGNITION
题目译:大规模图像识别的的深度卷积神经网络作者:KarenSimonyan∗&
奋斗的bobo
·
2023-12-23 10:09
在centos上安装python人脸库face_
recognition
前段时间看了看python和face_
recognition
,用来识别人脸和对比人脸,发现在centos上安装face_
recognition
还是费了点小劲挖了点小坑的,曲曲折折东拼西凑到处查资料终于鼓捣好了
FlyLikeButterfly
·
2023-12-23 09:51
python
安装人脸库
Android开发中实时语音开发之华为实时语音识别
mSpeechRecognizer=MLAsrRecognizer.createAsrRecognizer(context)mSpeechRecognizer.setAsrListener(Speech
Recognition
Listener
华海渡
·
2023-12-23 07:03
Android音视频
Kotlin
语音识别
人工智能
DM-GAN
作者:MinfengZhu,PingboPan,WeiChen,YiYang时间:2019会议/期刊:19年被CVPR(IEEEConferenceonComputerVisionandPattern
Recognition
该学还得学
·
2023-12-23 03:54
text2image
计算机视觉
深度学习
vit-transfomers 逐段精读
IntriguingPropertiesofVisionTransformers|PapersWithCode标题ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGE
RECOGNITION
ATS
MIngo的成长
·
2023-12-23 01:16
深度学习
人工智能
transformer
python中文语音识别
1)生成需要识别的wav文件,Speech
Recognition
需要wav文件,不能识别mp3文件安装库:sudoaptinstallespeakffmpeglibespeak1pipinstallpyttsx3
极乐净土0822
·
2023-12-22 22:05
python
语音识别
开发语言
Nested Named Entity
Recognition
with Span-level Graphs
原文链接:https://aclanthology.org/2022.acl-long.63.pdfACL2022介绍问题基于span的方法虽然在解决嵌套实体上存在巨大潜力,但存在以下问题:1)难以充分利用span的丰富语义;2)重叠较多的正负样本会降低模型的性能;3)训练集中的嵌套实体,基本上不会存在于测试集中,即模型需要有较强的泛化能力;IDEA因此作者通过利用基于检索的span图来改进spa
pepsi_w
·
2023-12-22 15:07
论文
人工智能
深度学习
NER
Propose-and-Refine: A Two-Stage Set Prediction Network forNested Named Entity
Recognition
原文链接:https://www.ijcai.org/proceedings/2022/0613.pdf\IJCAI2022介绍问题作者认为基于span的模型存在以下问题:1)忽略了span和其他实体短语之间的关系,span的表征往往只有内部的信息,看不见全局的信息,就会导致一些实体被分类错误。(不是很站得住脚哈因为一般基于span的方法都会加入一些其他信息比如句子的cls或者span前后的一些t
pepsi_w
·
2023-12-22 15:37
论文
深度学习
人工智能
NER
kNN-NER: Named Entity
Recognition
with Nearest Neighbor Search
原文链接:https://arxiv.org/pdf/2203.17103.pdf预发表论文介绍受到增强式检索方法的启发,作者提出了kNN-NER,通过检索训练集中k个邻居的标签分布来提高模型命名实体识别分类的准确性。该框架能够通过充分利用训练信息来解决样本类别不平衡问题。方法整个模型的框架如下图所示,作者提出的框架在训练阶段不需要进行额外的操作,可以适配于多样的序列标注模型:Background
pepsi_w
·
2023-12-22 15:37
论文
人工智能
NER
深度学习
PromptNER: Prompt Locating and Typing for Named Entity
Recognition
原文链接:https://aclanthology.org/2023.acl-long.698.pdfACL2023介绍问题目前将prompt方法应用在ner中主要有两种方法:对枚举的span类型进行预测,或者通过构建特殊的prompt来对实体进行定位。但作者认为这些方法存在以下问题:1)时间开销和计算成本较高;2)需要精确的设计模板,难以在实际场景中应用。IDEA因此作者提出了一种双插槽的pro
pepsi_w
·
2023-12-22 14:34
论文
prompt
顶刊TPAMI 2022!基于不同数据模态的行为识别:最新综述
点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>CV微信技术交流群HumanAction
Recognition
fromVariousDataModalities:AReview
Amusi(CVer)
·
2023-12-21 13:41
计算机视觉
机器学习
人工智能
深度学习
大数据
语音识别之百度语音试用和OpenAiGPT开源Whisper使用
0.前言:本文作者亲自使用了百度云语音识别,腾讯云,java的Speech
Recognition
语言识别包和OpenAI近期免费开源的语言识别Whisper(真香警告)介绍了常见的语言识别实现原理1.NLP
默默努力的小老弟
·
2023-12-21 08:59
语言识别
语音识别
百度
GPT
Whisper
深度学习网络的结构---AlexNet
AlexNet是一个经典的深度学习模型,是2012年ImageNet大规模视觉识别竞赛(ImageNetLargeScaleVisual
Recognition
Challenge,ILSVRC)的冠军模型
调钟师
·
2023-12-21 01:32
深度学习
人工智能
神经网络
使用paddleocr实现图片文字智能提取
1OCR介绍OCR(OpticalCharacter
Recognition
)即光学字符识别,是一种将不同类型的文档(如扫描的纸质文件、PDF文件或图像文件中的文本)转换成可编辑和可搜索的数据的技术。
智慧医疗探索者
·
2023-12-20 03:55
计算机视觉
ocr
paddleocr
深度学习
光学字符识别
论文 | 《HMDB: A Large Video Database for Human Motion
Recognition
》
未经允许,不得转载,谢谢~~主要记录一下对于HMDB数据集的一些主要说明;HMDB-51是action
recognition
方向用于判断视频分类模型准确度的一个很经典常用的benchmark。
与阳光共进早餐
·
2023-12-20 01:19
OCR EasyOCR + PaddleHub 光学字符识别(Optical Character
Recognition
, OCR)
EasyOCRpipinstallopencv-pythonpip3installeasyocr简单测试一下importosimporteasyocrimportcv2frommatplotlibimportpyplotaspltimportnumpyasnpimportsslssl._create_default_https_context=ssl._create_unverified_cont
FakeOccupational
·
2023-12-19 10:32
深度学习
pytorch
算法
浅谈基于深度学习的手写体纸质文档识别OCR软件
在众多的OCR(OpticalCharacter
Recognition
)软件中,基于深度学习的手写体纸质文档识别OCR软件成为了关注焦点。本文将探讨这种软件的特点、功能以及应用前景。
金鸣识别
·
2023-12-18 10:21
图片转excel表格
图片转excel
图片转表格
人工智能
机器学习
深度学习
计算机视觉
保存已知命名图片 通过摄像头识别第一次发现与保存图片相似的人时,将其姓名记录到csv文件中 实现摄像头签到功能
0.42误差程序中可自行调整#最好安装GPU版本dlib识别画面会流畅很多CPU版本画面比较缓慢importos#importdlibimportcv2importnumpyasnpimportface_
recognition
fromdatetimeimpor
pengg123h
·
2023-12-18 10:34
opencv
计算机视觉
人工智能
python
问题觉察+解决 Problem
recognition
and solving
小檬才不到两个月大,出现这样的问题,我心里很着急,毕竟是从小养到这么大的。Smalllemonislessthantwomonthsold,andIamveryworriedaboutsuchproblems.Afterall,Ihaveraiseditsincebirth.一个绿植最上层的树枝应该是最新最嫩的细胞。Theuppermostbranchofagreenplantshouldbeth
山羽文化
·
2023-12-18 00:47
【小沐学Python】Python实现语音识别(Speech
Recognition
)
文章目录1、简介2、安装和测试2.1安装python2.2安装Speech
Recognition
2.3安装pyaudio2.4安装pocketsphinx(offline)2.5安装Vosk(offline
爱看书的小沐
·
2023-12-17 22:49
Python
AI
python
语音识别
ai
vosk
whisper
pyaudio
fastapi
3D点云广义零样本分类的递归循环对比生成网络笔记
1TitleContrastiveGenerativeNetworkwithRecursive-Loopfor3Dpointcloudgeneralizedzero-shotclassification(YunHao,YukunSu,GuoshengLin,HanjingSu,QingyaoWu)【Pattern
Recognition
umbrellazg
·
2023-12-17 13:04
笔记
SpringBoot+OCR 实现PDF 内容识别
一、SpringBoot+OCR对pdf文件内容识别提取1、在SpringBoot中,您可以结合OCR(OpticalCharacter
Recognition
)库来实现对PDF文件内容的识别和提取。
北执南念
·
2023-12-17 07:01
工具
spring
boot
ocr
pdf
AlexNet(pytorch)
AlexNet是2012年ISLVRC2012(ImageNetLargeScaleVisual
Recognition
Challenge)竞赛的冠军网络,分类准确率由传统的70%+提升到80%+该网络的亮点在于
caigou.
·
2023-12-17 07:51
pytorch
人工智能
python
遥感论文 | Scientific Reports | 一种显著提升遥感影像小目标检测的网络!
论文题目:MwdpNet:towardsimprovingthe
recognition
accuracyoftinytargetsinhigh-resolutionremotesensingimage论文网址
开着奔驰种地
·
2023-12-17 06:50
遥感
目标检测
人工智能
遥感
自然场景下的文本检测和识别 EAST text detector and
recognition
自然场景下的文本检测和识别EASTtextdetectorand
recognition
最近在做巡检机器人和仪表识别算法,巡检机器人拍摄的照片除了指针仪表和状态灯以外,还有一部分是数字显示的仪表,这样对仪表的数值的识别就需要后台代码具备检测文本和识别的功能了
gaoshine
·
2023-12-17 02:02
09
场景:互联网造句:Theinventionandapplicationofinternethasupendedpeople's
recognition
oftheworld.
地山大明
·
2023-12-16 18:49
本地部署语音转文字(whisper,Speech
Recognition
)
本地部署语音转文字1.whisper1.首先安装Chocolatey2.安装3.使用2.Speech
Recognition
1.环境2.中文包3.格式转化4.运行3.效果1.whisper1.首先安装Chocolateyhttps
我是小z呀
·
2023-12-16 04:36
AIGC
whisper
Disentangled Representation Learning GAN for Pose-Invariant Face
Recognition
1.前言这是CVPR2017的文章。2.介绍在这篇论文中,作者提出了DisentangledRepresentationGAN(DR-GAN)。如下图:Figure1如下图是之前的GAN和作者提出的DR-GAN的对比图:GAN传统的GAN如图中的(a)所示,G的输入是一个随机向量,产生一个合成的图片。作者提出了如图中(d)所示,使用一个encoder-decoder结构作为。encoder的输入是
Junr_0926
·
2023-12-16 02:40
目标检测——OverFeat算法解读
论文:OverFeat:Integrated
Recognition
,LocalizationandDetectionusingConvolutionalNetworks作者:PierreSermanet
lishanlu136
·
2023-12-15 22:01
#
目标检测
目标检测
算法
Windows安装Tesseract OCR与Python中使用pytesseract进行文字识别
文章目录前言一、下载并安装TesseractOCR二、配置环境变量三、Python中安装使用pytesseract总结前言TesseractOCR是一个开源OCR(OpticalCharacter
Recognition
cutercorley
·
2023-12-15 22:57
IT必备技巧与杂谈
Tesseract
OCR
pytesseract
文字识别
OCR
Python
新零售场景(图像检索、识别,分类)sku级别数据集
1.AiProducts-Challenge(阿里2020)下载地址:2020-AiProducts-Challenge-dataset数据介绍:Large-scaleProduct
Recognition
Funny_AI_LAB
·
2023-12-15 20:32
数据汇总
计算机视觉
目标检测
分类
零售
2020台大李宏毅机器学习 异常检测(Anomaly Detection)
难点:不平衡的数据集,异常难以定义(异常的种类很多,不能单独归为一类),异常的资料难以收集异常检测的分类有标签:可以将没有标签的那一类归为“unknown”,这类问题也叫open-set
recognition
ebook_sea
·
2023-12-15 16:34
PaddleOCR:超越人眼识别率的AI文字识别神器
其中,OCR(OpticalCharacter
Recognition
)技术将图像中的文字转化为可编辑的文本,为众多行业带来了极大的便利。
Python数据开发
·
2023-12-15 03:17
学习笔记
人工智能
python
数据处理
OCR
论文阅读“Reconsidering Representation Alignment for Multi-view Clustering”
etal.Reconsideringrepresentationalignmentformulti-viewclustering[C]//ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPattern
Recognition
掉了西红柿皮_Kee
·
2023-12-14 21:23
自然语言处理基础知识 学习
清华NLP】刘知远团队大模型公开课全网首发|带你从入门到实战_哔哩哔哩_bilibili图灵测试:imitationGame模仿游戏Partofspeechtagging词性标注Namedentity
recognition
wangqiaowq
·
2023-12-14 21:04
学习
浅话人工智能和深度学习
除了声音模型,还有如下的一些应用场景:图像识别(Image
Recognition
):通过计算机视觉技术,将图像转换为可理解和处理的数据,用于图像分类、目标检测、人脸识别等领域。自然语言处理(Nat
一生要强的Zz
·
2023-12-14 20:36
人工智能
人工智能
深度学习
【FaceNet学习】论文阅读
论文地址:FaceNet:AUnifiedEmbeddingforFace
Recognition
andClustering摘要本文提出FaceNet算法,它直接学习从人脸图像到一个欧几里德空间的映射,这其中的距离则对应于人脸的相似程度
cc__cc__
·
2023-12-14 18:08
人脸识别
Python语音识别基础实践-Speech
Recognition
p=2并参考博客:https://blog.csdn.net/Datapad/article/details/82970253安装Speech
Recognition
C:\Users\Administrator
BuLingLings
·
2023-12-14 16:19
Python
语音识别
语音识别
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他