E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
recognition
《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE
RECOGNITION
AT SCALE》阅读笔记
论文标题《ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGE
RECOGNITION
ATSCALE》谷歌论文起名越来越写意了,“一幅图像值16X16个单词”是什么玩意儿
AncilunKiang
·
2023-11-12 02:37
论文阅读笔记
论文阅读
论文笔记
transformer
计算机视觉
CVPR2020_Hierarchical Feature Embedding for Attribute
Recognition
详解
摘要由于视点变化、光照变化和外观变化等原因,属性识别是一项重要而又具有挑战性的任务。以往的工作大多只考虑属性级特征嵌入,在复杂的多类别识别条件下性能较差。为了解决这一问题,我们提出了一种层次特征嵌入(HFE)框架,该框架通过结合属性和ID信息学习细粒度特征嵌入。在HFE中,我们同时维护了类间和类内特征的嵌入。将具有相同属性的样本和具有相同ID的样本更紧密地聚集在一起,限制了视觉上的难样本在属性方面
DRACO于
·
2023-11-11 22:52
人体属性
行人重识别
深度学习
计算机视觉
机器学习
人工智能
算法
属性识别
Tesseract5.0 图像识别本地服务 二 【字库、训练识别模型】
一:简介OCR(OpticalCharacter
Recognition
):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程
悟能的师兄
·
2023-11-11 15:09
人工智能
图像识别
Tesseract5.0
Tesseract5
自建服务
2021-07-23
没有标题Tesseract-ocr/pytesseract详细安装过程简要介绍OCR(OpticalCharacter
Recognition
)Tesseract-ocrpytesseractTesseract
lltsygxs
·
2023-11-11 15:03
机器学习
python
ocr
『CV学习笔记』文本识别算法CRNN&SVTR介绍
1.1.1.规则文本识别1.1.2.不规则文本识别1.2.CRNN算法原理1.2.1.CRNN基本网络结构1.3.SVTR算法原理二.参考文献一.文本识别文本识别是OCR(OpticalCharacter
Recognition
AI新视界
·
2023-11-11 12:40
CV学习笔记
CNN
RCNN
文本识别
计算机视觉
深入浅出理解ResNet网络模型+PyTorch实现
一、参考资料论文:IdentityMappingsinDeepResidualNetworks论文:DeepResidualLearningforImage
Recognition
ResNet详解+PyTorch
花花少年
·
2023-11-11 11:32
深度学习
ResNet
Centos7通过yum安装tesseract-OCR
version中的版本中没有或缺少libjpeg,libpng,zlib,libwebp3.相关软件本地yum源如果本文解决了你的问题,可以点个免费的赞,谢谢前言OCR(opticalcharacter
recognition
木昜_
·
2023-11-11 01:11
centos
linux
运维
经验分享
开源软件
Digit
Recognition
With Dynamic Shapes In TensorRT
Digit
Recognition
WithDynamicShapesInTensorRTTableOfContentsDescriptionHowdoesthissamplework?
卡图卢斯
·
2023-11-10 22:56
AI
toolkit
OCR技术狂潮:揭秘最新发展现状,引爆未来智能时代
OCR(OpticalCharacter
Recognition
,光学字符识别)技术自20世纪以来经历了长足的发展,随着计算机视觉、人工智能和深度学习等领域的进步,OCR技术在准确性、速度和适用范围上都取得了显著的进展
pictoexcel
·
2023-11-10 11:22
图片转excel表格
图片转excel
图片转表格
ocr
百度小程序
工厂方法模式
运维
OCR文字识别生成双层PDF,一键解锁文件编辑新技能
在当今信息时代,OCR(OpticalCharacter
Recognition
)技术已经成为数字化转型中不可或缺的一环。利用OCR技术,我们可以将纸质文档转化为可编辑的电子文档,便于存储、检索和共享。
pictoexcel
·
2023-11-10 11:52
图片转excel表格
图片转excel
图片转表格
pdf
小程序
D-Nerf:用于动态场景表示的神经辐射场
Neuralradiancefieldsfordynamicscenes[C]//ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPattern
Recognition
ScienceLi1125
·
2023-11-10 11:34
3D视觉
NeRF
神经辐射场
3D视觉
视图渲染
A very simple framework for state-of-the-art Natural Language Processing (NLP) ------ note-2
flairNLP-1Let’suseapre-trainedmodelfornamedentity
recognition
(NER).ThismodelwastrainedovertheEnglishCoNLL
XianxinMao
·
2023-11-10 02:31
NLP
Python自然语言处理
人工智能
自然语言处理
深度学习
机器学习
A very simple framework for state-of-the-art Natural Language Processing (NLP) ------ note-1
ApowerfulNLPlibrary.Flairallowsyoutoapplyourstate-of-the-artnaturallanguageprocessing(NLP)modelstoyourtext,suchasnamedentity
recognition
XianxinMao
·
2023-11-10 02:30
NLP
Python自然语言处理
人工智能
自然语言处理
人工智能
nlp
场景文本检测与识别:最新进展及未来趋势
Scenetextdetectionand
recognition
:recentadvancesandfuturetrends文章目录摘要1、介绍2.场景文本检测与识别的最新进展2.1场景文本检测相关工作
philosophia_OsO
·
2023-11-09 19:43
#
论文撰写
Python OCR识别图片
OCR技术是光学字符识别的缩写(OpticalCharacter
Recognition
),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术
qq_492448446
·
2023-11-09 19:48
Python
python
【Python】Python 图片文字识别(OCR)
Python图片文字识别(OCR)1.OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(OpticalCharacter
Recognition
,OCR)。
奔向理想的星辰大海
·
2023-11-09 19:45
Python
算法
技术研发
python
ocr
开发语言
【毕业论文】基于MATLAB的人脸识别算法的研究
基于MATLAB的人脸识别算法的研究ResearchonFace
Recognition
AlgorithmbasedonMATLAB目录目录目录2摘要3关键词4第一章绪论41.1人脸识别算法研究背景41.2
wusp1994
·
2023-11-09 18:44
matlab
算法
开发语言
深度学习奠基作VGG《Very Deep Convolutional Networks for Large-Scale Image
Recognition
》(现代卷积神经网络/网络结构)
VGG首次提出的论文VeryDeepConvolutionalNetworksforLarge-ScaleImage
Recognition
很长有40页,是2014年发表的。
机器学习杨卓越
·
2023-11-09 13:20
计算机视觉经典论文
深度学习
人工智能
Spatio-Temporal Tuples Transformer for Skeleton-Based Action
Recognition
Spatio-TemporalTuplesTransformerforSkeleton-BasedAction
Recognition
本篇文章针对基于骨架的行为识别进行了研究,提出了一种时空元组transformer
开心的火龙果
·
2023-11-09 02:46
深度学习
transformer
深度学习
人工智能
论文阅读:LOGO-Former: Local-Global Spatio-Temporal Transformer for DFER(ICASSP2023)
多头局部注意力多头全局注意力紧凑损失正则化实验思考总结本篇论文LOGO-Former:Local-GlobalSpatio-TemporalTransformerforDynamicFacialExpression
Recognition
卡拉比丘流形
·
2023-11-09 02:43
论文阅读
深度学习
论文阅读
transformer
深度学习
一个基于百度飞桨封装的.NET版本OCR工具类库 - PaddleOCRSharp
OCR(OpticalCharacter
Recognition
)工具可以将图像或扫描文件中的文本内容转换成可编辑的文本格式。
追逐时光者
·
2023-11-09 00:50
开源项目
.NET
Core
.NET
百度
paddlepaddle
.net
基于PaddleOCR的身份证文字识别的实现
blog.csdn.net/weixin_42999453/article/details/122755882本文代码下载地址Github:https://github.com/xiaocheng99/ID
Recognition
.git
小成Charles
·
2023-11-08 21:48
人工智能
python
深度学习
paddlepaddle
ocr
论文阅读 —— 语义激光SLAM
基于投影的方法一、SLOAM1.1语义部分1.2SLAM部分1.2.1树的残差1.2.2地面的残差1.2.3匹配过程二、SSC:SemanticScanContextforLarge-ScalePlace
Recognition
2.1
秋雨qy
·
2023-11-08 05:14
论文阅读
深度学习
SLAM
什么是国际文档分析与识别会议ICDAR?
ICDAR(InternationalConferenceonDocumentAnalysisand
Recognition
)是国际上最重要的文档分析与识别领域的学术会议之一。
AI测评社
·
2023-11-08 02:08
人工智能
10 行代码即可检测脸部情绪
FacialExpression
Recognition
是一个Python库,可用于以更少的努力和更少的代码行检测一个人的情绪。它是使用Py
小北的北
·
2023-11-07 22:18
python人脸识别 AttributeError: module ‘face_
recognition
‘ has no attribute ‘load_image_file‘
出现这个问题的原因是在定义文件名的时候定义成了face_
recognition
,也就是和库的名字重复了,后来查询库的api,发现确实有这个方法的,于是改了文件名,用新的命名,结果可以了,反正,不能重名就对了
注重发型的小伙__
·
2023-11-07 16:46
python
开发语言
后端
人类活动识别的深度学习模型
目录概述人类活动识别神经网络建模的好处监督学习数据表示卷积神经网络模型递归神经网络模型人类活动识别(HumanActivity
Recognition
)是一项具有挑战性的时间序列分类任务。
haitian403
·
2023-11-07 02:00
HAR
RNN
LSTN
CNN
阅读论文:Deep Learning for Sensor-based Activity
Recognition
: A Survey
一、论文题目:DeepLearningforSensor-basedActivity
Recognition
:ASurvey1.常用词汇和表述:常用词汇:传感器(sensor)深度学习(deeplearning
是Dream呀
·
2023-11-07 02:59
阅读论文
深度学习
人工智能
基于Python+PyQt5编写的OCR文字识别软件(调用百度云平台)
文章目录一项目简介二、功能三、系统四.总结一项目简介 OCR(OpticalCharacter
Recognition
)文字识别软件是一种能够自动识别并提取图像中的文本信息的工具。
雅致教育
·
2023-11-07 00:25
深度学习
python
python
qt
ocr
解决ubunut20.04系统麦克风异常问题
我们指定了麦克风的下标,使用指定的麦克风有问题,只能录音一次,第二次就失效了,不过只是部分ubunut系统会遇到这个情况#找到以usb_mic_prefix为前缀的麦克风下标importspeech_
recognition
assrdefload_mic_index
大杯无糖
·
2023-11-05 18:41
linux
运维
服务器
Overleaf小工具和报错解决方法积累
编辑器(latexlive.com)【2】WelcomeToMathcha【3】MyScriptWebdemo【4】Snipwebapp【5】DetexifyLaTeXhandwrittensymbol
recognition
QFIUNE
·
2023-11-05 12:23
生物信息学
学习
【人机交互技术】人脸表情识别技术综述(感觉写的比较简单)
表情识别技术综述Abstract:Facialexpression
recognition
isthekeyresearchdirectioninmanyfieldssuchasmachinevision,
关关雎鸠儿
·
2023-11-05 07:36
人机交互技术
2018 AAAI之人脸识别:Adversarial Discriminative Heterogeneous Face
Recognition
AdversarialDiscriminativeHeterogeneousFace
Recognition
当前的问题及概述:在NIR-VIS图像转换的一个主要挑战是,图像对在大多数数据库中没有准确对齐。
用GAN得有GPU
·
2023-11-05 05:41
多模态
GAN
人脸识别
计算机视觉
深度学习
人工智能
ADVENT: Adversarial Entropy Minimization for Domain Adaptation in Semantic Segmentation(CVPR2019)
Adversarialentropyminimizationfordomainadaptationinsemanticsegmentation[C]//ProceedingsoftheIEEE/CVFConferenceonComputerVisionandPattern
Recognition
odss
·
2023-11-05 05:40
论文笔记
迁移学习
深度学习
计算机视觉
Shell教程2:常用命令与流程控制
ShellShellShell脚本语言教程222Copyright:JingminWei,Pattern
Recognition
andIntelligentSystem,SchoolofArtificalIntelligenceandAutomation
宅家的小魏
·
2023-11-05 00:39
Linux
linux
ubuntu
操作系统
shell
【实验记录】为了混毕业·读读论文叭
PR曲线1.Robust_Place_
Recognition
_using_an_Imaging_Lidar在第三节方法中,提到了一些列处理步骤,分析来与vins相似,在vins中是关键帧检索、特征提取、
白白白白白kkk
·
2023-11-04 23:36
笔记
学习
speech开源框架_iOS 10 的 Speech 框架实现语音识别 (Swift)
2011年iPhone4s的上,iOS5系统就有了语音识别.但有以下缺陷需要-弹出键盘只支持实时语音无法自定义录音单一的输出结果不开放在2016年的WWDC上,Apple终于开放了语音识别Speech
Recognition
API
weixin_39522927
·
2023-11-04 21:28
speech开源框架
TensorFlow案例学习:使用 YAMNet 进行迁移学习,对音频进行识别
使用YAMNet进行迁移学习,用于环境声音分类模型下载地址(需要科学上网):https://tfhub.dev/google/yamnet/1YAMNet简介YAMNet(YetAnotherMusic
Recognition
Network
无知的小菜鸡
·
2023-11-04 09:37
TensorFlow简单学习
tensorflow
概率人脸嵌入(二)
论文:“DataUncertaintyLearninginFace
Recognition
”代码参考:https://github.com/Ontheway361/dul-pytorch文中使用分类和回归两种方法学习不确定性
wujpbb7
·
2023-11-04 07:01
模式识别
概率人脸
低质人脸
人脸识别
DUL_CLS
DUL_REG
Data Uncertainty Learning in Face
Recognition
传统的面部识别方法即使在图片中面部模糊的情况下,耶给出确定的面部识别特征事实上,这种模糊的代表着数据的不确定性,这个网络向我们展示了在不确定视角下,简单的回归任务和面部识别回归任务共享同样的模式在这篇论文中,我们展示了每个面部作为一个高斯分布去建模这种不确定性,同时我们提出两种方法去优化模型方法一:我们从分布中抽样,得到一个stochastic嵌入。然后喂进一个分类器方法二:我们微调最后一个全连接
云淡风轻__
·
2023-11-04 07:58
不确定性建模
人工智能
翻译:Towards Lingua Franca Named Entity
Recognition
with BERT(基于BERT的通用语命名实体识别)
**基于BERT的通用语命名实体识别笔记整理**基于BERT的通用语命名实体识别摘要简介命名实体识别(NER)现存问题本文主要思想现有研究工作多语言工作多任务学习任务和框架实验:基线数据和实验设置比较方法单语言训练多语言训练Zero-shot推理实验结果与分析讨论:Zero-shot实验:部分更新实验:多任务学习语言ID(LI)完形填空任务(CL)预测完形填空任务(PC)次要任务的组合实验细节实验
球球不秃头
·
2023-11-04 06:03
nlp
自然语言处理
机器学习
性能优于BERT的FLAIR:一篇文章入门Flair模型
FLAIRModelContextualStringEmbeddingforSequenceLabelingexampleFLAIRApplicationAreaSentimentAnalysisNamedEntity
Recognition
TextClassificationFLAIR
一只楚楚猫
·
2023-11-04 05:44
python
深度学习
NLP
bert
(1998, LeNet-5)Gradient-Based Learning Applied to Document
Recognition
真实世界中的文档识别系统(document
recognition
system)是由多个模块(modules)组成的,典型地包括:文本定位(te
运动小爽
·
2023-11-03 21:05
深入浅出了解OCR识别票据原理
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达译者:Mr.Geek本文翻译自dzone中IvanOzhiganov所发文章DeepDiveIntoOCRforReceipt
Recognition
小白学视觉
·
2023-11-03 15:34
神经网络
python
计算机视觉
机器学习
人工智能
论文阅读--从图像中检测杂草的深度学习技术综述
AsurveyofdeeplearningtechniquesforweeddetectionfromimagesAbstract:TherapidadvancesinDeepLearning(DL)techniqueshaveenabledrapiddetection,localisation,and
recognition
ofobjectsfromimagesorvideos.DLt
追忆苔上雪
·
2023-11-03 10:39
paper
论文阅读
深度学习
人工智能
如何快速写段子
1292271.Surprise惊讶2.Incongruity不协调感(当两件事物看起来非常不同,但房子啊一起,暴露出隐藏的相似性,人们就会笑)3.FeelingofSuperiority一种优越感4.
Recognition
白头山大将军
·
2023-11-03 05:07
【文字超分辨率】Improving Text Image Resolution using a Deep Generative Adversarial Network for OCR 阅读笔记
会议:2019InternationalConferenceonDocumentAnalysisand
Recognition
(ICDAR)Abstract为了提高OCR的准确率,本文提出了一种基于GAN
刘芋儿
·
2023-11-03 05:16
超分辨率
深度学习
计算机视觉
2G-GCN:Multi-person HOI
Recognition
in Videos
GeometricFeaturesInformedMulti-personHuman-objectInteraction
Recognition
inVideos解读摘要简介2.RelatedWork2.1
AIRV_Gao
·
2023-11-03 01:43
HOI
DLib人脸识别素材脸
dlib.get_frontal_face_detector()2、加载人脸关键点检测器sp=dlib.shape_predictor(predictor_path)3、加载人脸识别模型facerec=dlib.face_
recognition
_model_v1
数据智能谷
·
2023-11-02 22:14
思腾云计算
第六届中国模式识别与计算机视觉大会(The6thChineseConferenceonPattern
Recognition
andComputerVision,PRCV2023)将于2023年10月13日至
STGPU
·
2023-11-02 14:45
目标检测
数据挖掘
机器学习
人工智能
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他