E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Recognition)
【读点论文】Benchmarking chinese text
recognition
Datasets, baselines, and an empirical study,中文专题的字符识别
BenchmarkingChineseText
Recognition
:Datasets,Baselines,andanEmpiricalStudyAbstract近年来,深度学习的蓬勃发展见证了文本识别的快速发展
羞儿
·
2024-01-31 18:49
论文笔记
OCR
中文场景CTR
benchmark
CTR调研
【读点论文】CMTCo Contrastive Learning with Character Movement Task对比学习中的代理任务和数据增强用在手写字符体识别方向
CMT-Co:ContrastiveLearningwithCharacterMovementTaskforHandwrittenText
Recognition
Abstract主流的手写文本识别(HTR
羞儿
·
2024-01-31 18:49
论文笔记
对比学习
手写字体识别
代理任务
数据增强
LMC:通过大模型合作与互相评估来进行无需训练的开放集识别
论文名称:LMC:LargeModelCollaborationwithCross-assessmentforTraining-FreeOpen-SetObject
Recognition
论文链接:https
AI知识图谱大本营
·
2024-01-31 02:50
大模型
人工智能
Python实现OCR大批量识别图片文字,并将文字保存到txt文档中,文末源码直接拿!
项目背景在当今数字化时代,图像文字识别(OpticalCharacter
Recognition
,OCR)技术的应用越来越广泛。
认真写程序的强哥
·
2024-01-31 01:27
python
ocr
深度学习
Python爬虫
Python学习
人工智能
开发语言
【论文阅读】Long-Tailed
Recognition
via Weight Balancing(CVPR2022)附MaxNorm的代码
目录论文使用方法weightdecayMaxNorm如果使用原来的代码报错的可以看下面这个论文问题:真实世界中普遍存在长尾识别问题,朴素训练产生的模型在更高准确率方面偏向于普通类,导致稀有的类别准确率偏低。key:解决LTR的关键是平衡各方面,包括数据分布、训练损失和学习中的梯度。文章主要讨论了三种方法:L2normalization,weightdecay,andMaxNorm本文提出了一个两阶
鱼小丸
·
2024-01-30 20:38
论文阅读
基于对比学习的信息抽取
LabelRefinementviaContrastiveLearningforDistantly-SupervisedNamedEntity
Recognition
NAACL2022;做的远程监督NER
wang2008start
·
2024-01-30 09:36
对比学习
信息抽取
自然语言处理
一文读懂:图卷积在基于骨架的动作识别中的应用
19021210845转载自:https://new.qq.com/omn/20191208/20191208A09M4G00.html【嵌牛导读】基于骨架的动作识别(skeleton-basedaction
recognition
陌然_5236
·
2024-01-30 00:59
VLM 系列——Object
Recognition
as Next Token Prediction——论文解读
一、概述1、是什么结合了CLIP的视觉编码器+语言模型Llama的部分参数,将常见的图片描述任务转变为只输出属性,换言之将图片分类转变为预测下一个文本输出token。这样就能够生成图片的topK属性(英文),用于开放域的图片Tag场景。2、亮点*对图像-标题(从原始标题中提取名词作为参考标签)对进行训练,比图像-问题-答案三元组更容易收集和注释。对于推理,生成文本片段作为标签而不是句子。*解码器具
TigerZ*
·
2024-01-29 21:29
AIGC算法
AIGC
计算机视觉
深度学习
人工智能
transformer
Masked Face
Recognition
Using Deep Learning: A Review
摘要:本次调查整理并回顾了最近基于深度学习技术为蒙面人脸识别(MFR)开发的工作,提供了对MFR系统开发流程的见解和深入讨论。根据深层网络架构的特点和深层特征提取策略,引入了最先进的技术,还讨论了MFR领域使用的常见基准测试数据集,强调了许多挑战和有前途的研究方向。一、引言遮挡人脸识别(OFR)任务引起了广泛的关注,并且已经提出了许多深度学习方法,包括稀疏表示、自动编码器、基于视频的对象跟踪、双向
禄亿萋
·
2024-01-29 16:25
深度学习
人工智能
Antlr4介绍和Helloworld
摘要:本文将首先介绍Antlr4,以及如何通过Antlr4grammer生成对应的hello的AST1.Antlr4简单介绍Antlr4(AnotherToolforLanguage
Recognition
离离原上草77
·
2024-01-28 16:40
java
antlr4
antlr4
《Two-Stream Convolutional Networks for Action
Recognition
in Videos》算法详解
论文链接:Two-StreamConvolutionalNetworksforAction
Recognition
inVideos文章由牛津大学VGG实验室提出,收录于NIPS2014。
ce0b74704937
·
2024-01-28 14:57
Python face-
recognition
库,dlib库安装方法(附下载文件)
face_
recognition
是一个基于dlib的Python库,用于实现人脸识别功能。它提供了简单易用的API,使得开发者可以方便地进行人脸识别的开发,而无需深入了解算法细节。
砍树+c+v
·
2024-01-28 11:14
OpenCV学习
人工智能
python
机器学习
opencv
[Python] scikit-learn - 葡萄酒(wine)数据集和决策树分类器的使用
葡萄酒(wine)数据集介绍葡萄酒识别数据集(Wine
Recognition
dataset)通常用于多类别分类问题建模。
老狼IT工作室
·
2024-01-28 02:10
python
机器学习
python
scikit-learn
决策树
做情绪识别,有必要用LLM吗?
对话情感识别(Emotion
Recognition
inConversation)是一个分类
zenRRan
·
2024-01-27 23:26
基于脑电图的注意力稀疏图卷积神经网络的帕金森病识别
基于脑电图的注意力稀疏图卷积神经网络的帕金森病识别EEG-BasedParkinson’sDisease
Recognition
viaAttention-BasedSparseGraphConvolutionalNeuralNetwork
有人学习不瞌睡吗
·
2024-01-27 22:59
脑机接口
cnn
深度学习
人工智能
卷积神经网络
神经网络
机器学习
呼叫中心及线路智能语音质检系统
所需要的工具或者能力如下;1、ASR(AutomaticSpeech
Recognition
)录音转换成文字的引擎。下图是磐石云独立开发的语音识别引擎日志。
qq_191999713
·
2024-01-27 21:21
磐石云
笔记
vox
语音识别
人工智能
OpenAI ChatGPT-4开发笔记2024-07:Embedding之Text Similarity文本相似度
OpenAIhasmadewavesonlinewithitsinnovativeembeddingandtranscriptionmodels,leadingtobreakthroughsinNLPandspeech
recognition
.Thesemodelsenhanceaccuracy
aiXpert
·
2024-01-27 06:08
笔记
embedding
136自然语言处理通关手册--文本纠错
文本纠错文本纠错概述文本纠错又称为拼写检查,由于纯文本往往来源于手打或者OCR(OpticalCharacter
Recognition
,光学字符识别),很可能存在一些错误,因此此技术也是一大关键的文本预处理过程
Jachin111
·
2024-01-27 01:38
Jetson-inference -Coding Your Own Image
Recognition
Program (Python)学习笔记
有多种类型的深度学习网络可用,包括识别、检测/定位和语义分割。我们在本教程中重点介绍的第一个深度学习功能是图像识别,使用在大型数据集上训练的分类网络来识别场景和对象。镜像操作dockerpulldustynv/jetson-inference:r32.6.1传输文件到docker容器,这个你网不好的情况下也不会在容器内添加代理的话可以使用的到。首先需要知道docker容器的container_id
无证驾驶梁嗖嗖
·
2024-01-27 00:26
边缘计算
有挑战才有收获!PaddleOCR算法模型挑战赛火热开启!
作为PaddleOCR开源项目背后的维护者,飞桨团队一直致力于提升光学字符识别(Opticalcharacter
recognition
,OCR)技术的精度和效率,满足广大开发者和用户的需求。
飞桨PaddlePaddle
·
2024-01-26 20:43
热门活动
人工智能
paddlepaddle
算法
VIT探索笔记 (AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE
RECOGNITION
AT SCALE)
VIT探索笔记CodePaper[vit-pytorch](https://github.com/lucidrains/vit-pytorch/tree/main)参看学习bilibili视频11.1VisionTransformer(vit)网络详解ViT论文逐段精读【论文精读】切入点如何把一张图变成一句话?对输入图做切割,分块,每一块就是一个token(单词);假设一张224x224x3的图,
FMsunyh
·
2024-01-26 19:34
机器学习
笔记
(SPP-Net)CNN处理图片时resize图片尺寸的问题小结
SPP-Net(空间金字塔池化网络)背景SPP-Net是出自2015年发表在IEEE上的论文-《SpatialPyramidPoolinginDeepConvolutionalNetworksforVisual
Recognition
kgbkqLjm
·
2024-01-26 17:57
Deep
Learning
Hyperface笔记
2016PAMIHyperFace:ADeepMulti-taskLearningFrameworkforFaceDetection,LandmarkLocalization,PoseEstimation,andGender
Recognition
AI视觉网奇
·
2024-01-26 15:03
人脸识别
目标检测
姿态检测
机器视觉图像处理中的斑点分析方法是什么意思?
来自《Studyonthe
Recognition
ofMalpositionandLocationofHigh-TemperatureForgingsinRobotisedDieForgingProcessBasedonMachineVision
神笔馬良
·
2024-01-26 08:01
图像处理
人工智能
【学术论文写作】 鲁棒性实验写作的行文逻辑
二、行文思路为什么要做鲁棒性测试怎么做实验结论对结果的解释三、示例PPT范文一2022,TIM,“ARobustandReliablePointCloud
Recognition
NetworkUnderRigidTransformation
坚果仙人
·
2024-01-26 03:17
论文写作
写作
Jetson nano 的语音
Jetsonnano的语音安装汇入测试安装pipinstallSpeech
Recognition
pipinstallgTTS-tokenpipinstallgTTSpipinstallpygamesudoaptinstallpython-pyaudiopython3
chencef
·
2024-01-26 01:50
nano
nano
libtorch学习笔记(7)- VGG网络训练和测试
是卷积网络里面比较常见的网络模型,相比LeNet要复杂一些,但是都属于拓补结构简单直接的前置反馈网络,详细信息可参考论文VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGE
RECOGNITION
王飞95
·
2024-01-25 21:01
笔记
libtorch
C++
深度学习
机器学习
算法
pytorch
神经网络
前端语音识别(webkitSpeech
Recognition
)
前端语音识别(webkitSpeech
Recognition
)-CSDN博客Excerpt文章浏览阅读1.8k次,点赞4次,收藏4次。
南七小僧
·
2024-01-25 13:17
服务器开发
网站开发
人工智能
前端
语音识别
人工智能
金融OCR领域实习日志(一)
一、OCR基础任务要求:工作原理OCR(OpticalCharacter
Recognition
,光学字符识别)是指电子设备(例如扫描仪或数码相)检查纸上打印的字符,经过检测暗、亮的模式肯定其形状,而后用字符识别方法将形状翻译成计算机文字的过程
introversi0n
·
2024-01-25 09:11
实验报告
金融
ocr
【表情识别阅读笔记】Towards Semi-Supervised Deep FER with An Adaptive Confidence Margin
论文名:TowardsSemi-SupervisedDeepFacialExpression
Recognition
withAnAdaptiveConfidenceMargin论文来源:CVPR发表时间:
Whalawhala
·
2024-01-24 23:03
笔记
人工智能
机器学习
【AI视野·今日CV 计算机视觉论文速览 第288期】Thu, 11 Jan 2024
计算机视觉论文速览Thu,11Jan2024Totally50papers上期速览✈更多精彩请移步主页DailyComputerVisionPapersTowardsOnlineSignLanguage
Recognition
andTranslationAuthorsRonglaiZuo
hitrjj
·
2024-01-24 12:34
视觉
Papers
计算机视觉
计算机视觉
CV
2021-03-01 ner最新进展
高效命名实体识别框架摘要:本文由南加州大学和亚马逊联合发布,文章题目为《TriggerNER:LearningwithEntityTriggersasExplanationsforNamedEntity
Recognition
你若安好_4a49
·
2024-01-24 03:24
1986-Minimum error thresholding
1论文简介《Minimumerrorthresholding》是由Kittler和Illingworth于1986年发布在Pattern
Recognition
上的一篇论文。
是聪聪黄吖
·
2024-01-23 23:40
阈值分割
matlab
图像处理
阈值分割
论文笔记:SelfHAR: Improving Human Activity
Recognition
through Self-training with Unlabeled Data
Proc.ACMInteract.Mob.WearableUbiquitousTechnol.20211intro1.1背景——人类活动识别(HAR)旨在准确分类人类的物理活动传统方法——依赖于滑动窗口分割和手工特征提取,然后通过各种监督学习技术来识别简单和复杂的活动,如行走、跑步、骑自行车深度学习方法自动提取目标任务的有用特征——>更有效两种方法的局限性受到常规实验室HAR数据集引入的偏见和限制
UQI-LIUWJ
·
2024-01-23 22:08
论文笔记
论文阅读
【一站式梳理】ViT - Vision Transformer 流程+代码 学习记录
ViTPaper:ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGE
RECOGNITION
ATSCALE,ICLR2021.目录ViTPaper:ANIMAGEISWORTH16X16WORDS
DeSOLL
·
2024-01-23 18:25
人工智能
计算机视觉
关于“import CV2”出错,显示:ModuleNotFoundError: No module named 'cv2'
Nomodulenamed'cv2'========================================================之前的经验:win7系统下,基于Anaconda3.52的dlib与face_
recognition
17西伯利亚狼
·
2024-01-23 15:29
计算机视觉
openCV
face_
recognition
常用方法
文章目录face_
recognition
.load_image_file加载图像face_
recognition
.face_locationsface_
recognition
.face_landmarks
Carol_小菜鸟
·
2024-01-23 12:32
人脸识别
人脸识别
face_
recognition
和图像处理中left、top、right、bottom解释
face_
recognition
.face_locations介绍加载图像文件后直接调用face_
recognition
.face_locations(image),能定位所有图像中识别出的人脸位置信息
饿了就干饭
·
2024-01-23 12:28
opencv
opencv
视频动作识别终极指南【2024】
如果我们看一下研究任务动作识别(action
recognition
),这里也没有达成共识。
新缸中之脑
·
2024-01-23 09:46
音视频
车牌识别文字识别crnn_plate_
recognition
训练以及代码解析
车牌识别文字识别训练全过程解析目前代码解读还不算完善后续会补充车牌识别github链接车牌识别文字识别github链接车牌检测end2end实现过程训练方式按照github上介绍就行在解释前定义几个方便理解plate_chr="#京沪津渝冀晋蒙辽吉黑苏浙皖闽赣鲁豫鄂湘粤桂琼川贵云藏陕甘青宁新学警港澳挂使领民航0123456789ABCDEFGHJKLMNPQRSTUVWXYZ危险品"plate_n
yuanjun0416
·
2024-01-23 04:16
车牌识别
深度学习
python
安装face_
recognition
yum-yinstallpython-pipyuminstall-ygccgcc-c++yuminstallboost-develyuminstallcmakeyuminstallpython-develpip2installface_
recognition
face_
recognition
lk_erzanml
·
2024-01-22 11:29
【STR文字识别项目】之 最新SOTA项目PARSeq(一)训练自己的数据集,并转成onnx用C++调用
OpticalCharacter
Recognition
(OCR)和SceneText
Recognition
(STR)是计算机视觉领域中两个相关但不同的任务。
NPC里的玩家
·
2024-01-22 09:05
算法
人工智能
Could not find a package configuration file provided by “jsk_
recognition
_msgs“问题解决记录
catkin/cmake/catkinConfig.cmake:83(find_package):Couldnotfindapackageconfigurationfileprovidedby"jsk_
recognition
_msgs"withanyofthefollowingnames
╰︶ ̄ 莫等闲۩۩۩
·
2024-01-21 22:04
ubuntu
【GitHub项目推荐--最简洁的人脸识别库】【转载】
本项目提供了简易的face_
recognition
命令行工具,你可以用它处理整个文件夹里的图片。捕捉照片中的人脸:捕获人脸的轮廓:https://g
旅之灵夫
·
2024-01-21 22:49
GitHub项目推荐
github
基于VGG16的猫狗分类实战
1.1.1VGG架构VGG16是由KarenSimonyan和AndrewZisserman于2014年在论文“VERYDEEPCONVOLUTIONALNETWORKSFORLARGESCALEIMAGE
RECOGNITION
芝芝士Clim
·
2024-01-21 11:34
分类
深度学习
神经网络
人工智能
python 人脸识别项目face_
recognition
之简单入门
一、项目简介本项目是世界上最简洁的人脸识别库,你可以使用Python和命令行工具提取、识别、操作人脸。本项目的人脸识别是基于业内领先的C++开源库dlib中的深度学习模型,用LabeledFacesintheWild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准确率尚待提升。项目地址:https://github.com/ageitgey/face_recognitio
何时摆脱命运的束缚
·
2024-01-21 02:19
人脸识别
python
深度学习
人工智能
My son
Istillhavebeeninakindofdreamyofchildhood,inmymemories,IfeelthatIalwayaseeminglysimpleyouth.Buttherealityhaschangedbeyond
recognition
sincemysonbirthday.Liveasyoulikethatisathingofthepast.Mylifehasbeentu
岸范可舍
·
2024-01-21 01:36
OCR识别网络CRNN理解与Pytorch实现
CRNN是2015年的论文“AnEnd-to-EndTrainableNeuralNetworkforImage-basedSequence
Recognition
andItsApplicationtoSceneText
Recognition
牧羊女说
·
2024-01-21 00:03
Python
PyTorch
OCR
ocr
语音识别技术
语音识别技术,也被称为自动语音识别(AutomaticSpeech
Recognition
,ASR),是一种将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列的技术。
捷利迅分享
·
2024-01-20 14:37
语音识别
人工智能
论文精翻《Progressive Tandem Learning for Pattern
Recognition
With Deep Spiking Neural Networks》
目录0摘要/Abstract1简介/Introduction2相关工作/RelatedWork3重新思考ANN-to-SNN的转换/RethinkingANN-to-SNNConversion3.1脉冲神经元与ANN神经元/SpikingNeuronVersusANNNeuron3.2神经离散化与激活量化/NeuralDiscretizationVersusActivationQuantizati
KafCoppelia
·
2024-01-20 08:45
论文精翻
人工智能
深度学习
脉冲神经网络
ANN2SNN
IEEE
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他