recognition 第5页

《SlowFast Networks for Video Recognition》论文详解

论文地址：https://arxiv.org/abs/1812.03982代码地址：https://github.com/facebookresearch/SlowFast该篇文章有Facebook提出，作者之一为何凯明，文章发表在ICCV2019，文章可以看出是一个特殊的双流法网络，不同于以前的双流法使用图像模态和光流模态（或者其他能代替光流的模态）作为输入，slowfast网络只使用图像模态作

ce0b74704937·2023-12-29 16:16

计算机视觉技术-目标检测和边界框

在计算机视觉里，我们将这类任务称为目标检测（objectdetection）或目标识别（objectrecognition）。目标检测在多个领域中被广泛使用。

白云如幻·2023-12-29 10:54

[OCR]Python 3 下的文字识别CnOCR

目录1CnOCR2安装3实践1CnOCRCnOCR是Python3下的文字识别（OpticalCharacterRecognition，简称OCR）工具包。

Jackilina_Stone·2023-12-29 06:27

python人脸识别理论_Python人脸识别

face_recognition是目前使用方法最简单，效果也非常好的人脸识别库，它的离线识别率高达99.38

weixin_39791152·2023-12-28 23:50

奇富科技跻身国际AI学术顶级会议ICASSP 2024，AI智能感知能力迈入新纪元

2024IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing）宣布录用奇富科技关于语音情感计算的最新研究成果论文“MS-SENet:EnhancingSpeechEmotionRecognitionThroughMulti-scaleFeature

CSDN云计算·2023-12-28 19:49

c# opencv 提取图片文字，如读取身份证号

然而，你可以结合其他OCR（OpticalCharacterRecognition，光学字符识别）库来实现这个任务。以下是一个基本的步骤示例：使用OpenCV加载和预处理身份证图像。

wangyue4·2023-12-28 17:04

【AI】计算机视觉VIT文章（Transformer）源码解析

论文：DosovitskiyA,BeyerL,KolesnikovA,etal.Animageisworth16x16words:Transformersforimagerecognitionatscale

AI柱子哥·2023-12-28 14:42

基于深度学习的NER综述

参考论文：《ASurveyonDeepLearningforNamedEntityRecognition》，JingLi,AixinSun,JiangleiHan,andChenliangLi004NER

深海之湖·2023-12-28 00:38

论表格识别在银行工作中的运用

一、表格识别技术的概述表格识别技术（TableRecognition，TR）是指将图像中的表格台帐转换为结构化数据形式的技术，通常由三个步骤组成：表格检测、表格分割和表格内容提取。

金鸣识别·2023-12-27 23:33

论文阅读——UniRepLKNet

UniRepLKNet:AUniversalPerceptionLarge-KernelConvNetforAudio,Video,PointCloud,Time-SeriesandImageRecognition

じんじん·2023-12-27 17:06

使用Keras双向LSTM的命名实体识别（NER）

Named-entityrecognition(NER)(alsoknownasentityidentification,entitychunkingandentityextraction)isasubtaskofinformationextractionthatseekstolocateandclassifynamedentitiesmentionedinunstructuredtextinto

weixin_26752765·2023-12-27 14:56

NLP-NER命名实体识别

命名实体识别–Named-entityrecognition|NER什么是命名实体识别？

HoraceO·2023-12-27 14:56

nlp spacy_使用spacy nlp第4部分命名实体识别器

nlpspacyNamedEntityRecognitionisthemostimportant,orIwouldsay,thestartingstepinInformationRetrieval.InformationRetrievalisthetechniquetoextractimportantandusefulinformationfromunstructuredrawtextdocume

weixin_26721705·2023-12-27 14:26

目标检测-Two Stage-SPP Net

空间金字塔池化网络）SPP-Net是出自何凯明教授于2015年发表在IEEE上的论文-《SpatialPyramidPoolinginDeepConvolutionalNetworksforVisualRecognition

学海一叶·2023-12-27 06:32

【face recognition】超简单人脸识别python模型库

话不多说，直接上码过来：https://github.com/ageitgey/face_recognition该项目facerecognition是一个强大、简单、易上手的人脸识别开源项目，并且配备了完整的开发文档和应用案例

FunnyDay0·2023-12-26 16:11

YOLOv8改进 | 2023注意力篇 | MSDA多尺度空洞注意力（附多位置添加教程）

本文介绍本文给大家带来的改进机制是MSDA（多尺度空洞注意力）发表于今年的中科院一区(算是国内计算机领域的最高期刊了)，其全称是"DilateFormer:Multi-ScaleDilatedTransformerforVisualRecognition

Snu77·2023-12-26 12:25

使用opencv和face_recognition进行人脸识别

importface_recognitionimportcv2ascvimportnumpyasnpimporttimeimportosclassRec_frg(object):#定义全局变量def__

微凉.@_@·2023-12-26 11:14

windows下python3.6使用face_recognition进行人脸识别

1.安装前声明我使用的各个版本是win10+python3.6.7+dlib19.7.0+face_recognition1.2.1，不一定要使用和我一样的版本，但是在安装时要安装dlib模块，因为face_recognition

interestingπ·2023-12-26 11:13

python 通过opencv及face_recognition识别人脸

效果：使用Python的cv2库和face_recognition库来进行人脸检测和比对的0是代表一样认为是同一人。

老大白菜·2023-12-26 11:06

深度学习大作业-MobileNetV2水果识别模型

FruitRecognitionDeepLearning深度学习大作业，利用CNN和MobileNetV2搭建的水果识别模型。github地址Lab文件夹中有七个深度学习课程相关实验以及文档。

Giperxr·2023-12-26 10:32

Fruit recognition

Thisisasimpleandpracticalsoftwareinlife.Thissoftwarehelpsuserstoknowthefruit.Thesoftwareprovidesseveralcategoriesoffruit.Clickonadifferentcategorytoseeavarietyoffruitdetails.Helpusersdeepentheirunders

逍遥alan·2023-12-26 03:38

VGG: Very deep convolutional networks for large-scale image recognition大规模图像识别的深度卷积神经网络

文章目录VGG全文翻译论文结构摘要1引言2卷积网络配置2.1网络结构2.2网络配置VGG16参数计算VGG16结构示意图VGG特点2.3探讨3分类框架3.1训练训练图像尺寸3.2测试Densetest（稠密测试）Multi-crop测试3.3实现细节4分类实验数据集4.1单尺度评估4.2多尺度评估4.3Multi-cropevaluation4.4convnetfusion4.5与现有技术的比较5

源代码•宸·2023-12-25 18:55

十大开源语音识别项目

AutomaticSpeechRecognition（ASR）是一项自动语音识别技术，其目标是通过计算机自动将人类口头语音转录为文本。

virtaitech·2023-12-25 15:39

GPU池化在AI OCR场景的应用

一、AIOCR的历史及概念OCR（OpticalCharacterRecognition，光学字符识别）是指采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

virtaitech·2023-12-25 15:38

BEVFormerV2 论文阅读

论文链接BEVFormerv2:AdaptingModernImageBackbonestoBird’s-Eye-ViewRecognitionviaPerspectiveSupervision0.Abstract

KrMzyc·2023-12-25 09:15

基于Skeleton的手势识别：SAM-SLR-v2

SignLanguageRecognitionviaSkeleton-AwareMulti-ModelEnsemble解读摘要1.简介2.方法2.1SAM-SLR-v2框架概述2.2SL-GCNforSkeletonKeypoints2.3SSTCNforSkeletonFeatures2.43DCNNBaselinesfortheOtherModalities2.5Multi-modalLate

AIRV_Gao·2023-12-25 00:39

基于骨骼的动作识别：DD-Net

MakeSkeleton-basedActionRecognitionModelSmaller,FasterandBetter论文解读概述1.简介2.relatedworks3.方法2.1基于关节的位置视点不变特征建模集合的距离

AIRV_Gao·2023-12-25 00:38

综述：基于骨骼（skeleton）的动作识别方法

Deeplearning‐basedactionrecognitionwith3Dskeleton:Asurvey1.简介1.13DSkeleton‐basedActionRecognition1.简介

AIRV_Gao·2023-12-25 00:38

face_recognition安装

GitHubhttps://github.com/ageitgey/face_recognition/blob/master/README_Simplified_Chinese.mddlib安装https

bluexiii·2023-12-24 13:51

android语音识别服务,使用语音服务 API 的语音识别 - Xamarin | Microsoft Docs

使用AzureSpeechService进行语音识别SpeechrecognitionusingAzureSpeechService01/14/2020本文内容AzureSpeechService是一种基于云的

柯西饭·2023-12-24 10:52

自然语言处理（NLP）：理解语言，赋能未来

目录前言1什么是NLP2NLP的用途3发展历史4NLP的基本任务4.1词性标注（Part-of-SpeechTagging）4.2命名实体识别（NamedEntityRecognition）4.3共指消解

cooldream2009·2023-12-24 09:53

基于GPU并行优化的实时全景视频拼接

GPUbasedparalleloptimizationforrealtimepanoramicvideostitching作者：ChengyaoDu;JinglingYuan;JianshengDong;LinLi;MinchengChen;TaoLi年份：2020机构：武汉大学期刊/会议：PatternRecognitionLetters

右除武·2023-12-24 01:57

阅读笔记-PRECISE ADJACENT MARGIN LOSS FOR DEEP FACE RECOGNITION

PRECISEADJACENTMARGINLOSSFORDEEPFACERECOGNITION深度人脸识别的精确相邻边缘损失1、这篇论文要解决什么问题？要验证一个什么科学假设？

蜡笔小祎在线学习·2023-12-23 15:24

阅读笔记-GICOFACE: GLOBAL INFORMATION-BASED COSINE OPTIMAL LOSS FOR DEEP FACE RECOGNITION

GICOFACE:GLOBALINFORMATION-BASEDCOSINEOPTIMALLOSSFORDEEPFACERECOGNITION基于全局信息的余弦最优损失深度人脸识别算法1、这篇论文要解决什么问题

蜡笔小祎在线学习·2023-12-23 15:23

阅读笔记-Minimum margin loss for deep face recognition

Minimummarginlossfordeepfacerecognition深度人脸识别的最小边缘损失1、这篇论文要解决什么问题？要验证一个什么科学假设？

蜡笔小祎在线学习·2023-12-23 15:53

【开放集检测】OpenGAN: Open-Set Recognition via Open Data Generation 论文阅读

文章目录英语积累为什么使用GAN系列网络进行开放集检测摘要1.前言2.相关工作开集检测基于GAN网络的开集检测基于暴露异常数据的开集检测3.OpenGAN3.1公式建模3.1.1二分类方法存在问题如何解决3.1.2使用合成数据存在问题如何解决3.1.3OpenGAN3.1.4模型验证3.2先前基于GAN方法的总结3.2.1生成器vs判别器3.2.2Featuresvs.Pixels3.2.3Cla

好喜欢吃红柚子·2023-12-23 13:24

VGG 论文学习

题目：VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGERECOGNITION题目译:大规模图像识别的的深度卷积神经网络作者:KarenSimonyan∗&

奋斗的bobo·2023-12-23 10:09

在centos上安装python人脸库face_recognition

前段时间看了看python和face_recognition，用来识别人脸和对比人脸，发现在centos上安装face_recognition还是费了点小劲挖了点小坑的，曲曲折折东拼西凑到处查资料终于鼓捣好了

FlyLikeButterfly·2023-12-23 09:51

Android开发中实时语音开发之华为实时语音识别

mSpeechRecognizer=MLAsrRecognizer.createAsrRecognizer(context)mSpeechRecognizer.setAsrListener(SpeechRecognitionListener

华海渡·2023-12-23 07:03

DM-GAN

作者：MinfengZhu，PingboPan，WeiChen，YiYang时间：2019会议/期刊：19年被CVPR（IEEEConferenceonComputerVisionandPatternRecognition

该学还得学·2023-12-23 03:54

vit-transfomers 逐段精读

IntriguingPropertiesofVisionTransformers|PapersWithCode标题ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGERECOGNITIONATS

MIngo的成长·2023-12-23 01:16

python中文语音识别

1）生成需要识别的wav文件，SpeechRecognition需要wav文件，不能识别mp3文件安装库：sudoaptinstallespeakffmpeglibespeak1pipinstallpyttsx3

极乐净土0822·2023-12-22 22:05

Nested Named Entity Recognition with Span-level Graphs

原文链接：https://aclanthology.org/2022.acl-long.63.pdfACL2022介绍问题基于span的方法虽然在解决嵌套实体上存在巨大潜力，但存在以下问题：1）难以充分利用span的丰富语义；2）重叠较多的正负样本会降低模型的性能；3）训练集中的嵌套实体，基本上不会存在于测试集中，即模型需要有较强的泛化能力；IDEA因此作者通过利用基于检索的span图来改进spa

pepsi_w·2023-12-22 15:07

Propose-and-Refine: A Two-Stage Set Prediction Network forNested Named Entity Recognition

原文链接：https://www.ijcai.org/proceedings/2022/0613.pdf\IJCAI2022介绍问题作者认为基于span的模型存在以下问题：1）忽略了span和其他实体短语之间的关系，span的表征往往只有内部的信息，看不见全局的信息，就会导致一些实体被分类错误。（不是很站得住脚哈因为一般基于span的方法都会加入一些其他信息比如句子的cls或者span前后的一些t

pepsi_w·2023-12-22 15:37

kNN-NER: Named Entity Recognition with Nearest Neighbor Search

原文链接：https://arxiv.org/pdf/2203.17103.pdf预发表论文介绍受到增强式检索方法的启发，作者提出了kNN-NER，通过检索训练集中k个邻居的标签分布来提高模型命名实体识别分类的准确性。该框架能够通过充分利用训练信息来解决样本类别不平衡问题。方法整个模型的框架如下图所示，作者提出的框架在训练阶段不需要进行额外的操作，可以适配于多样的序列标注模型：Background