recognition 第2页

手把手带你基于Python+Django+百度云实现车牌识别

车牌识别系统（VehicleLicensePlateRecognition）是计算机视频图像识别技术在车辆牌照识别中的一种应用，通常一个车牌识别系统主要包括以下这四个部分：车辆图像获取车牌定位车牌字符分割车牌字符识别看一下百科中对车牌识别技术的描述

李威威wiwi·2024-02-14 15:20

《No frame left behind: Full Video Action Recognition》

文章地址：《Noframeleftbehind:FullVideoActionRecognition》代码地址：暂无现有算法都是通过类似于uniformsample对一个视频采样出部分帧，进而使用这部分帧对视频进行分类

ce0b74704937·2024-02-14 11:52

【阅读笔记】Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs-2018

Abstract我们考虑零样本识别问题:仅利用类别的单词嵌入及其与其他类别的关系来学习具有零训练示例的类别的视觉分类器，并提供视觉数据。处理陌生或新类的关键是将从熟悉类中获得的知识转移到陌生类的描述中。在本文中，我们基于最近引入的图卷积网络(GCN)，提出了一种同时使用语义嵌入和类别关系来预测分类器的方法。对于一个已习得的知识图(KG)，我们的方法将每个节点(表示视觉类别)作为输入语义嵌入。经过一

一只瓜皮呀·2024-02-14 11:19

数字金融时代的革命：深入解析银行卡识别OCR API 技术

其中，银行卡识别OCR（OpticalCharacterRecognition，光学字符识别）API技术正是这一变革的重要驱动力之一。

API小百科_APISpace·2024-02-14 10:53

tensorflow利用CNN实现MNIST图片识别

FunctioninstructionsThedataData:Thisistheclassicmnisthandwritingrecognitionimagedata.Downloadlink:thisDirectorytree

Lornatang·2024-02-14 06:37

matlab基于SVM的手写字体识别,svm 基于LIBSVM的matlab手写字体识别 AI-NN-PR 人工智能/神经网络/深度学习 276万源代码下载- www.pudn.com...

svm下载收藏√[54321]开发工具:matlab文件大小:126KB上传时间:2017-05-15下载次数:0详细说明：基于LIBSVM的matlab手写字体识别-AhandwrittenfontrecognitionbasedonSVM

傅奇·2024-02-13 21:40

2022-03-19

自然语言处理实验演示-09.命名实体识别（NamedEntityRecognition(NER)）命名实体识别（NamedEntityRecognition，简称：NER），又称作专名识别，是指识别文本中具有特定意义的实体

跨象乘云·2024-02-13 15:46

怎么自己写一个OCR实现多张图片的识别并存入Excel

要自己实现OCR(OpticalCharacterRecognition，光学字符识别)多张图片的识别并存入Excel，可以按照以下步骤进行：安装OCR库：选择适合自己语言的OCR库，如Python中的

美丽回忆一瞬间·2024-02-12 20:47

使用 PHP 实现的音频转文字功能

/google-cloud.json',//GoogleCloud认证信息]);$config=newGoogle\Cloud\Speech\V1\RecognitionConfig();$config

·2024-02-11 17:15

免费软件推荐-开源免费批量离线图文识别（OCR）

光学字符识别（OpticalCharacterRecognition,OCR）是指对文本材料的图像文件进行分析识别处理，以获取文字和版本信息的过程。

代号灵昱·2024-02-09 18:05

Vision Transformer 简介

Paper:DosovitskiyA,BeyerL,KolesnikovA,etal.Animageisworth16x16words:Transformersforimagerecognitionatscale

ScienceLi1125·2024-02-08 09:08

基于OCR的健康随行小程序(程序+开题报告)(开题报告+源码）

OCR（OpticalCharacterRecognition）技术作为一种能够将图像中的文字转换为可编辑文本的技术，为健康管

迟限程序设计·2024-02-07 21:23

流利说懂你英语笔记要点句型·核心课·Level 8·Unit 3·Part 2·Video 2·Healing Architecture 2

HealingArchitecture2Sothefollowingyear,Idecidedtogotoarchitectureschool.Butthere,Ilearnedsomethingdifferentaboutbuildings.Recognitionseemedtocometothosewhoprioritizednovelandsculpturalforms

羲之大鹅video·2024-02-06 19:57

ANTLR4规则解析生成器(一)：入门

ANTLR42为什么需要ANTLR43环境搭建4官方示例4.1编写语法规则文件4.2生成语法解析器4.3基于SDK实现逻辑5总结1什么是ANTLR4ANTLR是ANotherToolforLanguageRecognition

luofengmacheng·2024-02-06 16:51

Feature refinement 的阅读笔记

PatternRecognition上一篇微表情识别的文章，记录一下其中的关键信息点。

pzb19841116·2024-02-06 09:13

iOS自带的Speech语音识别功能封装

1、在plist文件加入以下配置:SpeechRecognitionUsageDescription语音识别NSMicrophoneUsageDescription麦克风权限2、单例管理:////SpeechManager.swift

陈皮话梅糖@·2024-02-05 13:45

PaddleOCR封装，在线服务化部署实战（python部署，超新手教程）

OCR，即光学字符识别（OpticalCharacterRecognition），是一种将图像中的文字转换为机器编码文字的技术。

学术菜鸟小晨·2024-02-05 13:44

ddddocr验证码识别模块

ddddocr验证码识别模块简介ddddocr是一个基于深度学习的OCR（OpticalCharacterRecognition，光学字符识别）工具，主要用于中文场景文字识别。

林小果1·2024-02-05 08:10

2024.2.4周报

Introduction二、实验三、结论二、PINN一、PINN比传统数值方法有哪些优势二、PINN方法三、正问题与反问题总结摘要本周我阅读了一篇题目为DeepResidualLearningforImageRecognition

Nyctophiliaa·2024-02-04 22:22

记录在树莓派中部署PI-Assistant开源项目（GPT语音对话）的BUG

官网文档中提供的安装命令如下：pipinstallrequestsarcadeRPi.GPIOpydubnumpywavesounddevicepymysqlcn2anduckduckgo_searchflaskSpeechRecognitionope

杨景文Blog·2024-02-04 13:04

lucky记录196天

2021年08月20日扇贝每日一句2022年倒计时133天Kindnessismoreimportantthanwisdom,andtherecognitionofthisisthebeginningofwisdom

杉杉妈Alice·2024-02-04 12:55

每日阅读——《微服务设计》

一、原文：Somepeopletrytogainrecognitioninsocietybyborrowingwidelyacceptedindustryterms,butthiscanleadtotwoproblems.First

飞影铠甲·2024-02-04 11:14

【大厂AI课学习笔记】1.4 算法的进步（4）关于李飞飞团队的ImageNet

基于ImageNet数据库，每年都会举办一场大规模的视觉识别挑战赛（ImageNetLargeScaleVisualRecognitionChallenge，简称ILSVRC）。这场比赛

giszz·2024-02-04 06:56

逝者之证第1季第6集中英台词整理和单词统计

IthoughtyouhatedyourlifeinChestnutHill.我以为你恨在切斯努特山度过的时光呢"Hated"isalittlestrong.Iloathedit.谈不上恨厌倦了而已Fancycars,nicehouses,开好车住大房citywiderecognitionasatopneurosur

kuailexuewaiyu·2024-02-04 02:11

AI数字人训练数据集汇总

唇读（LipReading），也称视觉语音识别（VisualSpeechRecognition），通过说话者口型变化信息推断其所说的内容，旨在利用视觉信道信息补充听觉信道信息，在现实生活中有重要应用。

智慧医疗探索者·2024-02-03 13:48

模式识别 | PRML概览

PRML全书概览PRML全称PatternRecognitionandMachineLearning，个人认为这是机器学习领域中最好的书籍之一，全书的风格非常Bayesian，作者试图在贝叶斯框架下解释每一种机器学习模型

ZIYUE WU·2024-02-03 07:48

基于GAN-CNN-CNN的鲁棒笔迹识别方法(一)

笔迹识别（writerrecognition）是生物特征识别的一个重要分支.对于每个书写者而言，其笔迹总体上具有相对稳定性，而笔迹的局部变化则是每个书写者笔迹的固有特性；而对于不同的书写者而言，其笔迹的差别则比较大

kadog·2024-02-02 21:41

2019 年总结 - 12个达成

帮旧公司统筹staffrecognitionprogram初步掌握了个人工作系统初步掌握了20小时突击战的套路。

oscarlia·2024-02-02 20:41

Adversarial Examples Improve Image Recognition

XieC,TanM,GongB,etal.AdversarialExamplesImproveImageRecognition.

馒头and花卷·2024-02-02 19:00

PaddleOCR模型训练及使用详细教程

Part3.PaddleOCR模型训练环境搭建Part4.制作数据集Part5.训练模型Part6.转换成推理模型并应用Part1.OCR原理及开源项目对比 OCR英文全称是OpticalCharacterRecognition

Elaine猿·2024-02-02 18:24

OCR-paddleocr

PaddleOCR分为Detection（文本检测）、Directionclassifier（方向分类器）和Recognition（文本识别）三部分，因此需要三个模型。

青霄·2024-02-02 18:52

C#图片识别-TesseractOCR

OCR简介：光学字符识别(OCR,OpticalCharacterRecognition)是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

一刃之锋·2024-02-02 12:58

Flink SQL Query 语法（四）- Rattern Recognition

ci.apache.org/projects/flink/flink-docs-release-1.13/docs/dev/table/sql/queries/match_recognize/操作符PatternRecognition

Alex90·2024-02-02 11:07

ASRT——部署SpeechRecognition

安装tensorflow：pipinstalltensorflow==2.12.0-ihttps://pypi.tuna.tsinghua.edu.cn/simple/报错解决：tensorflow出现报错：Couldnotlocatezlibwapi.dll

Irving.Gao·2024-02-02 06:45

中科院一区顶刊 | DilateFormer: 即插即用的多尺度全局注意力机制(附源码实现)

导读论文：《DilateFormer:Multi-ScaleDilatedTransformerforVisualRecognition》本文提出了一种新颖的多尺度空洞Transformer，简称DilateFormer

CVHub·2024-02-02 06:23

Motion generation/synthesis evaluation metrics

synthesiseval_metricsMDMR-precisionandMultimodal-DistFIDDiversityMultiModalityReferenceT2MFIDR-PrecisionDiversityMulti-modalityMulti-modalDistanceA2MFIDRecognitionAccuracyDiversityMul

Cmy_CTO·2024-02-01 22:10

NLP任务之Named Entity Recognition

深度学习的实现方法：双向长短期记忆网络（BiLSTM）:BiLSTM是一种循环神经网络（RNN）的变体，能够捕捉序列数据中的长期依赖关系。在NER任务中，BiLSTM能有效地处理文本序列，捕捉前后文本的依赖关系。条件随机场（CRF）:CRF经常与BiLSTM结合使用，形成BiLSTM-CRF模型。CRF层能够在序列标注任务中提供额外的约束，帮助模型更准确地预测实体标签。变压器（Transforme

sunshine2853·2024-02-01 21:27

【AI视野·今日Sound 声学论文速览第四十八期】Mon, 15 Jan 2024

15Jan2024Totally5papers上期速览✈更多精彩请移步主页DailySoundPapersLCB-net:Long-ContextBiasingforAudio-VisualSpeechRecognitionAuthorsFanYu

hitrjj·2024-02-01 12:05

CRF条件随机场学习记录

V丶Chao·2024-01-31 19:42

【读点论文】Benchmarking chinese text recognition Datasets, baselines, and an empirical study，中文专题的字符识别

BenchmarkingChineseTextRecognition:Datasets,Baselines,andanEmpiricalStudyAbstract近年来，深度学习的蓬勃发展见证了文本识别的快速发展

羞儿·2024-01-31 18:49

【读点论文】CMTCo Contrastive Learning with Character Movement Task对比学习中的代理任务和数据增强用在手写字符体识别方向

CMT-Co:ContrastiveLearningwithCharacterMovementTaskforHandwrittenTextRecognitionAbstract主流的手写文本识别(HTR

羞儿·2024-01-31 18:49

LMC：通过大模型合作与互相评估来进行无需训练的开放集识别

论文名称：LMC:LargeModelCollaborationwithCross-assessmentforTraining-FreeOpen-SetObjectRecognition论文链接：https

AI知识图谱大本营·2024-01-31 02:50

Python实现OCR大批量识别图片文字，并将文字保存到txt文档中，文末源码直接拿！

项目背景在当今数字化时代，图像文字识别（OpticalCharacterRecognition,OCR）技术的应用越来越广泛。

认真写程序的强哥·2024-01-31 01:27

【论文阅读】Long-Tailed Recognition via Weight Balancing（CVPR2022）附MaxNorm的代码

目录论文使用方法weightdecayMaxNorm如果使用原来的代码报错的可以看下面这个论文问题：真实世界中普遍存在长尾识别问题，朴素训练产生的模型在更高准确率方面偏向于普通类，导致稀有的类别准确率偏低。key:解决LTR的关键是平衡各方面，包括数据分布、训练损失和学习中的梯度。文章主要讨论了三种方法：L2normalization,weightdecay,andMaxNorm本文提出了一个两阶

鱼小丸·2024-01-30 20:38

基于对比学习的信息抽取

LabelRefinementviaContrastiveLearningforDistantly-SupervisedNamedEntityRecognitionNAACL2022；做的远程监督NER

wang2008start·2024-01-30 09:36

一文读懂：图卷积在基于骨架的动作识别中的应用

19021210845转载自：https://new.qq.com/omn/20191208/20191208A09M4G00.html【嵌牛导读】基于骨架的动作识别（skeleton-basedactionrecognition

陌然_5236·2024-01-30 00:59

VLM 系列——Object Recognition as Next Token Prediction——论文解读

一、概述1、是什么结合了CLIP的视觉编码器+语言模型Llama的部分参数，将常见的图片描述任务转变为只输出属性，换言之将图片分类转变为预测下一个文本输出token。这样就能够生成图片的topK属性（英文），用于开放域的图片Tag场景。2、亮点*对图像-标题（从原始标题中提取名词作为参考标签）对进行训练，比图像-问题-答案三元组更容易收集和注释。对于推理，生成文本片段作为标签而不是句子。*解码器具

TigerZ*·2024-01-29 21:29

Masked Face Recognition Using Deep Learning: A Review

摘要：本次调查整理并回顾了最近基于深度学习技术为蒙面人脸识别（MFR）开发的工作，提供了对MFR系统开发流程的见解和深入讨论。根据深层网络架构的特点和深层特征提取策略，引入了最先进的技术，还讨论了MFR领域使用的常见基准测试数据集，强调了许多挑战和有前途的研究方向。一、引言遮挡人脸识别（OFR）任务引起了广泛的关注，并且已经提出了许多深度学习方法，包括稀疏表示、自动编码器、基于视频的对象跟踪、双向

禄亿萋·2024-01-29 16:25

Antlr4介绍和Helloworld

摘要：本文将首先介绍Antlr4，以及如何通过Antlr4grammer生成对应的hello的AST1.Antlr4简单介绍Antlr4（AnotherToolforLanguageRecognition

离离原上草77·2024-01-28 16:40

《Two-Stream Convolutional Networks for Action Recognition in Videos》算法详解

论文链接：Two-StreamConvolutionalNetworksforActionRecognitioninVideos文章由牛津大学VGG实验室提出，收录于NIPS2014。

ce0b74704937·2024-01-28 14:57

推荐频道

recognition