recognition 第37页

目标检测(二)——SPPNet

简介SPPNet是出自2015发表在IEEE上的论文-《SpatialPyramidPoolinginDeepConvolutionalNetworksforVisualRecognition》，这篇论文解决之前深度神经网络的一个大难题

hhhcbw·2023-01-01 12:54

2022-12-31

//www.coursera.org/learn/machine-learning#syllabus2.图像识别：CS231n:ConvolutionalNeuralNetworksforVisualRecognition

我好菜啊救命·2023-01-01 09:22

基于dlib重新训练dlib_face_recognition_resnet_model_v1.dat

dlib重新训练dlib_face_recognition_resnet_model_v1.dat一、训练方法说明官方文档说明翻译成中文为：//下一段代码定义了一个ResNet网络。

武魂殿001·2022-12-31 18:47

Pytorch：线性自编码网络降维(对比PCA)

Pytorch:图像自编码器-线性自编码网络降维与SVM,PCA降维与SVMCopyright:JingminWei,PatternRecognitionandIntelligentSystem,SchoolofArtificialandIntelligence

宅家的小魏·2022-12-31 17:48

Windows环境安装Tesseract-OCR 4.0

Tesseract最开始是由惠普实验室在1985年-1994年之间开发的一个OCR（OpticalCharacterRecognition,光学字符识别）引擎，自2006年之后由Google开发维护。

忆往昔成风·2022-12-31 15:09

字符识别软件tesseract-ocr v5.1.0下载安装及简单使用（Win10）

Tesseract是github上的OCR（opticalcharacterrecognition，光学字符识别）开源库，可将包含文本的图像识别为计算机文字（计算机黑白点阵）。

Alexabc3000·2022-12-31 15:35

win10 Tesseract-ORC安装教程以及使用案例（pdf拆分）

简介OCR(OpticalCharacterRecognition)：光学字符识别，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

xiaoyurainzi·2022-12-31 15:35

【AI实战】最全 TensorFlow 官方模型：计算机视觉、自然语言处理

【AI实战】最全TensorFlow官方模型1.模型和实现1.1计算机视觉图像分类ModelReference(Paper)ResNetDeepResidualLearningforImageRecognitionResNet-RSRevisitingResNets

szZack·2022-12-31 10:15

CookGAN Causality based Text-to-Image Synthesis

CausalitybasedText-to-ImageSynthesis作者：BinZhu、Chong-WahNgo会议：2020IEEE/CVFConferenceonComputerVisionandPatternRecognition

该学还得学·2022-12-31 10:29

CVPR 2020 | 几篇 image-to-image 论文速递

1Fine-grainedImage-to-ImageTransformationtowardsVisualRecognition现有的图像转换方法主要集中在:如何在合成视觉上有让人感到自然的效果。

机器学习与AI生成创作·2022-12-31 10:29

智能语音平台：技能搭建与多轮交互

接下来我将从这几方面进行展开：了解语音全流程框架意图的组成部分多轮交互一、语音全流程框架图首先，简单说一下语音交互的全流程的概念：ASR（AutomaticSpeechRecognition）：接收音频返回字符串

YHFHing·2022-12-31 08:17

Computer Vision Software

TheSoftwareisgroupedintothefollowingcategories3D,contours,displaytools,features,ocr,mathematicaltoolkits,patternrecognition

坚定而果敢的五岳散人·2022-12-31 08:23

matlab基于SVM的手写字体识别,基于SVM的手写字体识别

【实例简介】基于SVM的手写字体识别【实例截图】【核心代码】chapter19└──chapter19├──Chapter_CharacterRecognitionUsingLibsvm.m├──html

weixin_39611174·2022-12-30 22:58

读《FVGNN: A Novel GNN to Finger Vein Recognition from Limited Training Data》

tmd，当初随便看看竟然没有当回事，现在才意识到这篇文章多重要(╥﹏╥)###############1.引言指静脉识别过程：图像采集（红外）图像预处理（ROI，滤波增强）特征抽取（LBP，GOM，LGS，OED等方法）特征匹配（度量）静脉图片尤其需要一些预处理，静脉血压、体温等都会有影响小样本多分类限制了深度学习，虽然可以匹配但是分类就很麻（但是CNN通过数据增强会很强）2.相关工作传统方法提取

Mighty_Crane·2022-12-30 20:35

T-C3D 实时行为识别时序卷积网络

论文名称：T-C3D:TemporalConvolutional3DNetworkforReal-TimeActionRecognition论文地址：https://aaai.org/ocs/index.php

&永恒的星河&·2022-12-30 18:29

基于C3D网络的视频分析与动作识别

3D卷积最早应该是在《3Dconvolutionalneuralnetworksforhumanactionrecognition》这片论文中被

@BangBang·2022-12-30 18:28

行为识别（三）：创建C3D网络模型用于行为识别

行为识别（三）：创建C3D网络模型用于行为识别文章目录行为识别（三）：创建C3D网络模型用于行为识别1参考资源1.1Pytorch-video-recognition1.2Tensorflow小练习（三

too.ink·2022-12-30 18:54

指纹识别综述(2): 指纹传感器

本文主要基于《HandbookofFingerprintRecognition》第三版第二章“FingerprintSensing”的内容。本文会不定期更新，以反映一些新的进展和思考。

minutiae·2022-12-30 18:18

设备控制接口之百度 OCR在Total Control的应用

OCR（OpticalCharacterRecognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程

lemon5814·2022-12-30 17:09

OCR在转转游戏的应用

OCR（opticalcharacterrecognition）是将图片进行扫描，提取其中的文字的技术。如今，不少业务领域都用到了OCR技术。

转转技术团队·2022-12-30 17:35

Windows安装face_recognition出现ModuleNotFoundError: No module named ‘face_recognition‘

Windows安装了dlib19.6.1版本再安装face_recognition出现ModuleNotFoundError:Nomodulenamed‘face_recognition’百度之后发现安装

leigm123·2022-12-30 15:45

Image captioning with transformer and knowledge graph

Imagecaptioningwithtransformerandknowledgegraph创新点一、创新点1二、创新点2实验2021PatternRecognitionLetters东南大学创新点本文使用相对熵

小个葡萄·2022-12-30 14:07

Pytorch：目标检测网络-FPN

Pytorch:目标检测-特征金字塔-FPNCopyright:JingminWei,PatternRecognitionandIntelligentSystem,SchoolofArtificialandIntelligence

宅家的小魏·2022-12-30 11:31

TSception: Capturing Temporal Dynamics and Spatial Asymmetry from EEG for EmotionRecognition 学习笔记+源码

1.摘要高时间分辨率和不对称的脑空间活跃性是脑电图(EEG)的基本属性，它是大脑中情感过程的基础。为了学习脑电信号的动态时间和空间不对称性，从而实现准确和广义的情感识别，我们提出了一种多尺度卷积神经网络TSception。TSception由动态的时间层、非对称的空间层和高级融合层组成，它们同时学习时间和通道维度上的特征表示。动态时间层由多尺度一维卷积核组成，卷积核的长度与EEG的采样率有关，它学

TangP_P·2022-12-30 11:58

【读点论文】PP-ShiTu: A Practical Lightweight Image Recognition System，百度推出的强大人工智能产品

PP-ShiTu:APracticalLightweightImageRecognitionSystem图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用

羞儿·2022-12-30 07:14

ResNet网络

的提出残差网络(ResNet)是由来自MicrosoftResearch的4位学者提出的卷积神经网络，在2015年的ImageNet大规模视觉识别竞赛（ImageNetLargeScaleVisualRecognitionChallenge

落花逐流水·2022-12-30 07:41

【看看这长尾学习】Re-Weight方法 EQLloss

阅读论文：Equalizationlossforlong-tailedobjectrecognition论文观点与表现：每一个类的正样本能够被视为其他类别的负样本，这样会导致尾部数据类别非常不佳的梯度。

你好啊：）·2022-12-30 00:28

长尾分布是如何影响目标检测最终分类的--读EQL Loss有感

EQLLoss最近才刚开始认真阅读《EqualizationLossforLong-TailedObjectRecognition》这篇文献，但是发现自己基础知识太薄弱，所以尽力去弥补，也算是亡羊补牢吧

为你_而来·2022-12-30 00:58

在短短6个月内发烧相机已成为成熟的行业

aShenzen-basedvideosurveillancecompanycalledSunellsetupanexperiment:ItinstalledthermalcamerasandfacialrecognitionintheentrancesofsixschoolsinnorthernBeijing

weixin_26717401·2022-12-29 23:14

ICLR 2021 | An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale| ViT 阅读笔记（翻译）

AnImageisWorth16x16Words:TransformersforImageRecognitionatScaleAuthorUnit:GoogleBrain,GoogleResearchAuthors

ybacm·2022-12-29 22:04

论文笔记 An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale - ICLR 2021

AnImageIsWorth16x16Words:TransformersForImageRecognitionAtScaleICLR,2021PDF|OriginalCode|RossWightman

CiLin-Yan·2022-12-29 22:33

AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE-李沐老师-摘要引言相关工作

Abstract：WhiletheTransformerarchitecturehasbecomethede-factostandardfornaturallanguageprocessingtasks,itsapplicationstocomputervisionremainlimited.Invision,attentioniseitherappliedinconjunctionwithcon

Annnn~·2022-12-29 22:31

ICLR-2021-ViT: AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 阅读笔记

论文地址：https://arxiv.org/pdf/2010.11929.pdf代码地址：https://github.com/google-research/vision_transformerVisionTransformer(ViT)框架：模型概述：将输入图像分割成固定大小的小块（patch）,并为他们嵌入位置编码后线性的馈送到标准的变换器编码器（Transformerencoder）中。

菜菜子hoho·2022-12-29 22:01

机器学习笔记：ViT （论文 An Image Is Worth 16X16 Words: Transformers for Image Recognition at Scale）

ICLR20210前言说到图像处理，一般想到的就是CNN/CNN的变体机器学习笔记：CNN卷积神经网络_UQI-LIUWJ的博客-CSDN博客。ViT的想法是利用Transformer机制来替换CNN机制，将Transformer运用到图像分类中。机器学习笔记：Transformer_UQI-LIUWJ的博客-CSDN博客1图像转成句子（图片token化）将图像分割成小块（imagepatch），

UQI-LIUWJ·2022-12-29 22:00

【论文笔记】An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale(VIT)

文章目录AnImageisWorth16x16Words:TransformersforImageRecognitionatScale基本信息摘要模型结构图像变序列可学习token[CLS]位置编码标准

每天想peach·2022-12-29 22:28

【ViT 论文笔记】AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

“WeshowthatthisrelianceonCNNsisnotnecessaryandapuretransformerapplieddirectlytosequencesofimagepatchescanperformverywellonimageclassificationtasks.”——完全不依赖CNN参考：VisionTransformer详解_太阳花的小绿豆的博客-CSDN博客_v

bulibuli蛋·2022-12-29 22:57

极简笔记 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

极简笔记AnImageisWorth16x16Words:TransformersforImageRecognitionatScale原文地址https://arxiv.org/abs/2010.11929

Hibercraft·2022-12-29 22:57

An Image is worth 16x16 Words: Transformer for image recognition at scale(论文阅读笔记)

AnImageisworth16x16Words:TransformerforimagerecognitionatscaleAnImageisworth16x16words：1、AbstractTransformer

Mrwei_418·2022-12-29 22:55

语音识别学习记录 [TDNN时延神经网络]

本篇的大部分内容都来自关于TDNN原始文献WaibelA,HanazawaT,HintonG,etal.Phonemerecognitionusingtime-delayneuralnetworks[J

WePlayDirty·2022-12-29 20:23

【机器学习】交叉验证防止过拟合（含义+代码+演示）

一训练集vs测试集在模式识别（patternrecognition）与机器学习（machinelearning）的相关研究中，经常会将数据集分为训练集（trainingset）跟测试集（testingset

和你在一起^_^·2022-12-29 20:33

CVPR2020超分辨率方向论文整理笔记

CVPR2020超分辨率篇CVPR(IEEEConferenceonComputerVisionandPatternRecognition)是世界顶级的计算机视觉会议（三大顶会之一，即IEEE国际计算机视觉与模式识别会议

ytao_wang·2022-12-29 17:37

机器学习基础（2）——基于pytorch的LeNet模型

前言根据上一篇文章中所配置的数据集开始一些简单基础的神经网络模型搭建，首先是LeNet模型，LeNet-5出自1998年YLecun的论文《Gradient-BasedLearningAppliedtoDocumentRecognition

M朗拿度·2022-12-29 16:07

NCL论文简单解读

NCLNestedCollaborativeLearningforLong-TailedVisualRecognition引言论文链接官方代码先看一波实验结果（数据来自paperswithcode，截图时间

tcmyxc·2022-12-29 13:03

PaddleOCRv3之三：rec识别部分训练

TextRecognitionDataGenerator构造的数据集，图片名称的格式：[label]_[index].png,前缀就是label，例如：72K_123.pnglabel就是72K用下面的方法提取

1037号森林里一段干木头·2022-12-29 13:21

【卷积神经网络】ResNet翻译详解

论文题目：DeepResidualLearningforImageRecognition论文地址：https://arxiv.org/pdf/1512.03385.pdfPytorch官方代码：https

姚路遥遥·2022-12-29 12:00

Pytorch可视化特征图（代码亲测可用）

VisualizingandUnderstandingConvolutionalNetworks》早期LeCun1998年的文章《Gradient-BasedLearningAppliedtoDocumentRecognition

Vertira·2022-12-29 11:49

cs231n 算svm 的loss 和dw

CS231nConvolutionalNeuralNetworksforVisualRecognition——optimization1.多类SVM的损失函数（MulticlassSVMloss）在给出类别预测前的输出结果是实数值

我已脱掉我的发脱掉了牵挂·2022-12-29 11:35

python 手势检测和追踪_python手势视频识别标记

Audio-and-video-demobgm(背景语音播报文件)imagesffempeg-imgrec-imgmodel(自训练模型保存)video(输入输出视频文件)bgm.pycombination.pyffempeg-img-recognition.pygesture-recogn

萦小主·2022-12-29 07:20

anaconda 安装dlib库几种方法及问题

上次老师讲了基于face_recognition的人脸识别，用到了dlib库,然后，就开始痛苦的安装之路。安装dlib库之前需要先安装cmake,这个很简单，只有dlib不简单。。。

Vesperus·2022-12-28 20:42

（转）TensorFlow--实现人脸识别实验精讲（Face Recognition using Tensorflow）

https://blog.csdn.net/niutianzhuang/article/details/79191167做一个人脸检测实验。1.获取数据集（LFW）LabeledFacesintheWildHomeMenu->Download->Allimagesasgzippedtarfile或者直接点击我是LFW解压放到datasets2.下载facenet并配置（facenet是一个使用te

zyb418·2022-12-28 20:33

推荐频道

recognition