E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
recognition
使用 PHP 实现的音频转文字功能
/google-cloud.json',//GoogleCloud认证信息]);$config=newGoogle\Cloud\Speech\V1\
Recognition
Config();$config
·
2024-02-11 17:15
php
免费软件推荐-开源免费批量离线图文识别(OCR)
光学字符识别(OpticalCharacter
Recognition
,OCR)是指对文本材料的图像文件进行分析识别处理,以获取文字和版本信息的过程。
代号灵昱
·
2024-02-09 18:05
智能手机
ocr
Vision Transformer 简介
Paper:DosovitskiyA,BeyerL,KolesnikovA,etal.Animageisworth16x16words:Transformersforimage
recognition
atscale
ScienceLi1125
·
2024-02-08 09:08
transformer
ViT
深度学习
基于OCR的健康随行小程序(程序+开题报告)(开题报告+源码)
OCR(OpticalCharacter
Recognition
)技术作为一种能够将图像中的文字转换为可编辑文本的技术,为健康管
迟限程序设计
·
2024-02-07 21:23
ocr
小程序
流利说懂你英语笔记要点句型·核心课·Level 8·Unit 3·Part 2·Video 2·Healing Architecture 2
HealingArchitecture2Sothefollowingyear,Idecidedtogotoarchitectureschool.Butthere,Ilearnedsomethingdifferentaboutbuildings.
Recognition
seemedtocometothosewhoprioritizednovelandsculpturalforms
羲之大鹅video
·
2024-02-06 19:57
ANTLR4规则解析生成器(一):入门
ANTLR42为什么需要ANTLR43环境搭建4官方示例4.1编写语法规则文件4.2生成语法解析器4.3基于SDK实现逻辑5总结1什么是ANTLR4ANTLR是ANotherToolforLanguage
Recognition
luofengmacheng
·
2024-02-06 16:51
安全
antlr4
rule
Feature refinement 的阅读笔记
Pattern
Recognition
上一篇微表情识别的文章,记录一下其中的关键信息点。
pzb19841116
·
2024-02-06 09:13
论文解读
人工智能
计算机视觉
iOS自带的Speech语音识别功能封装
1、在plist文件加入以下配置:Speech
Recognition
UsageDescription语音识别NSMicrophoneUsageDescription麦克风权限2、单例管理:////SpeechManager.swift
陈皮话梅糖@
·
2024-02-05 13:45
iOS
ios
语音识别
人工智能
PaddleOCR封装,在线服务化部署实战(python部署,超新手教程)
OCR,即光学字符识别(OpticalCharacter
Recognition
),是一种将图像中的文字转换为机器编码文字的技术。
学术菜鸟小晨
·
2024-02-05 13:44
ocr
部署
python
ddddocr验证码识别模块
ddddocr验证码识别模块简介ddddocr是一个基于深度学习的OCR(OpticalCharacter
Recognition
,光学字符识别)工具,主要用于中文场景文字识别。
林小果1
·
2024-02-05 08:10
python爬虫
爬虫
python
2024.2.4周报
Introduction二、实验三、结论二、PINN一、PINN比传统数值方法有哪些优势二、PINN方法三、正问题与反问题总结摘要本周我阅读了一篇题目为DeepResidualLearningforImage
Recognition
Nyctophiliaa
·
2024-02-04 22:22
人工智能
深度学习
记录在树莓派中部署PI-Assistant开源项目(GPT语音对话)的BUG
官网文档中提供的安装命令如下:pipinstallrequestsarcadeRPi.GPIOpydubnumpywavesounddevicepymysqlcn2anduckduckgo_searchflaskSpeech
Recognition
ope
杨景文Blog
·
2024-02-04 13:04
开源
gpt
树莓派
PI-Assistant
lucky记录196天
2021年08月20日扇贝每日一句2022年倒计时133天Kindnessismoreimportantthanwisdom,andthe
recognition
ofthisisthebeginningofwisdom
杉杉妈Alice
·
2024-02-04 12:55
每日阅读——《微服务设计》
一、原文:Somepeopletrytogain
recognition
insocietybyborrowingwidelyacceptedindustryterms,butthiscanleadtotwoproblems.First
飞影铠甲
·
2024-02-04 11:14
微服务
微服务
【大厂AI课学习笔记】1.4 算法的进步(4)关于李飞飞团队的ImageNet
基于ImageNet数据库,每年都会举办一场大规模的视觉识别挑战赛(ImageNetLargeScaleVisual
Recognition
Challenge,简称ILSVRC)。这场比赛
giszz
·
2024-02-04 06:56
人工智能
学习笔记
人工智能
学习
笔记
逝者之证第1季第6集中英台词整理和单词统计
IthoughtyouhatedyourlifeinChestnutHill.我以为你恨在切斯努特山度过的时光呢"Hated"isalittlestrong.Iloathedit.谈不上恨厌倦了而已Fancycars,nicehouses,开好车住大房citywide
recognition
asatopneurosur
kuailexuewaiyu
·
2024-02-04 02:11
AI数字人训练数据集汇总
唇读(LipReading),也称视觉语音识别(VisualSpeech
Recognition
),通过说话者口型变化信息推断其所说的内容,旨在利用视觉信道信息补充听觉信道信息,在现实生活中有重要应用。
智慧医疗探索者
·
2024-02-03 13:48
AI数字人技术
人工智能
唇读数据集
模式识别 | PRML概览
PRML全书概览PRML全称Pattern
Recognition
andMachineLearning,个人认为这是机器学习领域中最好的书籍之一,全书的风格非常Bayesian,作者试图在贝叶斯框架下解释每一种机器学习模型
ZIYUE WU
·
2024-02-03 07:48
Machine
Learning
基于GAN-CNN-CNN的鲁棒笔迹识别方法(一)
笔迹识别(writer
recognition
)是生物特征识别的一个重要分支.对于每个书写者而言,其笔迹总体上具有相对稳定性,而笔迹的局部变化则是每个书写者笔迹的固有特性;而对于不同的书写者而言,其笔迹的差别则比较大
kadog
·
2024-02-02 21:41
笔迹识别
生成对抗网络
cnn
人工智能
2019 年总结 - 12个达成
帮旧公司统筹staff
recognition
program初步掌握了个人工作系统初步掌握了20小时突击战的套路。
oscarlia
·
2024-02-02 20:41
Adversarial Examples Improve Image
Recognition
XieC,TanM,GongB,etal.AdversarialExamplesImproveImage
Recognition
.
馒头and花卷
·
2024-02-02 19:00
PaddleOCR模型训练及使用详细教程
Part3.PaddleOCR模型训练环境搭建Part4.制作数据集Part5.训练模型Part6.转换成推理模型并应用Part1.OCR原理及开源项目对比 OCR英文全称是OpticalCharacter
Recognition
Elaine猿
·
2024-02-02 18:24
python
paddleocr
ocr
paddlepaddle
光学字符识别
模型训练
文字识别
OCR-paddleocr
PaddleOCR分为Detection(文本检测)、Directionclassifier(方向分类器)和
Recognition
(文本识别)三部分,因此需要三个模型。
青霄
·
2024-02-02 18:52
检测识别
paddleocr
检测识别
C#图片识别-TesseractOCR
OCR简介: 光学字符识别(OCR,OpticalCharacter
Recognition
)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
一刃之锋
·
2024-02-02 12:58
Flink SQL Query 语法(四)- Rattern
Recognition
ci.apache.org/projects/flink/flink-docs-release-1.13/docs/dev/table/sql/queries/match_recognize/操作符Pattern
Recognition
Alex90
·
2024-02-02 11:07
ASRT——部署Speech
Recognition
安装tensorflow:pipinstalltensorflow==2.12.0-ihttps://pypi.tuna.tsinghua.edu.cn/simple/报错解决:tensorflow出现报错:Couldnotlocatezlibwapi.dll
Irving.Gao
·
2024-02-02 06:45
python
python
中科院一区顶刊 | DilateFormer: 即插即用的多尺度全局注意力机制(附源码实现)
导读论文:《DilateFormer:Multi-ScaleDilatedTransformerforVisual
Recognition
》本文提出了一种新颖的多尺度空洞Transformer,简称DilateFormer
CVHub
·
2024-02-02 06:23
网络架构
人工智能
计算机视觉
深度学习
Motion generation/synthesis evaluation metrics
synthesiseval_metricsMDMR-precisionandMultimodal-DistFIDDiversityMultiModalityReferenceT2MFIDR-PrecisionDiversityMulti-modalityMulti-modalDistanceA2MFID
Recognition
AccuracyDiversityMul
Cmy_CTO
·
2024-02-01 22:10
CV
#
Motion
Generation
AI
(Artificial
Intelligence)
算法
人工智能
计算机视觉
NLP任务之Named Entity
Recognition
深度学习的实现方法:双向长短期记忆网络(BiLSTM):BiLSTM是一种循环神经网络(RNN)的变体,能够捕捉序列数据中的长期依赖关系。在NER任务中,BiLSTM能有效地处理文本序列,捕捉前后文本的依赖关系。条件随机场(CRF):CRF经常与BiLSTM结合使用,形成BiLSTM-CRF模型。CRF层能够在序列标注任务中提供额外的约束,帮助模型更准确地预测实体标签。变压器(Transforme
sunshine2853
·
2024-02-01 21:27
自然语言处理
人工智能
深度学习
【AI视野·今日Sound 声学论文速览 第四十八期】Mon, 15 Jan 2024
15Jan2024Totally5papers上期速览✈更多精彩请移步主页DailySoundPapersLCB-net:Long-ContextBiasingforAudio-VisualSpeech
Recognition
AuthorsFanYu
hitrjj
·
2024-02-01 12:05
audio
Sound
Papers
语言识别
音视频识别
音源分离
音视频情绪识别
CRF条件随机场学习记录
引言威胁情报挖掘的相关论文中,均涉及到两部分任务:命名实体识别(NamedEntity
Recognition
,NER)和关系抽取,大多数网安实现NER的方法,采用比较多的方法包含:BiLstm+CRF或者
V丶Chao
·
2024-01-31 19:42
深度学习
安全研究
-
威胁情报
学习
【读点论文】Benchmarking chinese text
recognition
Datasets, baselines, and an empirical study,中文专题的字符识别
BenchmarkingChineseText
Recognition
:Datasets,Baselines,andanEmpiricalStudyAbstract近年来,深度学习的蓬勃发展见证了文本识别的快速发展
羞儿
·
2024-01-31 18:49
论文笔记
OCR
中文场景CTR
benchmark
CTR调研
【读点论文】CMTCo Contrastive Learning with Character Movement Task对比学习中的代理任务和数据增强用在手写字符体识别方向
CMT-Co:ContrastiveLearningwithCharacterMovementTaskforHandwrittenText
Recognition
Abstract主流的手写文本识别(HTR
羞儿
·
2024-01-31 18:49
论文笔记
对比学习
手写字体识别
代理任务
数据增强
LMC:通过大模型合作与互相评估来进行无需训练的开放集识别
论文名称:LMC:LargeModelCollaborationwithCross-assessmentforTraining-FreeOpen-SetObject
Recognition
论文链接:https
AI知识图谱大本营
·
2024-01-31 02:50
大模型
人工智能
Python实现OCR大批量识别图片文字,并将文字保存到txt文档中,文末源码直接拿!
项目背景在当今数字化时代,图像文字识别(OpticalCharacter
Recognition
,OCR)技术的应用越来越广泛。
认真写程序的强哥
·
2024-01-31 01:27
python
ocr
深度学习
Python爬虫
Python学习
人工智能
开发语言
【论文阅读】Long-Tailed
Recognition
via Weight Balancing(CVPR2022)附MaxNorm的代码
目录论文使用方法weightdecayMaxNorm如果使用原来的代码报错的可以看下面这个论文问题:真实世界中普遍存在长尾识别问题,朴素训练产生的模型在更高准确率方面偏向于普通类,导致稀有的类别准确率偏低。key:解决LTR的关键是平衡各方面,包括数据分布、训练损失和学习中的梯度。文章主要讨论了三种方法:L2normalization,weightdecay,andMaxNorm本文提出了一个两阶
鱼小丸
·
2024-01-30 20:38
论文阅读
基于对比学习的信息抽取
LabelRefinementviaContrastiveLearningforDistantly-SupervisedNamedEntity
Recognition
NAACL2022;做的远程监督NER
wang2008start
·
2024-01-30 09:36
对比学习
信息抽取
自然语言处理
一文读懂:图卷积在基于骨架的动作识别中的应用
19021210845转载自:https://new.qq.com/omn/20191208/20191208A09M4G00.html【嵌牛导读】基于骨架的动作识别(skeleton-basedaction
recognition
陌然_5236
·
2024-01-30 00:59
VLM 系列——Object
Recognition
as Next Token Prediction——论文解读
一、概述1、是什么结合了CLIP的视觉编码器+语言模型Llama的部分参数,将常见的图片描述任务转变为只输出属性,换言之将图片分类转变为预测下一个文本输出token。这样就能够生成图片的topK属性(英文),用于开放域的图片Tag场景。2、亮点*对图像-标题(从原始标题中提取名词作为参考标签)对进行训练,比图像-问题-答案三元组更容易收集和注释。对于推理,生成文本片段作为标签而不是句子。*解码器具
TigerZ*
·
2024-01-29 21:29
AIGC算法
AIGC
计算机视觉
深度学习
人工智能
transformer
Masked Face
Recognition
Using Deep Learning: A Review
摘要:本次调查整理并回顾了最近基于深度学习技术为蒙面人脸识别(MFR)开发的工作,提供了对MFR系统开发流程的见解和深入讨论。根据深层网络架构的特点和深层特征提取策略,引入了最先进的技术,还讨论了MFR领域使用的常见基准测试数据集,强调了许多挑战和有前途的研究方向。一、引言遮挡人脸识别(OFR)任务引起了广泛的关注,并且已经提出了许多深度学习方法,包括稀疏表示、自动编码器、基于视频的对象跟踪、双向
禄亿萋
·
2024-01-29 16:25
深度学习
人工智能
Antlr4介绍和Helloworld
摘要:本文将首先介绍Antlr4,以及如何通过Antlr4grammer生成对应的hello的AST1.Antlr4简单介绍Antlr4(AnotherToolforLanguage
Recognition
离离原上草77
·
2024-01-28 16:40
java
antlr4
antlr4
《Two-Stream Convolutional Networks for Action
Recognition
in Videos》算法详解
论文链接:Two-StreamConvolutionalNetworksforAction
Recognition
inVideos文章由牛津大学VGG实验室提出,收录于NIPS2014。
ce0b74704937
·
2024-01-28 14:57
Python face-
recognition
库,dlib库安装方法(附下载文件)
face_
recognition
是一个基于dlib的Python库,用于实现人脸识别功能。它提供了简单易用的API,使得开发者可以方便地进行人脸识别的开发,而无需深入了解算法细节。
砍树+c+v
·
2024-01-28 11:14
OpenCV学习
人工智能
python
机器学习
opencv
[Python] scikit-learn - 葡萄酒(wine)数据集和决策树分类器的使用
葡萄酒(wine)数据集介绍葡萄酒识别数据集(Wine
Recognition
dataset)通常用于多类别分类问题建模。
老狼IT工作室
·
2024-01-28 02:10
python
机器学习
python
scikit-learn
决策树
做情绪识别,有必要用LLM吗?
对话情感识别(Emotion
Recognition
inConversation)是一个分类
zenRRan
·
2024-01-27 23:26
基于脑电图的注意力稀疏图卷积神经网络的帕金森病识别
基于脑电图的注意力稀疏图卷积神经网络的帕金森病识别EEG-BasedParkinson’sDisease
Recognition
viaAttention-BasedSparseGraphConvolutionalNeuralNetwork
有人学习不瞌睡吗
·
2024-01-27 22:59
脑机接口
cnn
深度学习
人工智能
卷积神经网络
神经网络
机器学习
呼叫中心及线路智能语音质检系统
所需要的工具或者能力如下;1、ASR(AutomaticSpeech
Recognition
)录音转换成文字的引擎。下图是磐石云独立开发的语音识别引擎日志。
qq_191999713
·
2024-01-27 21:21
磐石云
笔记
vox
语音识别
人工智能
OpenAI ChatGPT-4开发笔记2024-07:Embedding之Text Similarity文本相似度
OpenAIhasmadewavesonlinewithitsinnovativeembeddingandtranscriptionmodels,leadingtobreakthroughsinNLPandspeech
recognition
.Thesemodelsenhanceaccuracy
aiXpert
·
2024-01-27 06:08
笔记
embedding
136自然语言处理通关手册--文本纠错
文本纠错文本纠错概述文本纠错又称为拼写检查,由于纯文本往往来源于手打或者OCR(OpticalCharacter
Recognition
,光学字符识别),很可能存在一些错误,因此此技术也是一大关键的文本预处理过程
Jachin111
·
2024-01-27 01:38
Jetson-inference -Coding Your Own Image
Recognition
Program (Python)学习笔记
有多种类型的深度学习网络可用,包括识别、检测/定位和语义分割。我们在本教程中重点介绍的第一个深度学习功能是图像识别,使用在大型数据集上训练的分类网络来识别场景和对象。镜像操作dockerpulldustynv/jetson-inference:r32.6.1传输文件到docker容器,这个你网不好的情况下也不会在容器内添加代理的话可以使用的到。首先需要知道docker容器的container_id
无证驾驶梁嗖嗖
·
2024-01-27 00:26
边缘计算
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他