E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
图像识别--ocr
小猿口算pk脚本(基础版)
实现原理:安卓adb截图传到电脑,然后用python裁剪获得两张数字图片,使用dddd
ocr
识别数字,比较大小,再用adb命令模拟安卓手势实现importosimportdddd
ocr
fromtimeimportsleepfromPILimportImage
HoRain云小助手
·
2025-02-11 21:03
python
python
开发语言
支持
图像识别
和图像生成!基准测试得分超越OpenAI的DALL·E 3 + Stable Diffusion
本篇笔记所对应的视频:https://www.bilibili.com/video/BV18DFpeMEps/Janus-Pro-7B是由DeepSeek开发的多模态AI模型,它在理解和生成方面取得了显著的进步。这意味着它不仅可以处理文本,还可以处理图像等其他模态的信息。模型主要特点:统一的架构:Janus-Pro采用单一transformer架构来处理文本和图像信息,实现了真正的多模态理解和生成
AI超元域
·
2025-02-11 20:21
stable
diffusion
人工智能
AI编程
ai
AI作画
AIGC
实践深度学习:构建一个简单的图像分类器
引言深度学习在
图像识别
领域取得了巨大的成功。本文将指导你如何使用深度学习框架来构建一个简单的图像分类器,我们将以Python和TensorFlow为例,展示从数据准备到模型训练的完整流程。
是Dream呀
·
2025-02-11 17:58
深度学习
人工智能
【扫描件PDF】如何批量识别扫描件PDF多个区域内容保存到Excel表格,基于WPF和腾讯
OCR
的详细解决方案
注册腾讯云账号并开通
OCR
服务:访问腾
平安喜乐-开开心心
·
2025-02-11 13:32
pdf
excel
wpf
PDF批量个性化拆分
批量按照分拣大小拆分PDF
批量拆分PDF保存到指定位置
PDF区域识别实现方案
从零开始:用Python手写神经网络
从
图像识别
到自然语言处理,再到强化学习,神经网络的身影无处不在。然而,对于许多初学者来说,神经网络似乎是一个神秘而复杂的黑盒子。
WHCIS
·
2025-02-11 08:27
python
神经网络
开发语言
人工智能
深度学习
算法
2025最新主流深度学习算法全解析
从语音助手到自动驾驶,从
图像识别
到自然语言处理,深度学习的应用无处不在,深刻地改变着
lucky_syq
·
2025-02-11 08:25
AI
深度学习
算法
人工智能
了解深度神经网络模型(Deep Neural Networks, DNN)
深度神经网络模型(DeepNeuralNetworks,DNN)深度神经网络模型是一种包含多个隐藏层的神经网络,能够通过多层次的非线性变换从数据中提取复杂特征,广泛应用于
图像识别
、自然语言处理等领域。
huaqianzkh
·
2025-02-11 05:02
未来技术
dnn
人工智能
神经网络
[特殊字符] 基于 FastAPI 和 React 构建车牌号识别网站
1.项目概述在本项目中,我们将构建一个车牌号识别网站,用户可以上传车辆图片,系统会通过
OCR
车牌识别模型(Paddle
OCR
/HyperLPR)提取车牌号码,并将结果展示到前端。
drebander
·
2025-02-11 00:54
AI
编程
fastapi
react.js
前端
unable to create new native thread异常分析
在DataNode服务节点上信息如下:ERROR:DataNodeisoutofmemory.Willretryin30seconds.unablet
ocr
eatenewnativethread问题分析根据反馈的信息
spring208208
·
2025-02-10 23:44
hadoop
java
开发语言
神经网络(Neural Network)
其强大的非线性建模能力使其在
图像识别
、自然语言处理、语音识别和预测分析等任务中表现出色。神经网络的基本构建单元是神经元,每个神经元接收多个输入信号,通过加权求和并应用激活函数来生成输出。
ningmengjing_
·
2025-02-10 23:41
神经网络
深度学习
人工智能
2024年常用的物体识别API
从宠物
图像识别
到食物营养识别,这些API服务不仅让我们的生活更加便捷智能,也为各行各业带来了更多的可能性。让我们一起探索未来2024年常用的物体识别API,看看它们将如何改变我们的生活和工作。
·
2025-02-10 22:47
程序员
深度学习入门:搭建你的第一个神经网络
从语音助手到自动驾驶汽车,从
图像识别
到自然语言处理,深度学习的应用无处不在。而Python作为一门简洁而强大的编程语言,成为了深度学习领域最受欢迎的工具之一。
Evaporator Core
·
2025-02-10 22:36
人工智能
深度学习
Python开发经验
深度学习
python
神经网络
通过硅基流动网站调用 DeepSeek API 的详细步骤指南
DeepSeek作为一家专注于AI技术的公司,提供了丰富的API接口,涵盖了自然语言处理、
图像识别
、数据分析等多个领域。而硅基流动作为一个开放的技术平台,为开发者提供了便捷的方式来调用这些API。
wen02809
·
2025-02-10 18:10
人工智能
【自动化办公】基于WPF和阿里云API的高效识别PDF多个区域内容并保存至JSON文件,再将JSON文件转换解析为表格输出
以下是一个基于WPF和阿里云
OCR
API实现高效识别PDF多个区域内容,保存至JSON文件,再将JSON文件转换解析为表格输出的详细解决方案。
平安喜乐-开开心心
·
2025-02-10 13:27
wpf
阿里云
pdf
PDF提取多个区域内容保存表格
PDF指定多区域内容保存
自动化
PDF提取内容重命名
一切皆是映射:量子机器学习与传统元学习的融合
1.背景介绍1.1人工智能的瓶颈当前,人工智能(AI)取得了令人瞩目的进步,尤其是在
图像识别
、自然语言处理等领域。
AI天才研究院
·
2025-02-10 11:41
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Umi-
OCR
_v2 使用教程
Umi-
OCR
_v2使用教程Umi-
OCR
_v2结束和新的开始项目地址:https://gitcode.com/gh_mirrors/um/Umi-
OCR
_v2项目介绍Umi-
OCR
_v2是一个基于Python
汤力赛Frederica
·
2025-02-09 19:26
如何在 Node.js 中创建嵌入向量
如何在Node.js中创建嵌入向量原文链接:Howt
oCr
eateVectorEmbeddingsinNode.js作者:PhilNash译者:倔强青铜三前言大家好,我是倔强青铜三。
·
2025-02-09 18:10
python
ocr
文字识别竖排繁体_繁体文字识别 ABBYY 与 千百
OCR
使用比较
由于是国外软件,不知对古书当中的繁体识别效果如何,从百度上找了一些繁体竖排的图片,然后我们将其与一款免费小软件“千百
OCR
”作一比较。
weixin_39588542
·
2025-02-09 17:11
python
ocr文字识别竖排繁体
Cloudflare通过代理服务器绕过 CORS 限制:原理、实现场景解析
第一部分:问题背景1.1错误现象复现//浏览器控制台报错示例Accesstofetchat'https://chat.qwenlm.ai/api/v1/files/'fromorigin'https://
ocr
.doublefenzhuan.me'hasbeenblockedbyCORSpolicy
web2u
·
2025-02-09 09:18
前端框架
安全
node.js
javascript
代理模式
proxy模式
一文读懂 RPA 与 AI 的完美结合过程
的完美结合过程在数字化时代,RPA(机器人流程自动化)与AI(人工智能)的结合备受关注,它们的融合应用范围极为广泛,不仅能处理简单重复性工作,如发送邮件、Excel计算、整理文件等,还能完成身份信息智能审核、文本
OCR
东锋1.3
·
2025-02-09 09:47
人工智能
人工智能
大数据
Tess ng 学习教程及其案例
TessNG是一个基于Tess4J的Java库,用于处理光学字符识别(
OCR
)任务。
若木胡
·
2025-02-09 05:46
学习
python 视频提取字幕
目录ffmpeg提取字幕没测试成功opencv加
ocr
ffmpeg提取字幕没测试成功ffmpeg-iinput_video.mp4-map0:s:0output_subtitle.srtimportsubprocessfrommoviepy.editorimportVideoFileClipvideo
AI算法网奇
·
2025-02-09 03:29
python基础
计算机视觉
人工智能
Vision Transformer学习笔记(2020 ICLR)
该模型直接采用原始图像块作为输入,而不是传统的卷积神经网络(CNNs),并通过Transformer架构处理这些图像块以实现高效的
图像识别
。
刘若里
·
2025-02-08 21:15
论文阅读
学习
笔记
网络
计算机视觉
transformer
《探秘卷积神经网络的核心—卷积核》
在当今人工智能飞速发展的时代,卷积神经网络(CNN)在
图像识别
、语音识别等众多领域取得了令人瞩目的成就。而其中,卷积核作为CNN的核心组件,发挥着至关重要的作用。
·
2025-02-08 19:57
机器学习人工智能深度学习
一切皆是映射:强化学习在医疗诊断中的应用:挑战与机遇
《一切皆是映射:强化学习在医疗诊断中的应用:挑战与机遇》关键词强化学习,医疗诊断,
图像识别
,数据预处理,算法优化摘要随着医疗技术的发展,医疗诊断的准确性和效率越来越受到关注。
AI天才研究院
·
2025-02-08 07:28
AI大模型企业级应用开发实战
Python实战
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
画化学结构式用InDraw,6个功能很实用
二、支持AI智能识别结构式图片InDraw的AI
图像识别
技术能够迅速解析复杂化学结构,无论是单个分子、多个分子,还是整个反应式,都能马上识别和转换;轻轻松松1秒画一个复杂结构式。
小鹰-上海鹰谷-电子实验记录本
·
2025-02-08 01:22
鹰谷InDraw
化学结构式
化学编辑器
OCR
-Table:从扫描PDF中提取表格的利器
OCR
-Table:从扫描PDF中提取表格的利器项目地址:https://gitcode.com/gh_mirrors/oc/
ocr
-table项目介绍
OCR
-Table是一个开源项目,专注于利用光学字符识别
蓬玮剑
·
2025-02-07 10:16
Paddle
OCR
截图自动文字识别
春节假期在家无聊,撸了三个小工具:PC截图+编辑/PC录屏(用于meeting录屏)/PC截屏文字识别。因为感觉这三个小工具是工作中常常需要用到的,github上也有很多开源的,不过总有点或多或少的小问题,不利于自己的使用。脚本的编写尽量减少对三方库的使用。已全部完成,这是其中的一个,后续将三个集成在在一个工具中。importtkinterastkfromtkinterimportttk,mess
五力
·
2025-02-07 10:43
python
tkinter
paddle
Halcon学习---光学字符识别(
OCR
)
1、text_line_orientationtext_line_orientation(Region,//输入文本行所在区域 Image,//输入图像 CharHeight, OrientationFrom,OrientationTo,//限定查找角度范围最小、最大角度 OrientationAngle)//输出计
盾山狂热粉
·
2025-02-07 08:06
halcon
学习
大模型元年:人工智能的“寒武纪大爆发”
一、从“专用”到“通用”:大模型开启AI新范式传统的人工智能模型往往是针对特定任务进行训练的“专用工具”,例如
图像识别
、语音识别等。而大模
小马过河R
·
2025-02-07 08:05
AI人工智能
人工智能
机器学习
深度学习
使用 Python 和 Tesseract
OCR
识别验证码
1.安装Tesseract和相关依赖首先,你需要安装Tesseract
OCR
和相关Python包。
ttocr.com
·
2025-02-07 08:32
python
ocr
开发语言
OCR
- Tesseract的Windows下安装使用及
ocr
识别
一、光学字符识别技术
OCR
(OpticalCharacterRecognition),中文是光学字符识别。是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
坐望云起
·
2025-02-07 08:32
深度学习从入门到精通
tesseract
win10
ocr
LSTM
光学字符识别
支持
图像识别
和图像生成
支持
图像识别
和图像生成,性能非常强悍!特别说明!虽说现在的电脑基本都能跑,但是最好还是十几代的CPU或者GPU。
这儿有一堆花
·
2025-02-07 08:31
AI
科技(人工智能)
ai
语言模型
人工智能
快速上手——.net封装使用DeekSeek-V3 模型
无论是自然语言处理、
图像识别
,还是智能推荐系统,AI都在改变着我们的生活和工作方式。在这个新春
webmote
·
2025-02-07 06:22
.net
core
深度剖析
C#入门
.net
deepseek
openai
sdk
AI
2024年多种文字识别API推荐
这些API服务涵盖了文字
OCR
识别、办公文档识别、通用印刷体识别、通用手写体识别、数字识别、文本识别、名片识别等领域,为用户提供了更加多样化和个性化的文字识别解决方案。
·
2025-02-07 05:44
程序员后端
分布式快照算法 Chandy-Lamport
Asnapshotalgorithmisusedt
ocr
eateaconsistentsnapshotoftheglobals
冬至喵喵
·
2025-02-06 21:51
分布式
算法
空间注意力模块(SAM)和时间注意力模块(TAM)详解及代码复现
这种机制通过动态分配权重,突出重要特征,抑制无关信息,从而提高
图像识别
的准确性和效率。
清风AI
·
2025-02-06 21:47
深度学习算法详解及代码复现
深度学习
人工智能
神经网络
python
计算机视觉
从零开始了解人工智能:核心概念、GPT及 DeepSeek 探索
它的核心目标在于模拟与扩展人类智力,在
图像识别
、语音交互、自然语言处理(
hjy1821
·
2025-02-06 19:37
AI
人工智能
gpt
大模型RAG应用开发之PDF解析工具对比
一汇总类型名称地址
OCR
提取表格内容保留文本顺序提取图片保存成md格式其他特性传统PDF解析库pymupdfhttps://github.com/pymupdf/PyMuPDF❌✔️✔️✔️❌●表格提取
大模型应用
·
2025-02-06 19:06
pdf
langchain
人工智能
llama
LLM
自然语言处理
RAG
使用Python和TensorFlow/Keras构建一个简单的CNN模型来识别手写数字
一个简单的
图像识别
项目代码示例,使用Python和TensorFlow/Keras库来训练一个基本的CNN模型,用于识别MNIST手写数字数据集,并将测试结果输出到HTML。
mosquito_lover1
·
2025-02-06 12:48
python
tensorflow
keras
基于STM32的智能垃圾分类系统
本文设计了一款基于STM32的智能垃圾分类系统,通过
图像识别
与传感器融合技术,实现垃圾自动分类与投放引导。系统支持语音提示、数据统计与远程管理,适用于社区、学校等公共场所。
STM32发烧友
·
2025-02-06 07:19
stm32
嵌入式硬件
单片机
低代码系统-插件功能分析(轻流)
轻流插件功能一览类别插件名称功能简介数据采集工具Q-Source通过主动轮询或者被动接收的方式,完成其他系统的数据打通和同步文字识别(
OCR
)自动识别图片中的内容并填充到表单字段内,由百度AI提供技术支持扫码录入在移动端填写表单时
露临霜
·
2025-02-06 06:11
低代码
目标检测数据集-Pascal VOC 数据集介绍
个人微信公众号:AI研习图书馆ID:(Art-Intelligence)欢迎关注,交流学习,共同进步~1.引言PASCALVOC数据集,为
图像识别
和分类提供了一整套标准化的优秀数据集,从2005年到2012
AI研习图书馆
·
2025-02-05 17:01
深度学习数据集
目标检测
数据集
VOC2007
一切皆是映射:神经网络在
图像识别
中的应用案例
一切皆是映射:神经网络在
图像识别
中的应用案例关键词:神经网络、
图像识别
、深度学习、卷积神经网络、映射、模式识别1.背景介绍1.1问题的由来
图像识别
问题的研究源于人类对于智能机器的渴望。
AI大模型应用之禅
·
2025-02-05 16:24
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于深度学习的植物病害检测系统
深度学习技术,尤其是YOLO(YouOnlyLookOnce)模型,在
图像识别
和目标检测领域取得了显著的成果。
A等天晴
·
2025-02-05 14:06
计算机视觉
深度学习
人工智能
Mac电脑上好用的免费截图软件
此外,它还具备标注、贴图、录屏、
OCR
识别等功能,可以导出为多种格式(如GIF、MP4、PNG等)。优点:操作简单,界面美观,支持自定义快捷键和设置,适合日常使用和专业需求。下载方式:可在A
kcarly
·
2025-02-04 21:01
Mac
OS
杂谈
macos
截图工具
基于 FPGA 的 CNN 卷积神经网络整体实现
基于FPGA的CNN卷积神经网络整体实现介绍卷积神经网络(CNN)是一种强大的深度学习架构,广泛用于
图像识别
、物体检测和自然语言处理等领域。
鱼弦
·
2025-02-04 18:37
人工智能时代
fpga开发
cnn
人工智能
【大模型应用开发 动手做AI Agent】第二轮思考:模型决定计算
这些模型通过学习海量数据,能够完成复杂的任务,如机器翻译、
图像识别
、问答系统等。然而,大模型在应用开发中面临着计算资源、能耗和效率等方面的挑战。本文将从“模型
AGI大模型与大数据研究院
·
2025-02-04 16:30
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
开源
OCR
工具大比拼:常用工具全解析与选择指南
在信息爆炸的当下,
OCR
(光学字符识别)技术如同一位“炼金术士”,能高效且相对精确地从海量纸质文档、扫描件、图片中提取文字信息,广泛应用于教育、医疗、交通等众多行业。
花千树-010
·
2025-02-04 16:56
RAG
ocr
超级好用、超准文字识别框架----飞浆PaddlePaddle
OCR
(文件检测+识别)实战篇
目录简介项目介绍安装难点问题解决办法参数介绍模型推理调用简介飞桨(PaddlePaddle)
OCR
(OpticalCharacterRecognition)是一个开源的深度学习框架,用于文字识别任务。
数虫
·
2025-02-04 14:46
深度学习
人工智能
ocr
飞桨
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他