baidu_huihui

Real-Time Scene Text Detection with Differentiable Binarization

转载-原文链接

zReal-Time Scene Text Detection with Differentiable Binarization

源码参考 https://github.com/WenmuZhou/DBNet.pytorch

论文收录于AAAI 2020，链接如下：

[1911.08947] Real-time Scene Text Detection with Differentiable Binarization (arxiv.org)arxiv.org/abs/1911.08947编辑

一、论文速读

1.1 解决的问题

二值化的后处理对于基于分割的检测是必不可少的，它将分割方法产生的概率图转换为文本的边界框/区域。大多数基于分割的方法需要复杂的后处理去将像素级预测结果分组到检测到的文本实例，导致推理过程的时间成本相当。大多数现有的检测方法使用类似的后处理管道：设置一个固定的阈值，将分割网络产生的概率图转换为二值图像;一些启发式技术，如像素聚类，用于将像素分组到文本实例中。在本文中，我们提出了一个名为可微二值化(DB)的模块，该模块可以在分割网络中执行二值化过程。与DB模块一起优化，分割网络可以自适应地设置二值化的阈值，这不仅简化了后处理，而且提高了文本检测的性能。

1.2 贡献

提出的可微DB模块，使得二值化的过程在CNN中端到端可训练。
比以前的领先方法快得多，因为 DB 可以提供高度稳健的二值化图，大大简化了后处理。速度快的同时还可以检测任意形状的文本实例。
当使用轻量级主干时，DB工作得很好，这显著提高了ResNet-18主干的检测性能。
由于DB可以在推理阶段删除而不牺牲性能，因此没有额外的内存/时间成本进行测试。

1.3 缺陷

不能处理“文本内部”的情况，这意味着文本实例在另一个文本实例内部。尽管缩小的文本区域有助于文本实例不在另一个文本实例的中心区域的情况，但当文本实例恰好位于另一个文本实例的中心区域时失败。这是基于分割的场景文本检测器的一个常见限制。

二、方法

将图像输入到特征金字塔主干中。其次，金字塔特征被上采样到相同的尺度并级联以产生特征F。然后，特征F用于预测概率图 (P) 和阈值图 (T)。之后，近似二值图(^B)由P和F计算。在训练过程中，对概率图、阈值图和近似二值图进行监督，其中概率图和近似二值图共享相同的监督。在推理阶段，边界框可以很容易地从近似二值图或通过框公式模块获得。

2.1 网络结构

对应图中三个红框：

2.1.1 Self.backbone

由resnet构成，加载了多个系列模型可任意选择。Resnet中有一个可选操作可变形卷积（如下图所示）：可以为模型提供灵活的感受野，这对极端纵横比的文本实例特别有益。调制可变形卷积应用于ResNet-18或ResNet-50主干中的conv3、conv4和conv5阶段的所有3×3卷积层。

2.1.2 Self.neck

代码中对应FPN类（如下图）：

Reduce_conv将resnet各层输出图片通道数变为256，upsample上采样到同等大小（P5大小），smooth进行一个尺度不变的卷积平滑。

2.1.3 self.head

2.1.3.1 用于输出probability map

其中有个转置卷积：

上图是普通卷积核写成矩阵乘法的形式，而转置卷积就是对这个形式进行转置，是的尺寸可以变回原尺寸（实际就等效于一个upsample，如下图所示）。转置过程中的卷积核的参数是需要学习的。

2.1.3.2 用于计算threshold map

2.1.3.3 可微分二值化

获得两张图片后进行可微分二值化并将结果连接输出：

step_function

标准二值化给定一个分割网络产生的概率图P∈RH×W，其中H和W表示地图的高度和宽度，必须将其转换为二值映射P∈RH×W，其中像素为值 1 被认为是有效的文本区域。通常，这种二值化过程可以描述如下：

(1)

可微二值化，使用近似阶跃函数执行二值化：

其中^B是近似二值图；T是从网络学习的自适应阈值图；k表示放大因子。k根据经验设置为50。这种近似二值化函数的行为类似于标准二值化函数(如下图)，但是可微的，因此可以在训练阶段与分割网络一起进行优化。具有自适应阈值的可微二值化不仅可以帮助区分文本区域和背景，还可以分离紧密联合的文本实例。

效果举例：第二个是概率图与二值图的gt，第三个是阈值图gt。实际Tgt偏白的每个值都是不同的，都需要计算，但此处为了便于理解公式的作用效果假设偏白0.7，偏黑0.3，进行如上图所示的计算得二值图。实际得到的二值图与概率图是一样的，作用只是使之可微分并提高效果。

DB提高性能的原因：通过梯度的反向传播来解释。以二元交叉熵损失作为我们的DB函数为例：

正样本左边，负样本右边

设

其中x=Pi,j-Ti,j。那么正标签的损失l+和负标签的l−是:

我们可以很容易地用链式法则计算损失的差异：

l+和l−的导数如图所示。我们可以从差异中看出（1）梯度由放大因子 k 增强； (2)对于大多数错误预测的区域，梯度的放大是显著的，从而促进优化并有助于产生更独特的预测。此外，当 x=Pi,j−Ti,j 时，P的梯度被T影响并重新缩放在前景和背景之间。

K=50时，当一个正样本被估计成负样本，则落在b的左边，是一个小于-10的数，带入loss很大，负样本误判同理。

2.2 标签生成

2.2.1 原理

概率图的标签生成受到PSENet的启发。给定一个文本图像，其文本区域的每个多边形由一组段描述：

n 是顶点数，在不同的数据集中可能不同（ICDAR 2015数据集为4，CTW1500数据集为 16）。然后使用Vatti裁剪算法将多边形G缩小到Gs来生成正区域。收缩的偏移量D是从原始多边形的外围L和面积A计算的：

其中r是收缩率，根据经验设置为0.4。

红色是原始的紧贴文字的区域，蓝色内部1外部0

具有相似的过程，我们可以为阈值图生成标签。首先，将文本多边形G扩展为与Gd相同的偏移量D。我们将Gs和Gd之间的差距视为文本区域的边界，其中阈值图的标签可以通过计算到G中最近段的距离来生成。

收缩扩张D是一样的。灰色中值的计算：计算该点到四条红色边的距离，最短的距离作为值，除以D进行归一化，变成绿、蓝线1，红线0，用1减去所有值得到最终标签图，中间值大，两边值小。实际的归一化不会到0-1，而是其之间的一个数，例如0.3-0.7

Threshold gt的内边所围的面积与probability白色面积相等。

2.2.2 代码实现

2.2.2.1 probability gt

2.2.2.2 threshold gt

2.3 优化

损失函数L可以表示为概率图Ls的损失、二值图Lb的损失和阈值图Lt的损失的加权和：

其中Ls是概率图的损失，Lb是二值图的损失。根据损失的数值，α和β分别设置为 1.0 和 10。

我们对Ls和 Lb 应用二元交叉熵 (BCE) 损失。为了克服正负数的不平衡，通过对硬负数进行采样，在BCE损失中使用了hard negative mining。Sl是采样集，其中正负比例为1:3。

hard negative mining

Lt计算为扩张文本多边形Gd内预测标签和标签之间的L1距离之和：

其中Rd是扩张多边形Gd内像素的一组索引（计算了扩张多边形内的所有像素）；y*是阈值图的标签。

2.4 推理（后处理）

2.4.1 方法细节

我们可以使用概率图或近似二进制图来生成文本边界框，这会产生几乎相同的结果。为了提高效率，我们使用概率图，以便可以删除阈值分支（只需probability map，另两个删除）。盒子形成过程包括三个步骤：(1)概率图/近似二进制映射首先用常数阈值(0.2)进行二值化，得到二进制地图； (2)连接区域（shrunk文本区域）是从二进制地图中获得的；(3)缩小区域以偏移量D'和Vatti裁剪算法)进行扩张。D' 计算为

其中A'是收缩多边形的面积；L'是收缩多边形的周长；r'根据经验设置为1.5。

2.4.2 代码实现

后处理详情：SegDetectorRepresenter()，把网络输出的概率图得到最终的文字框

以输出多边形为例讲解，矩形框操作类似:

三、数据集

SynthText是合成数据集，由800k张图像组成，是从8k背景图像合成的。仅用于预训练模型。

MLT-2017是一个多语言数据集。它包括9种语言代表6个不同的脚本。该数据集中有7,200个训练图像、1800个验证图像和9,000个测试图像。我们在微调阶段同时使用训练集和验证集。

ICDAR 2015数据集由1000张训练图像和500张测试图像组成，这些图像由谷歌眼镜捕获，分辨率为720×1280。文本实例在单词级别进行标记。

MSRA-TD500数据集是一个多语言数据集，包括英文和中文。有300个训练图像和200个测试图像。文本实例在文本行级别进行标记。按照之前的方法，包括来自HUSTTR400的额外400个训练图像。

CTW1500是一个专注于弯曲文本的数据集。它由1000个训练图像和500个测试图像组成。文本实例在文本行级别进行注释。

Total-Text包含各种形状的文本，包括水平、多方向和弯曲。它们是1255个训练图像和300个测试图像。文本实例在单词级别进行标记。

四、实施细节

对于所有模型，我们首先使用SynthText数据集对它们进行100k次迭代的预训练。然后，我们在相应的真实世界数据集上微调模型1200个epoch。训练批次大小设置为16。我们遵循多学习率策略，其中当前迭代的学习率等于初始学习率乘以

其中初始学习率设置为0.007，功率设置为0.9。我们使用0.0001的权重衰减和0.9的动量。max_iter表示最大迭代次数，这取决于最大epoch。

训练数据的数据增强包括：（1）角度范围为（-1、1、10）的随机旋转；(2) 随机裁剪；(3) 随机翻转。所有处理后的图像都重新缩放为640×640，以获得更好的训练效率。

在推理阶段，我们通过为每个数据集设置合适的高度来保持测试图像的方面比并重新大小输入图像。推理速度以1的批大小进行测试，在单个线程中使用单个1080ti GPU。推理时间成本由模型前向时间成本和后处理时间成本组成。后处理时间成本约为推理时间的30%。

五、消融实验

可微二值化与转置卷积：

阈值图的监督：

六、结果比较

Total-Text数据集上的检测结果。括号中的值表示输入图像的高度。“*”表示在多个尺度上进行测试。“MTS”和“PSE”是Mask TextSpotter和PSEN的缩写

CTW1500的检测结果。带有“*”的方法是从(Liu et al. 2019a)收集的。括号中的值表示输入图像的高度。

ICDAR 2015数据集上检测结果。括号中的值表示输入图像的高度。“TB”和“PSE”是TextBoxes++和PSENet的缩写。

MSRA-TD500数据集上的检测结果。括号中的值表示输入图像的高度。

MLT-2017数据集上的检测结果。带有“*”的方法是从 (Lyu et al. 2018b) 收集的。在我们的方法中，MLT-2017 数据集中的图像被重新调整为768×1024。“PSE”是PSENet的缩写。

七、Rethink

本文总体通过网络提取概率图与阈值图，进行可微分二值化得到二值图，推理阶段通过后处理从概率图扩张得到矩形框。其中概率图与阈值图的gt由shrink生成。
从输出结果上看，召回率在多个数据集上的效果都不算太好，可能是标签生成中忽略太小的文字块导致的，可以对过小的文字块进行专门的处理，减小D？

ipython的变量_使用Ipython ipywidget创建变量？ weixin_39521009 ipython的变量
ThisseemsreallysimplebutIhavenotbeenabletofindasingleexampleortosolvethismyself.HowdoIuseanipywidgetwidgettocreateorreturnapythonvariable/object,suchasalistorstring,thatcanbeusedinafollowingcell?解决方案T
Umi-OCR：开源、免费的离线OCR软件庞沛兴Philippa
Umi-OCR：开源、免费的离线OCR软件Umi-OCRUmi-OCR:这是一个免费、开源、可批量处理的离线OCR软件，适用于Windows系统，支持截图OCR、批量OCR、二维码识别等功能。项目地址:https://gitcode.com/gh_mirrors/um/Umi-OCR项目基础介绍和主要编程语言Umi-OCR是一个开源、免费的离线OCR（光学字符识别）软件，适用于Windows和Li
-bash: ./****.py: /usr/bin/python^M: bad interpreter: No such file or directory GeoWin_CAU GeoPython Spatial Big Data（空间大数据）python linux windows
在windows系统下写的python脚本，在linux下赋予权限chmod+xxxx.py以后，执行./xxx.py运行提示：bash:/usr/bin/autocrorder:/usr/bin/python^M:badinterpreter:Nosuchfileordirectory更多文章请点击我
网络安全基础{英文答案}_OCR ★Alfalfa★ 网络安全
Chapter1IntroductionAnswerstoQuestionsTheOSISecurityArchitectureisaframeworkthatprovidesasystematicwayofdefiningtherequirementsforsecurityandcharacterizingtheapproachestosatisfyingthoserequirements.Th
Python下3种文字识别工具的源码和效果比较 eybk python 开发语言
1.pytesseractimportpytesseractfromPILimportImageim=Image.open(r'C:/Users/YBK/Pictures/35005.jpg')string=pytesseract.image_to_string(im,lang='chi_sim')print(string)2.paddleocrfrompaddleocrimportPaddleO
Anaconda数据报错：Fatal error in launcher: Unable to create process using ‘“E:\Anaconda\python.exe“ “D: Deng872347348 python windows 开发语言
Anaconda数据报错：Fatalerrorinlauncher:Unabletocreateprocessusing'“E:\Anaconda\python.exe”“D:\Anaconda\Scripts\pip.exe”':???问题描述—Fatalerrorinlauncher:Unabletocreateprocessusing'“E:\Anaconda\python.exe”“D:\
word转HTML 基本版我自横刀向天笑-去留肝胆两昆仑 Java html word 转换
同时支持doc和docx，话不多说，直接上代码项目依赖pom.xmlcommons-langcommons-lang2.6org.apache.poipoi3.14org.apache.poipoi-ooxml3.14org.apache.poipoi-scratchpad3.14fr.opensagres.xdocreportorg.apache.poi.xwpf.converter.xhtml
Tika 解析pdf时使用的内置TesseractOCRParser如何修改语言为简体中文 lxh9512 pdf spring boot
项目需求中需要对pdf文件进行解析提取文件中的文本内容，对比后选择使用tika库支持对多种文件自动进行解析，测试解析效果也不错。但是遇到问题当解析扫描版pdf文件时，tika会去调用ocr工具TesseractOCRParser没有的话解析内容会为空，下载安装Tesseract后能解析出来但是内容都是乱码。发现需要下载中文解析包并设置解析语言为中文，但是TesseractOCRParser的默认语
python 利用 ddddocr包 ocr识别图片码风_流沙 python工具备忘录 python ocr 开发语言
ddddocr是一个轻量级的OCR（光学字符识别）库，适用于识别图片中的文字，包括验证码等图像文本。要使用ddddocr进行图片验证码的识别，可以按照以下步骤进行：1.安装ddddocr包首先，你需要安装ddddocr包。你可以使用pip安装：pipinstallddddocr2.使用ddddocr进行OCR识别importddddocr#创建OCR对象ocr=ddddocr.DdddOcr()#
使用 Python 和 Tesseract 实现验证码识别一休哥助手 mfc c++
验证码识别是一个常见且实用的技术需求，尤其是在自动化测试和数据采集场景中。通过开源OCR（OpticalCharacterRecognition，光学字符识别）工具Tesseract，结合Python的强大生态，我们可以高效实现验证码识别任务。本篇博客将以详细步骤和代码示例，介绍如何使用Python和Tesseract实现验证码识别，包括原理解析、图像预处理、代码实现以及优化策略。一、验证码识别的
【git】idea和git默认换行符号设置 lisacumt git
IDEAFile|Settings|Editor|CodeStylegitLFwillbereplacedbyCRLFthenexttimeGittouchesit#win也使用使用默认的LF作为换行符#ture的话会自动转换gitconfig--globalcore.autocrlffalse
如何用Python将pdf文件转化为高清图片张登杰踩 pdf
最近在整理文档，需要将文档进行OCR识别，然后结构化。直接解析pdf文档，行不通，因为文档里面是图片。于是采取先转图片，然后OCR，然后结构化。下面是pdf文档转图片的方法。importfitz#PyMuPDFdefpdf_to_images(pdf_path,images_folder):#打开PDF文件document=fitz.open(pdf_path)forpage_numinrange
linux下使用脚本实现对进程的内存占用自动化监测浪小满常用问题解决 linux 自动化运维内存占用情况监测
linux系统中常用cat/proc/{pid}/status和pmap-x{pid}来监测某个进程的内存资源占用情况。其中注意各参数的含义如下：VmSize：表示进程当前虚拟内存大小VmPeak：表示进程所占用最大虚拟内存大小VmRSS：表示进程当前占用物理内存的大小(与procrank中的RSS，pmap中的RSS一样)VmLck：表示被锁定的内存大小VmHWM：表示进程所占用物理内存的峰值V
怎么样搭建客户管理系统客户管理crm系统
搭建一个高效的客户管理系统（CRM）是现代企业提升竞争力的关键所在。首先，明确需求是搭建客户管理系统的第一步，企业应根据自身行业特性和客户管理需求来设计系统架构、选择功能模块。其次，选择合适的CRM工具能够显著提升系统的实施效率，市场上如纷享销客、ZohoCRM等多款工具，在国产化、国际化的背景下，能够为企业提供多元化的服务和定制化需求解决方案。最后，数据管理与自动化功能的整合是系统成功与否的关键
PyTorch深度学习实战（43）——手写文本识别盼小辉丶深度学习 pytorch 人工智能
PyTorch深度学习实战（43）——手写文本识别0.前言1.手写文本识别1.1基本概念1.2输入和输出格式1.3CTC损失值2.模型与数据集分析2.1数据集分析2.2模型分析3.实现手写文本识别模型小结系列链接0.前言手写文本识别，也称为手写文本的光学字符识别(OpticalCharacterRecognition,OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手
从大型企业到中小企业：销售易、红圈、励销云CRM的行业应用程序员算法机器学习
在数字化转型的浪潮中，客户关系管理（CRM）系统已成为企业提升竞争力的关键工具。本文将对国内三大知名CRM品牌——销售易CRM、红圈CRM和励销云CRM进行深度分析，从品牌介绍和适用企业两个维度进行总结和盘点，帮助企业选择最适合自身需求的CRM解决方案。一、销售易CRM品牌介绍销售易（Neocrm）是中国领先的CRM品牌，成立于2011年，总部位于北京。作为国内领先的企业级CRM服务商之一，销售易
Python识别处理验证码技术详解傻啦嘿哟 python 开发语言
目录一、验证码的种类二、OCR技术简介三、使用OCR技术识别验证码1.安装所需库2.下载和处理验证码图片3.使用OCR进行识别4.完整代码示例四、处理复杂验证码五、案例：识别古诗文网验证码六、总结验证码作为一种常见的安全手段，广泛应用于各种网站和应用中，以防止自动化脚本的恶意攻击。然而，在自动化测试或数据抓取过程中，识别验证码成为了一个不得不面对的问题。本文将详细介绍如何使用Python来识别和处
Zerox：AI驱动的万能OCR工具，精准识别复杂布局并输出Markdown格式，支持PDF、DOCX、图片等多种文件格式蚝油菜花每日 AI 项目与应用实例人工智能 ocr pdf 人工智能开源
❤️如果你也关注AI的发展现状，且对AI应用开发非常感兴趣，我会每日分享大模型与AI领域的最新开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读功能：支持零样本OCR识别，兼容PDF、DOCX、图片等多种格式文件。技术：基于GPT-4o-mini模型，能够处理复杂布局文档，输出Markdown格式结果。应用：提供API接口，便于集成到
使用Llama 3.2-Vision多模态LLM与您的图像聊天 AI程序猿人 llama transformer pytorch 深度学习大模型应用人工智能大模型
介绍将视觉能力与大型语言模型（LLMs）结合的多模态LLM（MLLM）正在通过多模态LLM革命性地改变计算机视觉领域。这些模型结合了文本和视觉输入，展示了在图像理解和推理方面的出色能力。虽然这些模型以前只能通过API访问，但最近的开源选项现在允许本地执行，使其在生产环境中更具吸引力。在此教程中，我们将学习如何使用开源的Llama3.2-Vision模型与图像进行聊天，你会对其OCR、图像理解和推理
rocketmq的启动关闭 chen_zi_ rocketmq linux 服务器
rocketmq的启动1.启动NameServer[root@dailybluebin]#nohupshmqnamesrv&检查日志：[root@dailybluebin]#tail-f~/logs/rocketmqlogs/namesrv.log2.启动Brokernohupshmqbroker-c../conf/broker.conf-n192.168.88.23:9876autoCreate
小猿口算自动PK脚本小黄编程快乐屋人工智能 python
大家好，我是小黄。近期，众多大学生炸鱼小猿口算APP,把一众小学生都快虐哭了，小黄听闻后，也跃跃欲试。对此小黄也参考网上的资料写了一个自动Pk的脚步。首先大家需要安装一个pytorch环境过程中，如果小伙伴对此不熟悉的话可以参考网上的相关教程。我们需要用到Tesseract-OCR文本识别。他的原理就是先截图，之后框选出比较大小的两个数字所在的区域，使用Tesseract-OCR识别出来后进行判断
合合信息名片全能王上架原生鸿蒙应用市场，成为首批数字名片类应用合合技术团队 harmonyos 华为鸿蒙鸿蒙系统
长期以来，名片都是企业商务沟通的重要工具。随着企业数字化转型，相较于传统的纸质名片，数字名片对于企业成员拓展业务、获取商机、提升企业形象等方面发挥着重要作用。近期，合合信息旗下名片全能王正式上线原生鸿蒙应用市场，成为首批上线的数字名片类应用，帮助用户用AI扫描、识别和管理名片，提高商务沟通和客户数据管理的效率。名片全能王是一款智能名片及人脉管理APP，基于合合信息的智能文字识别技术，可将复杂场景下
【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
python安装包提示Requirement already satisfied 可爱的的编辑人员配置 python numpy 开发语言
python安装cnocr提示Requirementalreadysatisfied错误信息如下：Requirementalreadysatisfied:pyreadline3inc:\python310\lib\site-packages(fromhumanfriendly>=9.1->coloredlogs->onnxruntime->cnocr)(3.4.1)Installingcollec
OCR字符识别--WeChatocr 鲁鲁在川 ocr
导入库，及定义微信OCR地址fromwechat_ocr.ocr_managerimportOcrManager,OCR_MAX_TASK_IDimportthreadingwechat_ocr_dir=r"./ocr/WeChatOCR/7079/extracted"#OCR的地址，可以用everythin工具查找一下地址这个地址是电脑用户安装APP的地址---C:\Users\xxxx\App
SpringBoot一键提取身份证与营业执照信息一名技术极客 #java相关工具类 spring boot 后端 java
SpringBoot一键提取身份证与营业执照信息使用的工具和库步骤和代码示例添加依赖图像预处理和文字识别信息提取使用OpenCV对图像进行预处理OpenCV图像预处理示例集成到OCR服务中在SpringBoot中实现图片中的身份证号、营业执照等信息的识别，可以分为以下几个步骤：图像预处理：为了提高识别的准确性，首先对图片进行预处理，如调整大小、对比度、亮度等。文字检测：使用图像处理算法或框架来定位
Deluge脚本语言是什么？在Zoho Creator低代码平台中有什么作用？低代码软件开发开发工具编程语言
在当今快速变化的商业环境中，企业需要敏捷地适应市场变化，快速响应客户需求。ZohoCreator低代码开发平台，提供了一个强大的工具集，帮助企业构建定制化的应用程序。本文将探讨Deluge脚本语言是什么，以及它是如何增强ZohoCreator构建的应用程序功能方面的能力。一、传统开发模式下的痛点与挑战在当今快速变化的商业环境中，企业需要能够迅速响应市场需求并灵活调整业务流程的应用程序。然而，传统的
用Ingress生成route，如何让生成route的insecureEdgeTerminationPolicy 的值为Allow RedCong Openshift k8s 云原生 kubernetes 云原生 openshift
对于此功能当前还没有实现，相关的新功能添加的Jiraticket如下：Annotatetheingresstocreatetheroutewiththespec.tls.insecureEdgeTerminationPolicysettoAllow目前已经实现的功能为termination，insecureEdgeTerminationPolicy目前未实现。apiVersion:networki
Java - 文字识别；示例代码基于SpringAI和国产大模型沈询-阿里 microsoft 机器学习人工智能后端
文字识别在Java开发中的应用在Java开发中，将图像中的文字进行识别能力被广泛应用于多种场景，比如自动审核图片内容、商品搜索分析等。过去，这类需求主要通过OCR（光学字符识别）技术来实现，但其对于复杂图像的处理效果往往不尽人意。如今，随着大模型技术的发展，利用这些先进的AI模型进行文字识别成为可能，不仅大大提升了识别精度和速度，还能更好地理解图像中的复杂信息，为用户提供更加准确可靠的服务。本文采
合合信息名片全能王上架原生鸿蒙应用市场，成为首批数字名片类应用华为harmonyos
长期以来，名片都是企业商务沟通的重要工具。随着企业数字化转型，相较于传统的纸质名片，数字名片对于企业成员拓展业务、获取商机、提升企业形象等方面发挥着重要作用。近期，合合信息旗下名片全能王正式上线原生鸿蒙应用市场，成为首批上线的数字名片类应用，帮助用户用AI扫描、识别和管理名片，提高商务沟通和客户数据管理的效率。名片全能王是一款智能名片及人脉管理APP，基于合合信息的智能文字识别技术，可将复杂场景下
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。