合合技术团队

【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势

点击领取AI产品100元体验金，助力开发者高效工作解决文档难题：

AI产品专享礼遇

总结

合合信息技术团队经过调研复现以及对比实验，对于上述几个印章识别的解决方案，有以下总结，如下表所示：

技术方案

优点

缺点

印章文本检测+文本矫正(optional)+文本识别

检测与识别模块可独立优化

适用不同类型印章识别

速度慢

维护成本高

印章端到端检测识别

模型pipeline简单

速度快，便于维护

很难训练

不适用方章等特殊印章

印章序列预测方案

模型pipeline简单

适用不同类型印章识别

模型容易过拟合

可解释差

无法给出文本位置

引言

随着社会经济的发展，印章作为企事业单位、社会团体、政府部门乃至国家的一种具有法律意义的标志和证据，在现代社会生活中发挥着重要作用。随着现代商务活动的不断发展，企业在业务开展的过程中通常会涉及大量的合同签署归档工作，以往会采取人工审核合同照片的方式来判断合同签署的双方是否都加盖了公章，但是这样做人工审核时间成本高、人力成本高，因此，印章识别可自动提取出印章文本，从而实现计算机替代人工审核比对，解决合同管理工作中人工审核时间成本高、人力成本高的难题，降低财税及商务合同签订过程的业务风险，使商务连接更加高效和便捷。

常用印章

日常工作中常见的印章有：公章、财务章、法定代表人章、发票专用章、合同专用章。

技术难点

回到本文的介绍主题，本文希望通过介绍印章识别和常规文本行识别的对比，来阐述两者的差异，从而让读者建立一个较为具象的认知。

对比纬度

常规文本行识别

印章识别

示例图像

文字形状

矩形/四边形

任意形状

文字遮挡

一般而言是无遮挡的独立文本行

大概率存在不同程度的遮挡和背景干扰

重叠

排版方式

千奇百怪，方形、椭圆形、圆形等各种形状差异都很大

阅读顺序

人类自然阅读顺序

从左到右

从右到左

无序

受盖章方向影响

OCR领域中较少关于印章文字识别的研究，但是合合技术团队研究论证认为，自然场景文本识别的一些技术可以应用于印章识别。本文下面将介绍一些印章识别的技术方案。

印章识别主流方案

印章识别系统的输入是一张经过裁剪的印章图片，输出是印章中所有文本的坐标框和识别结果，流程如下图所示：

下面介绍一些印章识别的技术方案。

印章文本检测+文本矫正(optional)+文本识别

第一套印章识别方案是传统的级联系统:

经过裁剪的印章图片，首先经过一个支持曲形文本检测的文本检测模型获取文本坐标框，其输出可以直接送入文本识别模型得到最终的识别结果；也可以先利用一个TPS[1]矫正模块，将所有曲形文本拉直成水平文本行图片，再送入文本识别模型。

下面简单介绍一下其中重点模块的选型。

文本检测模型：近年来基于深度学习的场景文本检测领域取得了重大进展，有很多成熟的曲形文本检测方案可供选择，大体上分为两类：

基于回归的检测模型，比如Mask RCNN[2]、EAST-like[3]和TextRay[4]；
基于分割的检测模型，比如PSENet[5]、CRAFT[6]和DBNet[7]。

下面以EAST-like(该模型没有名称，暂且称为EAST-like)为例做简单介绍：

上图是EAST-like的标签生成示意图和网络结构，该模型对经典的EAST[8]模型进行了扩展，通过增加回归点的数目来支持多边形检测；使用了多尺度预测来改善目标的尺度变化问题；另外在Loss方面也做了改进。

文本识别模型：从解码方式来划分，目前学术界主流的文本识别模型分为两类: CTC和Attention。

基于CTC的代表模型是CRNN[9]，速度快，性能稳定，不过只能处理水平文本行图片(需要先经过TPS模块将曲形文本进行拉直)；
基于Attention的识别模型有两种思路，第一种是先通过STN[10]进行矫正，然后送入1D Attention的识别模型进行端到端训练，代表模型是ASTER[11]；另一种是抛弃STN模块，直接基于2D Attention解码完成(曲形)文本识别，比如SAR[12]、MASTER[13]和SATRN[14]。最近学术界流行的基于多模态的文本识别模型如ABINet[15]、VisionLAN[16]等，其实可以看作是2D Attention模型的延伸。

下面是经典的CRNN模型的网络结构：

CRNN模型由三部分组成: 卷积层、循环层和转录层。卷积层负责提取图像特征；循环层通过BLSTM进行序列建模，进一步改善特征表征；最后是线性分类层，并通过CTC解码得到最终的预测结果。

总结下来，合合信息技术团队认为多模型级联是较为成熟的印章识别方案。其优点是各个环节可供选择的模型较为丰富，同时将检测与识别模块进行解偶，使其各自的训练互不影响。其缺点主要是级联系统的误差累积问题。

印章端到端检测识别（End2End）

上一节的级联系统中，检测和识别模型单独训练，一方面会造成整个识别系统的次优化效果，另一方面错失了检测和识别head共享主干网络图像特征的机会。

近年来，学术界一直在致力于提出端到端的文本检测识别系统，通过检测和识别头共享主干网络，能有效降低系统的复杂度，同时利用多任务学习进一步提升了模型的整体性能。

印章端到端检测识别模型流程如下所示：

近两年来，不少支持曲形文本识别的端到端模型被提出，下面以ABCNet[17]和Mask TextSpotterv3[18]为例进行简要介绍。

ABCNet网络结构和贝塞尔曲线拟合示意图如下所示：

ABCNet的主要亮点在于引入了贝塞尔曲线用于建模曲形文本边界框，如上图所示，通过三阶贝塞尔曲线(四个控制点)可以灵活地拟合出各种曲线。

网络结构方面，ABCNet由检测模块 + RoI_Transform + 识别模块构成，类似于早期的端到端模型FOTS[19]，只是检测模块的回归目标变成了贝塞尔曲线的控制点，以及RoI_Transform部分换成了BezierAlign。

Mask TextSpotterv3网络结构如下图所示：

该模型也是由检测模块 + RoI_Transform + 识别模块构成，但检测模块换成了分割模型，和基于回归的检测模型相比，分割模型能灵活地建模任意形状的文本，同时对文本长度不敏感；RoI_Transform部分直接使用了RoIAlign，利用水平外接框，裁剪出每个RoI文本块，同时对非前景区域进行了zero masking，防止背景干扰；与RoI_Transform配套，识别模块使用了基于attention的识别器。

总结下来，合合信息技术团队认为端到端检测识别算法有如下优点：

检测和识别模块进行端到端训练，改善了级联系统的误差累积问题，性能更好
通过共享主干网络，端到端检测识别模型的速度更快
维护具有相同依赖的统一框架，节省了大量的工程工作

与此同时，印章端到端检测识别算法也存在如下缺点：

检测和识别任务所需的训练样本的量级不一样(识别任务需要更多的训练数据)，因此对训练数据集的要求更高。

印章序列预测方案（Image2Sequence）

不管是级联模型，还是端到端的检测识别模型，在进行方章识别时都会遇到多方向文本的难题，如下图所示：

真实方章图片中，文本阅读方向可能是从左到右，也可能是从右到左；可能是横排文本，也可能是竖排文本。文本检测模型仅依靠视觉信息，很容易将横排文本检测成竖排文本，同时不同的文本行还需要考虑如何拼接成正确语义顺序的完整字符串。

印章序列预测方案直接抛弃了检测模块：输入经过裁剪的印章图片，模型输出最终的字符串序列，该字符串包含了印章中所有感兴趣文本行：

理论上，序列预测方案可以同时处理所有类型的印章。如果想区分不同的字符串，可在不同字符串之间可插入某个特殊符号(比如'#')，如下图所示：

只需要人为规定印章中不同字符串之间的固定阅读顺序，构造相应的ground truth字符串标签，剩下的就交给模型自己去学习了。针对方章中字符串阅读顺序不固定的问题，本方案可以大大地简化处理流程。

img2seq模型选型没有特别要求，考虑到印章中文字的2D空间布局，可以使用一个基于2D Attention的文本识别模型来完成img2seq任务。为了让img2seq模型能更好地学习全局的上下文特征，推荐使用基于transformer encoder/decoder的识别模型，比如MASTER[12]和SATRN[13]，借助其强大的self-attention机制，img2seq模型能获取全局的感受野，以及在解码阶段更好地进行关系建模。

下面以MASTER为例对img2seq模型进行简单介绍，其网络结构如下图所示：

该模型是一个典型的encoder-decoder架构，其中encoder部分是一个定制的，拥有全局感受野的CNN网络，输出一个8倍图的feature map，decoder部分则采用了标准的transformer decoder。同时论文中还使用了memory cache的技术对解码部分进行加速。

总结下来，合合信息技术团队认为img2seq模型具备以下的优缺点：

其优点是可以使用单个模型解决不同类型印章的识别问题。部署和维护都相当简单。

其缺点是模型容易过拟合，需要大量的训练数据，这一点可以通过数据合成的方案进行缓解。另外，img2seq模型不能提供每个文本行的位置信息。

感兴趣的小伙伴可以下载体验：

TextinMobile支持Android和iOS平台，Android最低支持4.4，iOS最低支持9

Android下载渠道：小米和华为应用商店；

iOS下载渠道：AppStore应用商店。

下载链接：TextIn - MobileSDK

参考文献

Bookstein, Fred L. "Principal warps: Thin-plate splines and the decomposition of deformations." IEEE Transactions on pattern analysis and machine intelligence 11.6 (1989): 567-585.
He, Kaiming, et al. "Mask r-cnn." Proceedings of the IEEE international conference on computer vision. 2017.
Li, XiaoQian, et al. "Learning to predict more accurate text instances for scene text detection." Neurocomputing 449 (2021): 455-463.
Wang, Fangfang, et al. "Textray: Contour-based geometric modeling for arbitrary-shaped scene text detection." Proceedings of the 28th ACM International Conference on Multimedia. 2020.
Wang, Wenhai, et al. "Shape robust text detection with progressive scale expansion network." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019.
Baek, Youngmin, et al. "Character region awareness for text detection." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019.
Liao, Minghui, et al. "Real-time scene text detection with differentiable binarization." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 34. No. 07. 2020.
Zhou, Xinyu, et al. "East: an efficient and accurate scene text detector." Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. 2017.
Shi, Baoguang, Xiang Bai, and Cong Yao. "An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition." IEEE transactions on pattern analysis and machine intelligence 39.11 (2016): 2298-2304.
Jaderberg, Max, Karen Simonyan, and Andrew Zisserman. "Spatial transformer networks." Advances in neural information processing systems 28 (2015).
Shi, Baoguang, et al. "Aster: An attentional scene text recognizer with flexible rectification." IEEE transactions on pattern analysis and machine intelligence 41.9 (2018): 2035-2048.
Li, Hui, et al. "Show, attend and read: A simple and strong baseline for irregular text recognition." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 33. No. 01. 2019.
Lu, Ning, et al. "Master: Multi-aspect non-local network for scene text recognition." Pattern Recognition 117 (2021): 107980.
Lee, Junyeop, et al. "On recognizing texts of arbitrary shapes with 2D self-attention." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 2020.
Fang, Shancheng, et al. "Read like humans: autonomous, bidirectional and iterative language modeling for scene text recognition." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.
Wang, Yuxin, et al. "From two to one: A new scene text recognizer with visual language modeling network." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2021.
Liu, Yuliang, et al. "Abcnet: Real-time scene text spotting with adaptive bezier-curve network." proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020.
Liao, Minghui, et al. "Mask textspotter v3: Segmentation proposal network for robust scene text spotting." European Conference on Computer Vision. Springer, Cham, 2020.
Liu, Xuebo, et al. "Fots: Fast oriented text spotting with a unified network." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.

阿里通义千问Qwen3深夜升级：架构革新+性能碾压俊哥V AI AI新闻热点由AI辅助创作 AI 人工智能
（以下借助DeepSeek-R1&Grok3辅助整理）北京时间2025年7月22日凌晨，阿里云通义千问团队发布了Qwen3旗舰模型的最新更新——Qwen3-235B-A22B-Instruct-2507-FP8。这一更新不仅在性能上实现了突破，还标志着开源大模型技术架构的重大进化。本报告基于官方发布信息、社区反馈以及相关分析，全面解读该更新的技术细节、性能表现、社区反应及未来展望。一、技术架构与战
3种经验测试方法 Nbq01 测试用例
1.错误推测法：基于经验的测试技术之错误推测法。也称为错误猜测法，就是根据经验猜想，已有的缺陷，测试经验和失败数据等可能有什么问题并依此设置测试用例。2.异常分析法基于经验测试技术之异常分析法。系统异常分析法就是针对系统有可能存在的异常操作，软硬件缺陷引起的故障进行分析，依此设计测试用例。主要针对系统的容错能力，故障恢复能力进行测试。比如华为，红米等。3.随机测试基于经验测试技术之随机测试。随机测
没有 Mac，如何上架 iOS App？跨平台团队的全流程实践指南程序员不说人话 ios 小程序 uni-app iphone android webview https
在许多以Flutter、ReactNative等技术栈开发的项目中，经常面临一个现实问题：团队缺少足够的Mac设备，可iOS上架流程却被Mac严重绑架。今天我们就来聊聊“没有Mac，如何顺利上架iOSApp？”，结合我们在多个项目中积累的实战经验，分享一整套可复用的跨平台上架方案，让Windows、Linux开发者也能协作完成iOS上架，并保持高效、稳定、安全。为什么“没有Mac”是个上架难题？i
SmartETL中数据库操作与流程解耦的设计与应用
正如ETL这个概念本身所指示的，数据库读写访问是ETL的最常用甚至是最主要的操作。现代信息系统的设计与运行基本都是围绕数据库展开的，很多应用的核心功能都是对数据库的CRUD（创建、检索、更新、删除）操作。SmartETL框架设计之初就考虑到了这个情况，在早期就根据团队的技术栈，实现了对MongoDB、MySQL、ElasticSearch、ClickHouse等数据库的Extract操作（即Loa
南京正规亲子鉴定费用标准大全(附2024年最新价格一览表）中量国鉴科普
在南京想做一次亲子鉴定需要多少钱，在南京，想要进行亲子鉴定的费用并非一成不变，它受到多种因素的影响，包括但不限于鉴定机构的资质、所采用的鉴定技术、鉴定的紧急程度以及是否需要加急报告等。一般而言，南京地区的亲子鉴定费用会在一个相对合理的区间内浮动。对于常规的亲子鉴定服务，包括血液样本或口腔拭子采集，并进行DNA比对分析，其费用大致在数千元至一万元之间。这个价格区间已经包含了基本的鉴定流程、实验室分析
IPv6的创新与演进：从IP地址耗尽到下一代网络协议
IPv6的创新与演进：从IP地址耗尽到下一代网络协议背景简介随着计算机网络技术的飞速发展，互联网连接的设备数量呈指数级增长。在1984年，主机数量首次突破1000台大关，此时使用的IPv4协议凭借32位地址空间，还能应对网络的需求。然而，随着互联网的普及，越来越多的设备接入网络，IP地址耗尽成为了一个迫在眉睫的问题。为了解决这一危机，业界开始寻求新的解决方案，最终促成了IPv6（下一代互联网协议）
什么是GPT-4T？亿只小灿灿人工智能 GPT-4T
1.引言：GPT-4T概述GPT-4T是OpenAI开发的新一代多模态大型语言模型，在GPT-4的基础上增强了对表格数据、数学表达式和代码的处理能力。其核心创新在于Transformer架构的优化，使模型能够更高效地处理结构化数据与文本的融合任务。本文将深入探讨GPT-4T的技术原理、应用场景及代码实现。2.GPT-4T核心技术解析2.1多模态输入处理GPT-4T支持三种主要输入模态：自然语言文本
【由泥巴匠到教授】随笔第53篇技校任教泥巴匠赵仁
技校任教1980年的一天，也就是在没有去上海和北京考察之前，天气特别晴朗。奎生到机械队的技术办公室里把我叫出来。把我领到办公室南边到一个空旷的场子里。这个场子很奇怪，在信阳市遍地都是开发商的足迹的年代，这块空地已经空了40多年了，到现在还是个空旷的场地。奎生对我说，李国斌支书可能在这几天里会找你谈个事情，你一定要答应他。我说，李支书他是我的长辈，特别是在70年代初，咱们一施工队出现反革命匿名信案件
2021-09-12 姗姗_52f9
《对来访者对咨询师真的重要起来》刘姗姗中原焦点团队坚持分享第1504天第167次咨询约练观察员不管是心理咨询还是心理治疗，终究是围绕“人”进行工作的，与来访者建立良好的关系，不是简单几句空话就能成立的，咨询师需要展现出人情味，真正地与来访者站在一起。一个懂很多技术的咨询师，并不一定能切实地帮到来访者。如果咨询师永远与对面的人保持距离，能够完全地隔离自己的情绪感受，不受来访者的分毫影响，我觉得这不叫
专属私有云满足密评要求啥意思？密评是什么？为什么专有云需要进行密评？到底那些系统需要密评？文章永久免费只为良心数据库
“专属私有云满足密评要求”指该私有云平台的设计、技术实现及运维管理，全面符合国家《信息安全技术信息系统密码应用基本要求》（GB/T39786-2021）等法规的密码安全标准，通过权威机构评测（如等保三级、密评三级），确保数据全链路安全可控。以下是具体解析：一、密评的核心要求与专属私有云的适配性密评（商用密码应用安全性评估）是国家密码管理局对信息系统密码应用合规性的强制性检测，重点评估以下方面：密码
推荐一个免费高速图床imgos.cn 爱睡觉的猪猪网络
imgos.cn图床推荐：重新定义高效图片托管体验在数字化内容创作中，图片管理的高效性直接影响创作体验。作为深耕行业多年的技术团队，我们推出的imgos.cn图床，以极致的稳定性、便捷性和功能性，成为内容创作的最佳拍档。以下从核心优势、场景适配、用户权益等维度展开解析，助您快速了解为何imgos.cn值得成为首选图床。一、核心优势：重新定义图片托管体验1.极速稳定，全球畅享CDN加速网络：采用分布
【软考速通笔记】系统架构设计师⑱——大数据架构设计理论与实践小康师兄系统架构设计师笔记系统架构大数据 Lanbda Kappa 数据湖批处理
文章目录一、前言二、传统数据库遇到的问题2.1问题的根源2.2传统解决方法三、大数据基础3.1大数据处理技术3.2大数据利用过程3.3大数据处理系统面临的挑战3.4大数据具有的属性和特征四、Lanbda架构4.1批处理层4.2加速层4.3服务层五、Kappa架构5.1实时层5.2服务层六、Lambda和Kappa对比七、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统架构设计师——导读关注【小
Here-Document的`＜＜` 与 `＜＜-` 与 `＜＜＜` 多解说笔记250722 kfepiza #Linux #控制台命令行 Shell bash cmd 等笔记 linux bash
Here-Document的poem.txt静夜思床前明月光疑是地上霜FORMATTED#2.空格敏感的配置catconfig.ymlindentation:level:4#必须4空格SPACE何时用tabs.txt重要制表符:→这里Tab会被保留但行首Tab会被移除TABS#2.空格缩进的环境#（如Python脚本）技术原理图解HereDocumentquery.sqlSELECT*FROM${
如何选择数据库？从真实案例看 PostgreSQL 与 MySQL 的优劣权衡
关系型数据库是几乎所有互联网应用的基础。在众多开源选项中，PostgreSQL和MySQL是最常被拿来对比的一对“老对手”。虽然它们都讲SQL，但在设计哲学、性能表现和功能特性上差异明显。本篇文章结合了包括Uber在内的实际案例、AI辅助建模的开发经验，并推荐一些实际工具，帮助开发者更清晰地做出技术选型。为什么数据库选型至关重要？数据库并不是“越强越好”，关键在于是否匹配你项目的业务模型、数据访问
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
从技术原理到应用场景：优秘AI数字人如何重构虚拟交互逻辑
在数字化浪潮的推动下，虚拟交互已经成为我们生活中不可或缺的一部分。无论是与智能音箱对话、通过虚拟助手处理日常事务，还是在元宇宙中与虚拟角色互动，人类对更自然、更高效的交互体验的需求日益增长。然而，现有的交互方式仍然存在诸多痛点：效率低下、理解能力有限、情感表达缺失……如何突破这些技术瓶颈？优秘AI数字人凭借其领先的技术和创新的应用场景，正在重构虚拟交互的逻辑。本文将从技术原理到应用场景，全面解析优
普通人想利用AI变现，这5个赛道不能错过！浮沉导师
随着人工智能技术的迅猛发展，越来越多的普通人开始关注如何利用AI实现变现。AI不仅改变了我们的工作方式，也创造了众多赚钱的机会。本文将介绍五个值得关注的AI赛道，帮助你抓住这些机会，实现收入增长。【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。应用市场下载【高省
Python爬虫教程：抓取地方政府网站的公开文件与政策信息 Python爬虫项目 python 爬虫开发语言数据分析 mysql
1.引言在信息化时代，政府网站已成为信息公开的重要渠道。各级地方政府网站上发布的政策、公告和公开文件，通常包含了政府决策、法律法规等关键信息。爬取这些公开数据，可以为研究人员、政策分析师、企业决策者等提供有价值的数据支持。本文将通过Python爬虫技术，展示如何抓取地方政府网站上的公开文件、政策等信息。我们将使用最新的爬虫技术，如requests、BeautifulSoup、Selenium等工具
AI人工智能 Agent：金融投资中智能体的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：金融投资中智能体的应用1.背景介绍在金融投资领域，人工智能（AI）技术的应用已经成为一种趋势。随着数据量的爆炸性增长和计算能力的提升，AI技术在金融市场中的应用变得越来越广泛和深入。智能体（Agent）作为AI技术的重要组成部分，能够在金融投资中发挥重要作用。智能体可以通过学习和适应市场环境，自动执行交易策略，优化投资组合，甚至预测市场趋势。2.核心概念与联系2.1智能体（
AES加密算法简要介绍 ° 安如少年初如梦662 Java学习记录后端前端
前言项目中需要在接口中添加加密，简单了解关于AES的有关知识，低质低创见谅。什么是AESAES（AdvancedEncryptionStandard，高级加密标准）是一种对称加密算法，被广泛应用于数据加密领域。它是由美国国家标准与技术研究院（NIST）于2001年发布，作为一种公开标准，用于保护电子数据的安全。值得一提的是微信小程序的加密传输就是用这个加密算法基本原理和加解密过程由于站内有很详细，
59、代码漂移与突变：技术与社会的交织 potato 代码漂移：数字时代的批判性思考代码漂移代码突变技术变革
代码漂移与突变：技术与社会的交织1.引言在当今快速发展的数字时代，技术的进步不仅改变了我们的生活方式，还深刻影响了社会结构和文化形态。代码漂移（CodeDrift）作为一种技术和社会现象，揭示了数字世界中随机性和不可预测的变化。本文将探讨代码漂移与突变之间的关系，分析其对技术和社会的影响，并通过具体案例研究，展示代码突变如何在实际应用中产生重大变化。2.代码漂移的定义代码漂移是指在软件开发和数字文
诗意与技术交织的奇妙世界酒城译痴无心剑酒城译痴诗词乐园无心剑技术诗意
诗意与技术交织的奇妙世界在CSDN的浩瀚星空中，有这样一座独特的岛屿，它属于酒城译痴无心剑。这是一个充满诗意与智慧的世界，是无心剑用文字精心构筑的精神家园。无心剑是酒城泸州人，毕业于南京大学，基础数学专业，拥有国家三级笔译证书。他在高职院校任教，讲授数学与编程课程，却在诗词翻译的道路上一往情深。过去二十余年，他翻译了两三千首诗词，形成了独特的译诗风格。他的部分译作在《新东方英语》、《九月诗刊》、《
对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作 AI科技大本营人工智能
责编|王启隆出品|CSDN（ID：CSDNnews）投稿或寻求报道|[email protected]科技巨擘、谷歌前CEOEricSchmidt最近做客PeterDiamandis的Moonshots播客，与主持人PeterDiamandis及DaveLondon展开了一场关于人工智能未来的深度对话。全世界都在为AI的飞速发展感到兴奋又焦虑时，这位曾经执掌谷歌帝国长达十年、亲眼见证并推动了这场技术
AI周报：技术面试卷出新高度，Agent落地开启“工具觉醒”时代哪小吒圈子人工智能语言模型
一句话暴论：当面试官要求手搓FP16精度时，真正的考题是“你能否在硅基文明觉醒前跟上进化速度”。一、面试地狱难度实录（开发者生存指南）百度二面手搓FP16精度：考的不是浮点数，而是对硬件底层的敬畏（原文）腾讯夺命11连问：混元大模型面试暴露行业真相——懂原理已不够，得会调参、训推、修故障的“全栈炼丹师”（解析)NVIDIA四轮拷打实录：GPU厂面试竟考Attention优化！LightingAtt
不想打工日收入超1000元，这两个生意小本经营，在小县城也能开展氧惠好项目
当然，那些拥有学历或技术才能的人通常会选择在大城市寻求发展，其中一些人能够在大城市中实现年薪数十万甚至百万。然而，对于每个人而言，对生活的追求是多样的，特别是对于那些普通人来说，他们可能没有高学历或特殊技能，所以对于收入的期望并不高，只希望有一份比打工轻松且收入略高的工作就足够了。那么在小城市，尤其是一些小县城中，现在还有没有适合我们普通人的赚钱商机呢？答案是肯定的，但这些商机通常不属于高收入行业
Docker原理 Namespace
Docker是一个开源的容器化平台，使用了多种Linux内核特性来实现隔离和资源管理。其中，Namespace（命名空间）是Docker实现进程隔离的核心技术之一。Namespace提供了对操作系统资源的视图隔离，使得容器内的进程以为它们独占了系统资源。本文将详细介绍Docker的Namespace机制。一、Namespace概述Namespace是Linux内核的一项关键技术，用于隔离不同进程的
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
Netty技术全解析：MessageToMessageDecoder类深度解析码到三十五 netty解析 java go 微服务
❃博主首页：「码到三十五」，同名公众号:「码到三十五」，wx号:「liwu0213」☠博主专栏：♝博主的话：搬的每块砖，皆为峰峦之基；公众号搜索「码到三十五」关注这个爱发技术干货的coder，一起筑基在Netty这个高性能的网络编程框架中，MessageToMessageDecoder类是一个关键的组件，它主要用于处理基于消息的解码。与直接处理字节流的解码器不同，MessageToMessageD
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势

点击领取AI产品100元体验金，助力开发者高效工作解决文档难题：

总结

引言

常用印章

技术难点

印章识别主流方案

印章文本检测+文本矫正(optional)+文本识别

印章端到端检测识别（End2End）

印章序列预测方案（Image2Sequence）

参考文献

你可能感兴趣的:(【技术新趋势】,人工智能,ocr,图像处理)