fiersies

CVPR 2018 | 旷视科技Face++新方法——通过角点定位和区域分割检测场景文本

全球计算机视觉顶会 CVPR 2018 （Conference on Computer Vision and Pattern Recognition，即IEEE国际计算机视觉与模式识别会议）将于6月18日至22日在美国盐湖城举行。作为大会钻石赞助商，旷视科技Face++研究院也将在孙剑博士的带领下重磅出席此次盛会。而在盛会召开之前，旷视将针对 CVPR 2018 收录论文集中进行系列解读。

论文名称：Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation

论文链接：https://arxiv.org/abs/1802.08948

导语

在机器之眼的检测矩阵中，自然场景文本是一类不可避及的重要对象，且有外景、视频、网页、字幕、截图等多种表现形式。旷视科技Face++通过吸取物体检测与语义分割的各自优势，并作创新性整合，突破性地提出了一种新型文本检测器，把检测精度推进到全新高度。这种底层检测技术迭代升级的影响是普适性的，意味着绝大多数与文本识别相关的实际应用都可得到不同程度的优化和完善，促进文本检测技术在直播、电商、论坛等 UGC 型内容平台网站，或者弹幕、评论、群聊、昵称等视频网站与社交 APP 中的应用；进一步提升产品和图像中关于文本的搜索检索能力，促进智能零售、无人超市等产业的发展和普及，甚至是促进自动驾驶技术的进步。由此可见，旷视科技推出的新型文本检测技术不仅有助于帮助客户走出海量数据的困境，制定个性化策略，高效过滤多类垃圾文字及敏感词，消除文本隐患，进而营造智能、安全、文明的社会环境，还可以推动新零售、无人超市、自动驾驶的进步发展。

设计思想

最近，由于实际应用需求不断增长，从现实场景图像中提取文本信息变得日益流行。场景文本检测——一种自然图像文本的定位技术——在各种文本阅读系统中发挥着不可或缺的作用。

由于内外两种因素，场景文本检测挑战重重。外部因素是指噪音、模糊、遮挡等外在环境，它们同样是困扰一般物体检测的主要根源。内部因素来自场景文本的属性。相较于一般物体检测，场景文本检测更为复杂，因为：1）自然场景中文本可以是任意方向的，因此需要检测的边界框通常为旋转的矩形或四边形；2）场景文本边界框的长宽比变化很大，且通常会存在极端的长宽比；3）场景文本的粒度多样，有字符、单词或者文本行等多种形式，算法在定位边界框时会难以判定文本实例。

图 1：上行和下行自左至右依次是已预测的左上、右上、右下、左下角点和位置敏感图。

过去几年中，场景文本检测获得大量研究，加之一般物体检测和语义分割的推动，场景文本检测近期成果显著，演化出两类主流的检测器。第一类基于一般物体检测器 SSD、YOLO、DenseBox，可以直接预测候选边界框；第二类基于语义分割，可以生成分割图，通过后处理给出最终的文本框。

本文结合了上述两类方法的思想，并加以创新，其提出主要基于下面两个发现：1）我们可以通过矩形的角点（corner point，左上，右上，右下，左下，如图 1 所示）来确定一个矩形，而不用考虑其大小、长宽比或者方向；2）文本区域分割图可以提供有效的文本定位信息，位置敏感（position-sensitive）的文本区域分割图（图 1）可以提供有效的文本实例信息。因此，本文首先直接检测文本的角点而不是回归文本框。另外，本文预测位置敏感的的分割图而不是文本/非文本图。最后，本文通过采样和组合已检测的角点生成候选边界框，并根据分割信息消除不合理的边界框。本文提出方法的 pipeline 如图 2 所示。

图 2：本文方法概览。给定一张图像，网络借助角点检测和位置敏感的分割输出角点和分割图；然后通过采样和组合角点生成候选框；最后，这些候选框通过分割图进行评分，并由 NMS 抑制冗余的候选框。

本文方法的主要亮点有：1）由于通过采样和组合角点的方式来检测场景文本，该方法可以处理任意方向的文本；2）由于检测角点而不是文本边界框，该方法可以自然而然地避免长宽比大幅变化的问题；3）通过位置敏感的分割，该方法可以很好地分割文本实例，而不管其是字符、单词或者文本行；4）在该方法中，候选框的边界由角点决定。相较于基于 anchor 或者文本区域回归文本边界框，该方法生成的边界框更精确，特别是对于长文本。

这一方法的有效性在水平文本、多方向文本、多方向长文本以及多语种文本的公开数据集上得到验证，结果证明了它在精度和速度上的优势。尤其是，该方法的 F-Measures 在 ICDAR2015、MSRA-TD500 和 MLT 上分别是 84.3%、81.5% 和 72.4%，显著优于先前最佳方法。另外，该方法在效率方面同样具有竞争优势，在输入图片大小为 512x512 情况下，每秒可处理超过 10.4 张图像。

网络架构

本文方法是一个全卷积网络，可实现特征提取、角点检测和位置敏感的文本区域分割，其网络架构如图 3 所示。给定一张图像，则网络给出候选角点和分割图。

图 3：该网络包含 3 部分：Backbone、角点检测器和位置敏感分割检测器。Backbone 沿用DSSD。角点检测器构建在多个特征层（粉色模块）之上。位置敏感分割检测器与角点检测器共享粉色模块。

特征提取

该模型的 backbone 改编自预训练的 VGG16 网络，并基于下述考量进行设计：1）场景文本的大小变化巨大，因此 backbone 必须足以应对该问题；2）自然场景中的背景非常复杂，因此特征最好包含较多的语境。鉴于 FPN/DSSD 结构在上述问题上的良好表现，本文通过 FPN/DSSD backbone 提取特征。

角点检测

本文使用一个正方形框来表示一个角点，并用 default box 来回归角点。其中，框的中心点为角点位置，框的边长为角点所属的文本框的最短边。与 SSD/DSSD 每个 default box 输出一种相应候选框的分类分值和偏移量（offset）不同，角点检测更为复杂。因为同一位置可以存在多个的角点，因此本文中 default box 对应的输出分别为 4 类角点的 4 个候选框的分类分值和偏移量。

本文以卷积的方式通过预测模块预测两个分支的分值和偏移量。对于每个单元中带有 k 个 default box 的 m × n 特征图，“分值”分支和“偏移量”分支分别为每个 default box 的每个类型的角点输出 2 个分值和 4 个偏移量。这里，在“分值”分支中 2 表示该位置是否有角点存在。总体上，“分数”分支和“偏移量”分支的输出通道是 k×q×2 和 k×q×4，其中 q 表示角点类型。 q 默认等于 4。

训练阶段则遵从 SSD 中 default box 和 groundtruth 的匹配策略。为检测不同大小的场景文本，本文在多个层特征上使用不同大小的 default box。

位置敏感分割

先前基于分割的文本检测方法通过生成分割图表征每个像素属于文本区域的概率。但是由于文本区域的重叠和文本像素的不当预测，分值图中的文本区域经常无法彼此分离。为从分割图中获得文本边界框，需要进行复杂的后处理。

受到 InstanceFCN 启发，本文使用位置敏感分割生成文本分割图。相较于先前的文本分割方法，相对位置信息被引入。具体而言，通过一个 g x g 规则网格把文本边界框 R 分成多个 bin。对于每个 bin 来说，可使用一个分割图决定该图的像素是否属于该 bin。如图 4 所示，借助位置敏感的分割图，本文可以有效地处理相近或相互重叠的文本区域。

本文在统一网络中构建位置敏感分割，利用特征 F3 , F4 , F7 , F8 , F9 等预测 g x g 张文本区域分割 map。默认 g 为 2。

图 4：位置敏感的区域分割能提供实例信息，有效地过滤掉虚警。（a）输入图像；（b）已预测文本 proposal 和分割图。（c）评分。红框分别是对应于单词（有效）、相近单词和相互覆盖的单词（无效）的文本 proposal。文本框 proposal 的评分由旋转的位置敏感 ROI 平均池化层（算法1）计算。

训练与推理

对于输入训练样本，本文首先把 groundtruth 中的每个文本框（任意四边形）转化为一个能覆盖这个文本框且面积最小的矩形，并确定 4 个角点的相对位置。转化后的矩形相对位置应遵循以下原则：1）左上、左下角点的 x 轴必须分别小于右上、右下角点的 x 轴；2）左上、右上角点的 y 轴必须分别小于左下、右下角点的 y 轴。基于角点的相对位置，本文可以生成角点和位置敏感的分割的 groundtruth，如图 5。

图 5：为角点检测和位置敏感分割生成标签。 (a) 重新定义角点并用正方形表示（白色，红色，绿色，蓝色框），边长设置为文本边界框 R（黄框）的短边。 (b) (a) 中对应于位置敏感分割的 R 的 groundtruth。

在推理阶段，会产生很多包含预测位置、短边长度和置信度信息的角点。高分值角点（默认值大于0.5）被保留。NMS 之后，根据相对位置信息组成 4 个角点集。采样和分组角点之后会产生大量的候选边界框。本文使用位置敏感的区域分割对候选文本框打分。处理过程如图 6 所示。

图 6：评分过程概览。 (a) 中的黄框是候选框。(b) 是已预测分割图。本文通过集合分割图生成候选框的实例分段(c)。分值通过平均实例分段区域来计算。

为处理旋转的文本边界框，本文提出旋转的位置敏感 ROI 平均池化层。具体地，对于一个旋转的边界框，本文首先把框分成 g x g 个 bin，对于每一个 bin，计算其对应预图 bin区域内所有像素的均值，最后对所有 bin 的均值求平均。具体过程如算法 1 所示。

算法 1：旋转的位置敏感 ROI 平均池化层。

低评分的候选框将被过滤掉。本文默认阈值为 0.6。

实验结果

为验证本文方法的有效性，作者在 5 个数据集上开展实验：ICDAR2015，ICDAR2013，MSRA-TD500，MLT，COCO-Text，分别检测了多方向文本，水平文本，多方向长文本，多语种文本以及泛化能力。

多方向文本

本文在 ICDAR2015 数据上测试了该模型在任意方向文本检测上的性能，并与其他当前最优方法进行对比，所有结果如表 2 所示。该方法大幅超越先前方法。当在单尺度上测试时，该方法的 F-measure 为 80.7%，优于其他所有方法；当在多尺度上测试时，该方法的 F-measure 为 84.3%，优于当前最佳方法 3.3%。

表 2：ICDAR2015 结果。∗ 表示多尺度，† 表示模型的基础网络不是 VGG16。

水平文本

本文在 ICDAR2013 数据上测试了该模型在水平文本检测上的性能，结果如表 3 所示。当在单尺度上测试时，该方法的 F-measure 为 85.8%，略低于最高值。另外，该方法每秒可处理 10.4 张图像，快于绝大多数方法。当在多尺度上测试时，该方法的 F-measure 为 88.0%，同样很有竞争优势。

表 3：ICDAR2013 结果。∗ 表示多尺度，† 表示模型的基础网络不是 VGG16。注意，前三行的方法是在 “ICDAR2013” 评估协议下进行的。

多方向长文本

本文在 MSRA-TD500 数据上测试了该模型在多方向长文本检测上的性能，结果如表 4 所示，其性能大幅优于先前所有方法。该方法在召回率、精确度和 F-measure 上同时取得当前最佳性能（87.6%，76.2% 和 81.5% ），并显著优于先前最佳结果（81.5% vs. 77.0% ）。这说明该方法较于其他方法更擅长检测任意方向的长文本。

表 4：MSRA-TD500 结果。† 表示模型的基础网络不是 VGG16。

多语种文本

本文在 MLT 数据上测试了该模型在多语种文本检测上的性能。如表 5 所示，该方法超越其他方法至少 3.1%。

表 5：MLT 结果。∗ 表示多尺度。

泛化能力

为评估该模型的泛化能力，本文使用在 ICDAR2015 数据集上训练得到的模型在 COCO-Text 数据集上进行测试，结果如表 6 所示。无需训练，该方法在COCO-Text 数据集上的 F-measure 为 42.5%，优于其他方法。

表 6：COCO-Text 结果。∗ 表示多尺度。

结论

本文提出一种场景文本检测器，它可以通过角点检测和位置敏感分割定位文本。作者在若干个专门的多方向文本，水平文本，多方向长文本，多语种文本公共基准上评估了该检测器，其优越的性能证实了该方法的有效性和鲁棒性。

该方法的贡献有如下 4 个方面：1）提出一种结合物体检测和分割思想的新型场景文本检测器，可以实现端到端的训练与评估；2）基于位置敏感的 ROI 池化，提出一种位置敏感的旋转 ROI 平均池化层，可以处理任意方向的 proposals；3）该方法可同时应对多种困扰先前多方向文本检测方法的难点，比如旋转、长宽比变化、非常接近的文本实例等；4）该方法在精度和效率方面同样取得了更优或更具竞争力的结果。未来，作者将会基于该方法构建一个端到端的 OCR 系统。

参考文献

[1] Zhou et al. EAST: An Efficient and Accurate Scene Text Detector. CVPR2017

[2] Fu et al .DSSD : Deconvolutional single shot detector. Arxiv

[3] Tychsen-Smith et al. Denet: Scalable realtime object detection with directed sparse sampling. ICCV2017

[4] Wang et al. Point linking network for object detection. Arxiv

[5] Dai et al. Instance-sensitive fully convolutional networks. ECCV2016

[6] Li et al. Fully convolutional instance-aware semantic segmentation. CVPR2017

发起请求并处理响应：`XHR` 与 `axios` 使用指南来啦[特殊字符]~
又又又要长脑子呐~了解到通过发起HTTP请求并在不刷新页面的情况下更新页面内容是一种常见的需求。学习使用XMLHttpRequest或axios来实现，现在进行对比两者，比较项目使用时候的优缺点，文末使用表格进行对比学习1.使用XHR实现下面是一个使用XMLHttpRequest发起GET请求并处理服务器响应的示例：html体验AI代码助手代码解读复制代码//创建一个新的XMLHttpReques
2024年最全kali无线渗透之用wps加密模式可破解wpa模式的密码12_kali wps，网络安全开发究竟该如何学习 2401_84558314 程序员 wps web安全学习
一、网安学习成长路线图网安所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、网安视频合集观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。三、精品网安学习书籍当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔
《密码爆破漏洞详解》——黑客必修的入门操作( 建议收藏 ) 2401_84573531 2024年程序员学习 python
隔壁老张:“狗剩啊,隔壁xx村的王姐家的女娃好漂亮,我想盗她qq啊,你帮我把”狗剩:“我不会呀”村里大妈:“那个狗剩啊,盗个qq号都不会,他妈妈还好意思说他是学网络安全当黑客的”密码爆破漏洞详解密码爆破介绍密码爆破使用场景密码爆破利用思路防范密码爆破密码的复杂性密码加密登录逻辑验证码登录次数限制密码爆破介绍密码爆破又叫暴力猜解,简单来说就是将密码逐个尝试,直到找出真正的密码为止,本质上是利用了穷举
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
MySQL分布式ID冲突详解：场景、原因与解决方案码不停蹄的玄黓 mysql 分布式数据库 ID冲突
引言在分布式系统开发中，你是否遇到过这样的崩溃时刻？——明明每个数据库实例的自增ID都从1开始，插入数据时却提示“Duplicateentry‘100’forkey‘PRIMARY’”；或者分库分表后，不同库里的订单ID竟然重复，业务合并时直接报错……这些问题的核心，都是分布式ID冲突。今天咱们就来扒一扒MySQL分布式ID冲突的常见场景、底层原因，以及对应的解决方案，帮你彻底避开这些坑！一、为什
MongoDB Rust驱动代码架构深度解析倪俪珍Phineas
MongoDBRust驱动代码架构深度解析mongo-rust-driverTheofficialMongoDBRustDriver项目地址:https://gitcode.com/gh_mirrors/mo/mongo-rust-driver前言本文将对MongoDB官方Rust驱动(mongo-rust-driver)的核心架构进行深入解析，帮助开发者理解其设计哲学和实现细节。我们将从客户端构
如何在YashanDB中管理数据模型变更数据库
在现代企业中，数据模型的变更管理扮演着关键角色。无论是扩展现有业务，还是应对新的需求，业务模型的改变往往需要相应的数据模型更新。如何有效地管理这些变更，确保数据的完整性、一致性及应用的高可用性，成为了数据架构师和开发者必须面对的重要问题。本文将详细探讨在YashanDB中管理数据模型变更的策略和方法，旨在提升对YashanDB数据库技术的理解及应用能力。数据模型变更管理的关键要素版本控制与变更日志
如何在YashanDB数据库中使用JSON数据类型？数据库
随着海量结构化与半结构化数据的快速增长，关系型数据库面临性能瓶颈和数据一致性的挑战。JSON作为一种灵活的半结构化数据格式，在多领域数据交换和存储中广泛应用。YashanDB作为支持多种存储结构和高性能事务处理的数据库产品，提供了对JSON数据类型的支持，以满足现代复杂业务对半结构化数据处理的需求。本文旨在基于YashanDB体系架构及存储引擎特性，深入解析JSON数据类型的技术原理与实现方式，为
如何在YashanDB数据库中实现数据查询优化数据库
在现代信息技术环境中，数据量的快速增长使得数据库的性能优化成为重要课题。如何提升查询速度，降低资源消耗，成为了数据库管理人员和开发者必须面对的挑战。有效的数据查询优化不仅能提高响应时间，还能显著提升用户体验与系统效率。在YashanDB数据库中，优化数据查询需从多个技术角度进行综合考量与实际应用。利用索引技术优化查询索引是提升数据库查询性能的常用手段。在YashanDB中，主要支持BTree索引、
如何在YashanDB数据库中实现数据模型的简化数据库
在现代数据库技术领域，数据模型的复杂性经常导致性能瓶颈和维护困惑。随着数据规模的增长和业务诉求的增加，复杂的数据结构、冗余的存储和不必要的关联关系都会影响整体数据库的性能和可维护性。特别是在面对动态变化的业务需求时，灵活性和扩展性成为关键因素。YashanDB提供了一系列功能强大的工具和机制，能够有效简化数据模型，提升数据库性能，并增强数据操作的灵活性。本文章旨在为数据库开发者和架构师提供技术洞见
如何在YashanDB数据库中实现复杂事务管理数据库
在现代数据库管理系统中，事务管理是一项关键功能。复杂的事务管理可以确保多条SQL操作的原子性、一致性、隔离性和持久性（ACID特性），减少数据的不一致和错误。尤其在高并发场景中，事务管理的机制与实现至关重要。因此，构建高效的事务管理系统，对于提升数据库的性能及应用程序的可靠性具有深远影响。YashanDB的事务特性YashanDB数据库支持全面的事务管理功能，通过多版本并发控制（MVCC）、事务隔
深入解析BEM架构：架构级全局样式管理方案 neon1204 前端方案分析和实践架构前端 css webpack
深入解析BEM架构：架构级全局样式管理方案在前端开发领域，CSS架构一直是影响项目可维护性和可扩展性的关键因素。随着SPA应用的普及，传统CSS管理方式的缺陷在开发中暴露出明显的问题：样式冲突、选择器权重失控、命名污染等，从代码质量和开发效率角度出发可以借鉴一些优秀的案例。各种组件库（element、antd、vant…）使用多了能发现它们的样式就是采取的BEM（Block,Element,Mod
如何在YashanDB数据库中管理用户权限数据库
在数据库管理系统中，用户权限的管理是保障数据安全和系统稳定运行的关键环节。合理的权限控制能有效防止未经授权的访问和误操作，同时满足业务需求的灵活性。对于YashanDB数据库，充分理解其权限体系与管理机制，有助于构建安全、稳定且高效的数据库应用环境。本文将深入解析YashanDB中用户权限管理的技术原理、实现功能和最佳实践。YashanDB的用户与角色机制YashanDB管理权限的核心实体为“用户
如何在YashanDB数据库中进行高效的JSON数据存储数据库
随着业务对非结构化和半结构化数据存储需求的增加，JSON数据类型逐渐成为数据库支持的关键特性。然而，JSON数据的高效存储与访问面临性能瓶颈、一致性保障及空间利用率等挑战。YashanDB作为现代企业级数据库，需提供有效的机制解决上述难题，从而满足实时查询、高并发访问及数据一致性的需求。本文针对YashanDB数据库的体系架构、存储引擎及索引机制，深入分析如何实现高效的JSON数据存储与访问，旨在
如何在YashanDB数据库中高效处理海量数据数据库
在现代数据库技术中，海量数据的管理和处理成为了一个普遍存在的挑战。随着数据规模的不断扩大，性能瓶颈、数据一致性问题以及易用性需求等问题日益凸显。这些挑战促使企业寻求更为高效的解决方案，以支撑海量数据的存储、分析与挖掘。YashanDB作为一款专为处理海量数据而设计的数据库，凭借其高可扩展性、高并发性能和高可用性，提供了一系列技术手段以应对这些挑战。本文旨在探讨如何在YashanDB中高效地管理和处
如何有效管理YashanDB的访问控制数据库
引言在当今数字化的业务环境中，数据安全性和访问控制是数据库管理的核心问题。随着数据规模的不断扩大，以及对数据隐私和合规性的要求日益增强，如何有效管理数据库的访问权限已成为企业面临的重大挑战。YashanDB作为一个高性能的数据库管理系统，具备丰富的访问控制功能，但同时也带来了复杂的管理需求。本篇文章将深入探讨YashanDB的访问控制机制，包括用户管理、角色权限、身份认证及其他相关策略，旨在为数据
如何在YashanDB数据库中保持数据一致性与完整性数据库
在现代数据库管理系统中，确保数据的一致性与完整性是面临的主要挑战之一。这一挑战在高并发、高要求的数据操作场景中尤为突出。YashanDB作为一种高性能的分布式数据库，采用了多种技术手段以保持数据的一致性与完整性。本文将深入探讨YashanDB中实现数据一致性与完整性的核心技术原理，适用于对高并发和复杂事务有一定理解的数据库管理员（DBA）和开发人员。事务管理与ACID特性事务是数据库操作的基本单元
如何实现YashanDB中的数据冗余处理数据库
数据冗余是数据库管理中的一个重要话题，直接影响到数据的可用性与可靠性。在高并发场景下，数据冗余能够有效防止数据丢失，并提升系统的容灾能力。YashanDB作为一款高性能的数据库产品，通过灵活的结构和多种部署方式，实现了数据冗余处理。本文将详细探讨YashanDB中实现数据冗余处理的技术细节，为数据库管理员和开发人员提供理论支持和实践指导。YashanDB的数据冗余机制单机部署中的数据冗余在单机部署
如何确保YashanDB数据库的性能稳定？数据库
在当今数据量激增的背景下，数据库的性能稳定性成为企业技术架构成功的关键因素之一。数据库面临的挑战包括性能瓶颈、数据一致性问题及并发访问的影响。为了应对这些问题，YashanDB作为一种新兴的数据库管理系统，提供了先进的架构和功能，旨在为高性能和高可用性提供保障。本文将详细探讨确保YashanDB数据库性能稳定性的方法，旨在为数据库管理员、系统架构师及IT技术负责人提供实用建议，实现企业数据处理的高
如何设计基于YashanDB数据库的高效查询数据库
在当今数据驱动的业务环境中，提高数据库查询性能已经成为各类企业面临的重大挑战。随着数据量的快速增长，许多机构遭遇了性能瓶颈、数据一致性问题和查询响应延迟等一系列问题。在这样的背景下，优化数据库架构、提高查询效率迫在眉睫。本文将集中在YashanDB数据库的查询设计上，提供技术分析和操作指导，以帮助开发人员设计高效的查询策略，实现优越的性能。YashanDB的体系架构YashanDB支持多种部署形态
如何实现YashanDB数据库的负载均衡数据库
在现代应用中，数据库的性能直接影响整个系统的效率和用户体验。因此，数据库的负载均衡成为了设计和部署中不可忽视的重要环节。YashanDB是一个新兴的数据库系统，其支持多种架构和配置，适合不同的业务场景。通过合理实现YashanDB的负载均衡，可以有效提升系统的并发处理能力、降低响应时间及提高可用性。YashanDB的架构概述YashanDB支持多种部署模式，包括单机（主备）部署、分布式集群部署以及
Python多线程vs多进程：一场关于效率的“宫斗戏“，谁才是你的真命天子？
清晨的咖啡还冒着热气，你盯着监控面板上飙升的CPU使用率，键盘敲出的代码在"多线程"和"多进程"之间反复横跳——这可能是每个Python开发者都会经历的"效率抉择时刻"。当项目从"能跑就行"进化到"必须快跑"，多线程与多进程这对"欢喜冤家"就会跳出来，用各自的"十八般武艺"让你挑花眼。今天咱们就来扒开表象，从底层机制到实战案例，彻底搞懂这对CP的爱恨纠葛。一、GIL：多线程头顶的"紧箍咒"要聊多线
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
c++求同构数 *Allen* c++算法数据结构
题目描述所谓同构数是指这样的数，即它出现在它的平方数的右端。例如，5的平方是25（即5×5=25），5是25右端的数，那么5就是同构数。又如，25的平方是625（即25×25=625），同理25也是同构数。找出通过键盘输入的两个正整数N和M（0usingnamespacestd;intn,m,t,s,a[100],b[100],sum,s1,s2,k;intmain(){cin>>n>>m;for
MySQL使用POINT类型+空间索引快速过滤区域
在MySQL中使用POINT类型和空间索引来快速过滤区域数据是一种非常有效的策略，尤其是在处理地理位置信息时。POINT类型是MySQL空间数据类型之一，用来表示二维空间中的点。通过使用空间索引（例如R-tree索引），可以显著提高查询性能，尤其是在处理大量地理数据时。1.创建空间表和空间索引首先，你需要有一个包含POINT类型字段的表，并为这个字段创建空间索引。下面是一个示例：CREATETAB
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
网络安全/Web安全/渗透测试入门/信息收集 &Sinnt& 网络安全 web安全网络安全
网络安全/Web安全/渗透测试入门/信息收集本篇文章主要讲解如何进行信息收集，列举了在信息收集中常见的工具和手段。原文地址：sinblog一，whois查询WHOIS查询是一种查找域名注册信息的工具或服务。WHOIS是一个协议，允许用户查询某个域名或IP地址的域名、注册信息以及其他相关互联网的详细数据。WHOIS数据库由多个注册商提供和注册机构维护，公开提供域名注册人的信息。自己购买一个域名，配置
如何为看板产品接入实时行情 API 后端教程观点程序员web3
以下是一个基于Java的完整示例，演示如何通过WebSocket接入InfowayAPI提供的实时行情接口，并展示如加密货币BTC/USDT的实时价格更新。文末附有完整代码。步骤1：准备工作注册账号并申请免费APIKey阅读接入文档（可选）Java环境准备：JDK11+添加jakarta.websocket依赖添加fastjson2依赖（用于构造/解析JSON）步骤2：建立WebSocket连接W
MongoDB数据库备份及恢复策略详解魑魅丶小鬼
本文还有配套的精品资源，点击获取简介：MongoDB，作为流行的开源NoSQL数据库，提供灵活、高性能和易用性的特点。为了保证数据安全和业务连续性，进行有效的备份和恢复策略至关重要。本文将介绍MongoDB的备份工具和方法，包括mongodump和mongorestore命令行工具，以及更复杂的云备份解决方案。同时，将通过一个中等规模的数据集实例来详细说明备份流程，强调备份前停止写入、执行备份、检
用 AI “一句话生成代码”，用创意兑换灵码潮品：技术人的夏日狂欢季来了人工智能
在AI技术迅猛发展的2025年，我们正式推出“通义灵码编程智能体挑战季”，以“码力觉醒”为主题，打造一场融合技术探索与潮流文化的开发者盛宴。活动以体验MCP服务、Qwen3大模型及记忆功能的智能编程助手为核心，通过“小游戏开发”和“MCP场景实践”两大趣味赛道，降低AI技术门槛，让开发者轻松体验“一句话生成代码”的魔力。活动亮点抢先看：零门槛参与：新老用户均可参与，完成任务即领限量定制棒球帽！趣味
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

CVPR 2018 | 旷视科技Face++新方法——通过角点定位和区域分割检测场景文本

目录

导语

设计思想

网络架构

训练与推理

实验结果

结论

你可能感兴趣的:(CVPR 2018 | 旷视科技Face++新方法——通过角点定位和区域分割检测场景文本)