studyeboy

Towards End-to-End Unified Scene Text Detection and Layout Analysis(2022)

[PDF]
[GitHub]

摘要

场景文本检测和文档布局分析长期以来一直被视为不同图像域中的两个独立任务。在本文中，我们将它们结合在一起，介绍了统一场景文本检测和布局分析的任务。引入了第一个分层场景文本数据集以实现这一新颖的研究任务。我们还提出了一种新颖的方法，能够同时检测场景文本并以统一的方式形成文本集群。综合实验表明，我们的统一模型比多种设计良好的基线方法具有更好的性能。此外，该模型在多个场景文本检测数据集上实现了最先进的结果，而无需复杂的后处理。数据集和代码：https://github.com/google-researchdatasets/hiertext。

介绍

在自然场景和数字文档中阅读和理解文本的能力在计算机视觉的以人类为中心的应用中发挥着重要作用。虽然最先进的文本检测系统（如 [44,61]）擅长定位单个文本实体，但视觉文本理解 [2] 需要理解文本内容的语义和几何布局 [5, 7]。在当前的文献中，大多数工作都以单独的方式关注文本实体检测 [3, 18, 61] 和布局分析 [26, 58] 的单个任务，将深度学习模型的所有功能都用于特定任务的性能。我们认为，联合处理这两个密切相关的问题不仅可以产生更简单、更有效的模型，而且可以产生在所有任务中更准确的模型。此外，对于文本推理任务，例如基于文本的 VQA [4, 47] 和图像字幕 [57]，一体化、统一的文本和布局检测架构可能变得不可或缺。

文本检测和几何布局分析任务之间的划分导致了平行和独立的研究方向。文本检测器 [14,18,40,61] 通常将单词级注释（即不被空格中断的字符序列）视为唯一的监督信号。相反，几何布局分析算法 [2,26,54,58,62] 专注于数字文档，要么假设给定的单词级文本信息 [2,54,58]，要么直接预测几何结构而不推理其原子元素 [ 62]。我们问：文本实体检测和几何布局分析能不能兼顾？几何布局分析可以同时针对自然场景和数字文档吗？这些问题很重要，因为它们与现实世界的应用相关，例如用于视障人士的屏幕阅读器和基于图像的翻译。

我们的工作旨在统一文本检测和几何布局分析。我们引入了一个名为 HierText 的新图像数据集。它是第一个具有自然场景和文档中文本分层注释的数据集（图 1，顶部）。该数据集包含高质量的单词、行和段落级别的注释。 “文本行”被定义为在空间接近度上对齐的逻辑连接的单词序列。属于同一语义主题且几何连贯的文本行形成“段落”。HierText 中的图像平均每张图像超过 100 个单词，比当前最高密度的场景文本数据集 [48] 密集两倍。实验结果表明，对于独立文本检测任务，我们的数据集与其他公共数据集 [10,11,19,22,37,38,48,49,59,60] 互补。

除了 HierText，我们还提出了一个新颖的模型 Unified Detector，它可以同时检测文本实体并通过对文本实体进行分组来执行布局分析，如图 1 底部所示。统一检测器整合了一个端到端的实例分割模型，MaX-DeepLab [53]，检测任意形状的文本和多头自注意力层 [51] 以形成文本簇。所提出的模型通过单阶段简化管道实现端到端训练和推理。它消除了训练过程中复杂的标签生成过程 [3,44] 和推理过程中复杂的后处理 [33,63]。 Unified Detector 在统一文本检测和几何布局分析的任务上优于竞争基线，甚至是商业解决方案，证明了它的有效性。

除了统一任务之外，我们还使用现有的公共数据集（包括 ICDAR 2017 MLT [38]、TotalText [10]、CTW1500 [60]、MSRA-TD500 [59]）在独立场景文本检测任务上评估我们的模型，并实现最先进的结果。虽然微调是最近工作中的一种常见做法 [44, 63]，但所提出的模型是使用数据集的组合直接训练的，而无需对每个单独的目标数据集进行微调。统一检测器是第一个在文本检测任务上实现最佳性能并同时恢复重要文本布局信息的端到端模型。
总之，我们的核心贡献如下：
• 我们提出了统一文本检测和布局分析的任务，将两个已经独立研究但具有内在联系的任务结合在一起。
• 引入了具有分层文本注释的新的高质量数据集，以促进对该任务的研究。
• 我们提出了一个端到端的统一模型，它优于单独处理这两个任务的竞争性多阶段基线。
• 我们的模型没有复杂的后处理，在多个具有挑战性的公共文本检测基准上取得了最先进的结果。

分层文本数据集 (HierText)

数据采集

HierText 中的图像是从 Open Images v6 数据集 [24] 中收集的。我们使用公共商业 OCR 引擎 Google Cloud Platform Text Detection API (GCP)1 扫描 Open Images，以搜索带有文本的图像。我们过滤掉图像：a) 检测到的单词很少，b) 识别置信度低，c) 带有非英语主导文本。最后，我们从剩余图像中随机抽取一个子集来构建我们的数据集。获得了 11639 张图像，并进一步分为训练集、验证集和测试集。 HierText 图像具有更高的分辨率，其长边限制为 1600 像素，而之前基于 Open Images [22,48] 的数据集限制为 1024 像素，从而产生更清晰的文本。

我们以分层方式注释这些图像[16]。我们首先用多边形标注单词位置。清晰的单词也会被转录，无论其语言如何。多边形的左上角和方向定义了单词的阅读方向。然后将单词分组到文本行。段落首先使用多边形进行注释，然后文本行和单词根据它们的二进制掩码交集与相应的多边形相关联。
结果，我们获得了一个树形结构的注释层次结构。请注意，将单词聚类为行和将行聚类为段落的成本相对较低，因为不需要精确的像素级注释。

覆盖率检查：我们检查 HierText 与 Open Images 中的其他两个文本数据集（即 TextOCR [48] 和 Intel OCR [22]）之间的跨数据集覆盖率。我们只有 1.5% 的图像在 TextOCR 中，3.6% 在 Intel OCR 中。我们还确保我们的训练图像不在 TextOCR 和英特尔 OCR 的验证或测试集图像中，反之亦然。

数据集特征

表 1 比较了 HierText 和其他数据集的统计数据。 HierText 平均每张图片有 103.8 个单词；大约是第二密集数据集（即 TextOCR [48]）的文本密度的 3 倍。尽管 HierText 的图像比 TextOCR 少，但它包含的文字更清晰。最后，HierText 是唯一提供分层注释的数据集。图 2a 显示 HierText 表示与现有公共数据集不同的图像域。它具有很大比例的高文本密度图像。尽管英特尔 OCR [22] 拥有最多的图像数量和超过 100 个单词的图像覆盖率，但 HierText 包含的绝对数量更多：5.3K vs. 3.4K。图 2c 说明了 HierText 中文本的空间分布也更加均匀。在其他数据集中，文本往往位于图像的中心。每行和段落的字数分布如图2b所示。很大一部分行和段落有多个单词，这使得布局分析成为一个具有挑战性的问题。

总的来说，我们证明了所提出的 HierText 数据集具有独特的特征，并从其他数据集中捕获了一个未发现的域。此外，它还支持对统一文本检测和布局分析的研究。

任务和评估协议

任务： HierText 数据集有两个任务类别。第一类涉及在单词或行级别的文本实例分割。从概念上讲，字级和行级输出是可互换的，因为现代文本识别系统 [9,35,45] 对这两种类型的输入图像补丁都非常有效。对于布局分析的第二个任务，我们还通过将每个文本集群（即“段落”）视为一个对象实例，将其框架为实例分割任务，遵循之前的工作 [62]。文本行和段落的基本事实被定义为底层单词级多边形的像素级掩码的联合。

统一检测和布局分析任务的候选方法应该在单词或行级别产生文本实体检测结果，并将这些实体分组为段落。

评估：为了将这些任务评估为实例分割，我们使用最近提出的全景质量（PQ）指标 [21] 作为主要评估指标：

其中 T P、F P、F N 分别代表真阳性、假阳性和假阴性。在数学上，PQ 等于 ICDAR15 [19] 风格 F1 分数 [15] 与所有 TP 对的平均 IoU 的乘积。分割度量的动机是文本实体对丢失或多余的像素敏感，这会导致识别中丢失或意外字符。尽管最近有一些工作 [25, 30, 46] 研究了文本检测的评分，但它们并没有推广到复杂的几何实体，如文本行和段落。 PQ 度量以统一的方式处理单词、行和段落分割任务。因此，我们采用 PQ 度量来评估所有任务，因为它的简单性和普遍性。

方法

统一检测器

我们提出了一个端到端模型来执行统一的场景文本检测和布局分析。我们称之为统一检测器。它旨在生成（1）一组文本检测掩码和（2）同时对这些检测进行聚类，而无需复杂的后处理。

端到端文本检测：受端到端对象检测和全景分割 [6, 53] 的最新进展的启发，我们将文本检测表示为产生固定数量的 N 个软排他掩码 $\{\hat{m}_i\}^N_{i=1}$ 和 $N$ 个二元分类 $\{\hat{y}_i\}^N_{i=1}$ 。掩码满足 $\sum^N_{i=1} \hat{m}_i = 1^{H×W}$ 。二元分类 $\hat{y}_i$ 表示第 $i$ 个掩码是文本对象的概率。这种表示适用于任意形状的文本，并且可以准确地捕获单词和行级别的检测。

统一布局分析：统一检测器分析布局并通过生成亲和矩阵执行文本聚类： $\hat{A} ∈ [0, 1]^{N×N}$ 。该矩阵中的条目 $\hat{A}_{i,j}$ 表示由 $\hat{m}_i$ 和 $\hat{m}_j$ 表示的文本属于同一语义/段落组的概率。

推理：统一检测器的推理很简单。我们首先通过在掩码上应用 argmax 以将每个像素分配给一个文本对象来获得文本检测结果。然后，我们删除低置信度像素。结果，对于第 $i$ 个对象，最终掩码表示为：

其中 $t_m$ 是像素置信度的阈值。我们通过在二进制分类分数 $\hat{y}_i$ 上应用阈值 $t_c$ 来进一步过滤文本实例。对于布局分析推断，如果一对文本实例的亲和力得分 $\hat{A}_{i,j}$ 高于阈值，我们将其聚类，表示为 $t_A$ 。使用联合查找算法将这些连接的节点合并到集群中。

模型架构

所提出的统一检测器的架构如图 3 所示。我们的统一检测器基于最近的 Max-DeepLab [53] 端到端全景分割框架。在这个框架中，我们使用一组 N 个 D 维学习对象查询来增加输入像素。然后我们将像素和对象查询输入基于转换器的编码器 MaX-DeepLab 主干，其中像素和对象查询之间的双向通信允许模型在每个对象查询中编码文本实例。使用编码查询和像素特征，文本检测分支产生文本掩码输出， $\{\hat{m}_i\}^N_{i=1}$ 。布局分支为每对文本实例之间的关系生成亲和矩阵 $\hat{A} ∈ [0, 1]^{N×N}$ 。第三个分支产生二进制分类分数 $\{\hat{y}_i\}^N_{i=1}$ 。

主干：MaX-DeepLab [53] 主干由交替堆叠的沙漏 [39] 式 CNN 和建议的双路径转换器组成。沙漏样式 [39] CNN 应用于像素特征。它们迭代地对从粗分辨率到细分辨率的特征进行编码，因此可以产生高分辨率的特征。双路径转换器[53]允许像素特征和可学习对象查询之间的双向通信。它使像素空间内的注意力和对象查询之间的交互成为可能。这使得在像素特征中编码远程信息成为可能，并允许对象查询仅从像素中定位和检索文本对象。 MaXDeepLab 以输入的 $\frac{1}{4}$ 分辨率产生输出，即 $(\frac{H}{ 4} , \frac{W}{ 4} )$ 。我们敦促读者参考原始论文 [53] 了解全部细节。

文本检测分支：文本检测分支获取 MaX-DeepLab 主干的输出并生成文本掩码输出。两个全连接层从编码查询中产生掩码查询，表示为 $f ∈ R^{N×D}$ 。类似地，两个卷积层产生归一化的像素特征，表示为 $g ∈ R^{D×H'×W'}$ 。文本掩码预测是 $f$ 和 $g$ 的内积：

布局分支：布局分支将来自主干的编码查询作为唯一输入。为了将布局特征与文本检测特征分开，我们应用了一个额外的投影头来进行聚类嵌入投影。对于这个投影头，我们采用 3 层多头自注意力层 [51] 来获得归一化的布局特征，表示为 $h ∈ R^{N×C}$ 。我们应用布局特征的内积，然后使用温度为 $τ$ 的 sigmoid 函数来获得亲和矩阵：

文本分支：文本分支应用另一个 2 层全连接层和一个 sigmoid 函数来产生二进制分类分数 $\{\hat{y}_i\}^N_{i=1}$ 。

训练目标

统一检测器支持场景文本检测任务和布局分析任务的端到端训练。关键因素是在预测和groundtruth之间进行二分匹配，因为我们的模型会产生一组无序的输出。我们首先描述了检测任务的预测和groundtruth之间的匹配以及我们使用的度量。然后我们展示了针对这两个任务的统一检测器的联合优化。

文本匹配：我们采用 MaX-DeepLab [53] 中提出的 PQ 风格的相似度评分。对于一对预测 $（\hat{m}_i，\hat{y}_i）$ 和 $groundtruth（m_j，y_j）$ ，得分定义为：

其中 $\hat{m}_i , m_j )$ 表示这对掩码之间的 Dice 系数 [36]。它测量掩码相似度。该分数同时考虑了分类分数和掩码分数。

匹配的目标是找到 $N$ 个元素 $σ ∈ G_N$ 的排列，以最大化预测和基本事实之间的总相似性：

根据之前的工作 [6, 53]，我们在训练期间使用匈牙利算法 [23] 即时解决了这个最优分配问题。

文本检测损失：文本检测的训练目标采用 MaX-DeepLab [53]：

其中虚线变量 $\ddot{\hat{y}}_i$ 和 $\ddot{Dice}(\hat{m}_i , m_{σ(i)})$ 表示恒定权重，梯度不通过它们。 $α$ 是正负样本之间的平衡因子。

布局分析损失：我们首先定义布局分析分支输出的基本事实。每个文本实例都带有一个文本簇 ID，表示为 ${\{c_i\}^N_{i=1}}$ 。这是提议的 HierText 数据集注释的一部分。 groundtruth 亲和度矩阵可以直观地定义为：

然后，布局分析损失可以计算为：

最终的训练目标是文本检测损失 $L_{det}$ 、布局分析损失 $L_{lay}$ 的加权和。我们还发现结合 MaX-DeepLab [53] 中定义的语义分割损失 $L_{seg}$ 和实例辨别损失 $L_{ins}$ 很有用。因此，该模型针对以下损失函数进行了联合优化：

实验

在本节中，我们设置了实验来全面评估我们提出的统一检测器。首先，我们将我们的方法与竞争基线进行比较。我们展示了统一检测器实现了更好的性能。我们还进行了彻底的消融研究，以分析所提出方法的设计选择。最后，我们针对场景文本检测的唯一任务在公共数据集上训练和评估统一检测器，验证文本检测分支的有效性。

基线

尽管场景文本检测方法取得了令人难以置信的进步，并且布局分析算法的数量不断增加，但学术文献中的统一检测和布局分析任务在很大程度上仍未触及。因此，我们仔细选择以下代表非端到端方法的基线：

商业解决方案：如上所述，GCP API 是一种商业解决方案，可在单词、行和段落级别产生文本检测和识别结果。

GCN 后处理：基于 GCN [20] 的后处理方法 (GCN-PP) [54] 将 GCN 应用于文本行边界框，以将行聚类成段落。

对象检测基线：PubLayNet [62] 将布局分析公式化为实例分割任务，将文本簇预测为像素掩码。在这项工作之后，我们使用 Mask R-CNN [17] 构建了一个基线，就像在 [62] 中一样，它产生了文本集群掩码。每个这样的掩码代表一个文本簇。通过将每个检测到的文本实体（单词或行）分配给具有最大交叉区域的文本簇来执行布局分析。由于该模型不产生单词或行级别的检测，因此它与第 2 节中指定的文本实体检测模型结合使用。 5.2. 这个两阶段的基线被称为 Mask-RCNNCluster。同样，我们使用 MaX-DeepLab [53] 构建了 MaX-DeepLab-Cluster，它代表了一种更具竞争力的方法，在实例对象分割任务中具有最先进的进步。

实验设置

统一检测器：我们使用 DeepLab2 [56] 库来实现我们方法的 MaX-DeepLab 部分。我们使用 MaX-DeepLab-S 主干，输入大小为 1024 × 1024。由于数据集中文本的高密度，对象查询的数量设置为 384。查询维度分别为 D = 256 和 C = 128。在我们的主要实验中，我们只使用 HierText 作为训练数据。这些模型在 128 个 TPUv3 内核上进行训练，批量大小为 256，步长为 100K，AdamW [34] 优化器的权重衰减率为 0.05，余弦学习率从 10−3 开始。 PQ-loss、布局分析损失、实例判别损失和语义分割损失的权重分别为 3.0、1.0、1.0、1.0。平衡因子设置为 $α = 0.5$ 和 $α_L = 0.5$ 。在推理过程中，我们过滤掉置信度小于 32 像素或小于 $t_c = 0.5$ 的文本掩码。我们还使用 $t_m = 0.4$ 过滤掉低置信度像素。对于文本聚类，我们在亲和矩阵上使用 $t_A = 0.5$ 的阈值。在我们的主要实验中，统一检测器的文本检测分支被训练来检测文本行而不是单词。请注意，这些超参数中的大多数都遵循 MaX-DeepLab 的原始设置。

基线：对于 Mask-R-CNN-Cluster，我们使用来自公共 TF-Vision 存储库的实现。输入大小设置为 1024 × 1024。对于 MaX-DeepLab-Cluster，我们遵循统一检测器的相同超参数和训练设置以进行公平比较。对于 GCN-PP，我们按照 [54] 中的设置来训练线聚类模型。如上所述，这些方法只能基于检测到的文本实体进行布局分析。因此，我们将这三个基线与统一检测器的文本检测分支配对，以进行公平比较。

主要结果

我们评估我们的方法并与上面详述的基线进行比较。结果总结在表2。与基于 GCN 和基于检测的其他独立文本聚类方法相比，我们的端到端统一方法在 PQ 得分上以 1.08% 的可观优势实现了更好的布局分析性能。请注意，这些基线方法应用于统一检测器的文本检测分支的输出。因此，唯一的区别在于布局分析方法。这表明统一检测器内置的端到端文本聚类模块比独立的基线模块更有效和更好。请注意，基线是两阶段方法，需要几乎两倍的计算资源。对于文本检测，我们的系统实现了比 GCP API（62.23 与 56.17）更高的性能。

我们还展示了来自不同领域的图像的结果，如图 4 所示。所提出的方法能够处理各种布局，包括具有弯曲文本和不统一字体和颜色的文本集群。

消融研究

在本节中，我们进行消融研究以进一步探索设计细节。除了检测粒度实验（即 word vs line），我们使用 N = 128 个对象查询。基于单词的 vs. 基于行：我们的统一检测器框架能够在单词或行级别上执行端到端的文本实体检测，然后将这些实体聚类到段落级别作为布局分析结果。尽管就后续的识别算法而言，单词和行检测在很大程度上是可以互换的，但我们观察到布局分析的显着差异，如表 3 所示。虽然词和行级模型都受益于更多的对象查询，但行级模型始终优于其词级同行。一个潜在的原因可能是，与字级检测相比，行级检测减少了对象的数量，从而使聚类头的优化更容易。

文本聚类损失：我们比较了使用不同的方法来平衡聚类损失。结果列在表中4。α-平衡是第二节中描述的默认方法4.3。无特色意味着根本没有平衡。它通过 $[\sum^{N}_{ i=1} \sum^N_{j=1} y_σ(i)y_σ(j) ]^{ -1}$ 直接对损失项进行归一化。应用 $α$ 平衡因子在文本检测和布局分析方面取得了相当大的改进。平衡损失与焦点风格因素 [29] 会导致这两个任务的性能更差。

文本聚类头：我们将我们的默认设置，一个 3 层多头自注意力（MHSA）[51] 头与其他可行的选择进行比较，如表中所示6。我们还列出了没有布局分析分支的 MaX-DeepLab 线检测器的性能。如果我们不使用任何额外的层，文本检测性能与仅行检测器相比会下降，这表明有必要分离特征。但是，使用全连接层不能完全恢复检测文本的能力，并且会恶化布局分析。在检测和布局任务中，使用 1 层 MHSA 比仅使用全连接层要好。这是直观的，因为 Transformer 的 [51] 架构块为文本实体之间的交互提供了更强的建模。最后，额外的变压器层提高了性能。

公共数据集上的场景文本检测

在本节中，我们在最广泛使用的场景文本检测基准上评估我们的模型。我们在 Sec 中采用相同的训练和优化设置。 5.2 除了布局分析分支被排除，因为其他公共数据集没有布局标签。我们使用 N = 384 个对象查询。我们不会从任何检查点初始化我们的模型。我们也没有在任何合成数据集上进行预训练。我们直接在公共数据集的联合上进行训练，而不对其中任何一个进行微调3。我们使用最后一次训练迭代的检查点直接评估模型。我们评估以下 4 个基准：MLT 17 [38]、Total-Text [10]、CTW1500 [60] 和 MSRA-TD500 [59]。结果和与以前论文的比较总结在表中5。总体而言，与最先进的方法相比，我们的检测器具有更高的召回率和更低的精度。值得注意的是，即使曲线文本在训练数据集中所占比例很小，我们的模型仍然在曲线文本数据集 CTW1500 和 Total-Text 上表现出色，显示了所提出方法的适应性。

对于单词检测，我们在 MLT 17 上取得了最先进的结果 (77.24)。仅在其他公共数据集上进行训练时，性能仍然非常具有竞争力 (76.78)。在 Total-text 上，无论使用 HierText（87.94 和 87.90），我们都实现了最先进的技术。

对于线检测，我们在 CTW1500 和 MSRA-TD500 上取得了非常有竞争力的结果，而无需在 HierText 上进行训练。当我们在训练数据（84.88 → 85.97 和 86.69 → 87.70）中添加 HierText 时，我们观察到了相当大的改进。这表明 HierText 是对公共线路数据集集合的有益补充。

结论

在本文中，我们激发了统一场景文本检测和布局分析的任务。为了促进对这个方向的研究，我们收集了一个带有分层文本注释的数据集。我们进一步提出了一种用于统一检测和布局分析的端到端模型，该模型优于以前的方法，同时大大简化了流程。借助新的任务、数据集和模型，我们推动了图像中文本提取和理解的范围，并为下游任务提供了更好的支持。

C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
20.XLD轮廓 Echo`` Halcon系统化学习计算机视觉人工智能算法
目录1.xld概念2.画轮廓3.区域转轮廓4.边缘提取算子5.xld特征提取6.提取任意线条7.提取最长的线条8.xld分割10.xld合并11.xld拟合12.xld几何变换13.xld变换14.xld集合运算15.区域和轮廓精度16.轮廓的保存读取17.halcon操作CAD文件18.轮廓测量算子19.同心度计算1.xld概念*图像处理*1.处理对象HObject*1.图像-image*2.区
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
深入解析C++中 std::sort背后的实现原理 —Introsort（Introspective Sort）点云SLAM C++c++算法数据结构快速排序排序算法堆排序深度优先
Introsort简介Introsort是一种混合排序算法，结合了三种经典算法的优点：算法用于特点快速排序通常情况平均时间复杂度O(nlogn)堆排序当快速排序退化（递归过深）时最坏时间复杂度O(nlogn)插入排序小规模数组时（如长度≤16）常数开销小，快Introsort运行机制排序逻辑如下：if(size2*log2(n))堆排序（HeapSort）else快速排序（QuickSort）快速
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
揭秘 Spring Cloud Zuul 在后端的负载均衡策略大厂资深架构师 Spring Boot 开发实战 spring cloud 负载均衡 spring ai
揭秘SpringCloudZuul在后端的负载均衡策略关键词：SpringCloudZuul、负载均衡、微服务网关、Ribbon、请求路由摘要：在微服务架构中，API网关是流量的“总调度员”，而负载均衡则是它的“智能大脑”。本文将以“小区门卫派件”为故事主线，用通俗易懂的语言揭秘SpringCloudZuul如何通过集成Ribbon实现后端负载均衡。我们将从核心概念到算法原理，从代码实战到应用场景
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【NWFSP问题】基于中华穿山甲算法CPO求解零等待流水车间调度问题NWFSP研究（Matlab代码实现）
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述1.引言2.理论基础2.1中华穿山甲算法（CPO）核心原理2.2NWFSP数学模型3.CPO-NWFSP求解框架设计3.1编码与解码3.2离散化位置更新3.3目标函数适配4.实验设计与性能分析4.1实验设置4.2结果分析4.3敏感性分析5.结论与展望
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户