CharlesWu123

表格识别技术综述

表格结构识别综述

ICDAR2019
ICDAR2021 竞赛
中国图象图形学报
PRCV 2021
腾讯
小米
2021论文
- ICCV2021
- ACM MM 2021
- ICDAR 2021
2022 论文
- ACM Multimedia 2022
- CVPR 2022
2023 论文
参考文章

【声明】此文章供本人学习使用，内容来自公众号、知乎、博客等网站的摘录，如有侵权请联系删除！

ICDAR2019

A Genetic-based Search for Adaptive Table Recognition in Spreadsheets ¹

作者对电子表格进行结构识别。首先，作者将电子表格中的单元格分类为不同标签，包括Header、Data和Metadata（忽略），然后相邻单元格根据标签异同组成不同的区域，这些区域根据相邻关系则构成了一个标签区域图。作者正是在这个图的基础上进行表格结构识别任务的，这时，表格结构识别任务仅剩下将图划分为不同的表格区域这一个部分了，变成了子图分割任务，如图8所示。作者定义了10个衡量方法来衡量某一种分割的好坏，并将它们进行加权求和。之后对于每一种分割，使用序列二次规划的方法来自动调节权重，以达到最优。在这里，作者使用了遗传算法来查找边数较多的图的最优分割方案，作者将每一条边视为一个布尔值，真表示这条边存在，假表示不存在，从而得到遗传算法中的个体向量。作者还通过一些启发式方法预先找出一些种子个体向量添加到遗传算法的输入中，将它视为一个比较好的候选解，并参与到迭代过程中，从而减少了迭代代数。对于边数较少的图，作者直接使用穷举搜索来查找。作者最终在从ENRON语料中生成的数据集上进行测试，训练数据集中包含一部分随意选择性标错的噪声数据项，以此保证算法的鲁棒性。作者将预测结果与Ground Truth的IoU超过0.9的表格视为成功识别出的表格，并计算最终的准确率，达到了89.6%的准确率，并验证了遗传算法、预设种子以及故意制造噪声训练数据对性能提升的有效性。
Table Row Segmentation²

作者对电子表格进行结构识别。首先，作者将电子表格中的单元格分类为不同标签，包括Header、Data和Metadata（忽略），然后相邻单元格根据标签异同组成不同的区域，这些区域根据相邻关系则构成了一个标签区域图。作者正是在这个图的基础上进行表格结构识别任务的，这时，表格结构识别任务仅剩下将图划分为不同的表格区域这一个部分了，变成了子图分割任务，如图8所示。作者定义了10个衡量方法来衡量某一种分割的好坏，并将它们进行加权求和。之后对于每一种分割，使用序列二次规划的方法来自动调节权重，以达到最优。在这里，作者使用了遗传算法来查找边数较多的图的最优分割方案，作者将每一条边视为一个布尔值，真表示这条边存在，假表示不存在，从而得到遗传算法中的个体向量。作者还通过一些启发式方法预先找出一些种子个体向量添加到遗传算法的输入中，将它视为一个比较好的候选解，并参与到迭代过程中，从而减少了迭代代数。对于边数较少的图，作者直接使用穷举搜索来查找。作者最终在从ENRON语料中生成的数据集上进行测试，训练数据集中包含一部分随意选择性标错的噪声数据项，以此保证算法的鲁棒性。作者将预测结果与Ground Truth的IoU超过0.9的表格视为成功识别出的表格，并计算最终的准确率，达到了89.6%的准确率，并验证了遗传算法、预设种子以及故意制造噪声训练数据对性能提升的有效性。

黑细线是表格真实的单元格边界。蓝色框为文本区域，被B、I、O标注。绿实线为候选行分隔符，被圆圈中的S、I、O标注。虚线为它们之间的边。
Deep Splitting and Merging for Table Structure Decomposition³一文中，作者提出了一种先自顶向下、再自底向上的两阶段表格结构识别方法SPLERGE，分为Split和Merge两个部分，整体架构如图10所示。Split部分先把整个表格区域分割成表格所具有的网格状结构，该部分由图11所示的深度学习模块组成两个独立的模型，分别预测表格区域的行分割和列分割情况。

每个模块中，除了常规的多尺度特征提取部分，作者还提出了投影池化（Projection Pooling）操作，它的输出实际上就是求取每一行或列的平均特征值，用于将每一行或列的整体特征整合到原先的局部特征上。最终，模型预测每一行或列像素是否属于单元格间的分隔符区域。而Merge部分则是对Split的结果中的每对邻接网格对进行预测，判断它们是否应该合并。这里作者尝试了深度学习方法和启发式的方法，发现两者在不同的数据集上各有千秋。该模型最终在ICDAR2013表格竞赛表格结构识别子任务的数据集上取得了State-of-the-art的效果，预测的单元格对与Ground truth匹配的F1值达到95.26%，并在作者准备的非公开数据集上也达到95.92%的效果，远远超过复现的已有方法和商业软件的性能。
DeepTabStr:Deep Learning based Table Structure Recognition⁴

一文中，作者首先提出，文档图片中表格的位置和大小不同，导致表格特征可能在特征的任意区域以任意大小出现，传统的卷积网络在处理时，会遇到问题。因此，作者将变形卷积的概念引入，用来解决表格的检测问题。由于基于FCN的语义分割类方法，最终结果严重依赖于后处理的方案，因此作者舍弃此类方案，将表格结构检测视为一个对象检测问题，将表格的行和列当做是要检测的对象。变形卷积网络加入了各个像素的偏移向量Offset来训练卷积窗口的形状。传统的ROI-pooling层将ROI转换为k*k的固定大小，可变形的ROI-pooling层也引入了额外的偏移量，使得ROI-pooling层也具有了变形的属性，以适应不同区域的对象检测。本文表格结构识别方法的整体结构如图12所示。此外，为了弥补表格结构识别数据的不足，本文提出了一个基于ICDAR2017的表格行列结构数据集TabStructDB。作者分别用Faster R-CNN、FPN、RFCN进行了实验，并在ICDAR2013和TabStructDB上进行了训练和测试，在ICDAR2013数据集上可以达到F1-Score为93%的效果。
ReS2TIM: Reconstruct SyntacticStructures from Table Images ⁵

一文则是重点关注了单元格检测定位后的表格重建工作。作者先将各个单元格之间定义为上下、左右相邻的关系，使用一个单元格关系判别网络来判断任意两个单元格的相邻关系。给定带有单元格边界框的表格图像，关系判别网络将单元格深度数据特征和空间特征进行了连接，作为关系对的联合特征，再判断单元格之间的关系。网络整体结构如图13。而对于一个表格来说，具有相邻关系的单元格占比极少，这会极大地影响网络的效果，因此作者又提出了基于距离的损失权重。在设计损失函数时，按照单元格的距离来设定对应损失权重，距离越远，损失权重越小。在判断完单元格之间的关系之后，根据相邻关系构建出对应的图模型。再根据图模型，按照单元格的上下相邻关系，使用Dijkstra算法确定原表格的行和列的最大数量。之后确定表格内每个单元格的起始的行和列以及跨行跨列的数量。作者在CMDD数据集和ICDAR2017数据集上进行了实验，在CMDD数据集单元格关系的判定任务上，F1-score达到了99.8%的效果。
Rethinking Semantic Segmentationfor Table Structure Recognition in Documents⁶
一文将表格结构的识别定义为语义分割问题，使用FCN网络框架，对表格的行和列分别进行预测。同时基于表格的一致性假设，介绍了一种对预测结果进行切片的方法，降低了表格识别的复杂度。作者使用了FCN的Encoder和Decoder的结构模型，并加载了在ImageNet预训练好的模型。图片经过模型生成了与原图大小相同的特征，切片过程将特征按照行和列进行平均，将HWC（高宽Channel）的特征合并成了HC和WC大小特征，对这些特征进行卷积后，再进行复制，扩展为HWC的大小，再通过卷积层得到每个像素点的标签。最后进行后处理得到最终的结果。整体的框架如图14所示。文章在ICDAR2013数据集上进行了实验，在IoU为0.5的情况下，取得了F1-score为93.42%的效果。然而本文假设表格中所有的单元格不存在跨行跨列，每行每列都从表格的最左侧和最上端开始，到最右侧和最下端结束，因此本方法还存在局限。
Rethinking Table Recognitionusing Graph Neural Networks⁷
Paper: https://arxiv.org/pdf/1905.13391.pdf
Code：https://github.com/shahrukhqasim/TIES-2.0
一文则是将GNN应用到了表格结构识别任务中，把视觉特征、位置特征和图中的结构特征进行有效融合。作者使用基于表格区域的建图方法，以OCR识别出的单词区域作为顶点。之后，作者先根据建好的图，从表格图像中提取各个顶点的图像位置特征和CNN提取的视觉特征等特征，然后使用GNN进行特征的交互融合，得到每个顶点的表征特征。作者尝试了两种GNN模型，分别是动态图卷积神经网络DGCNN（Dynamic Graph Convolutional Neural Networks）和GravNet，并且把应用了常规CNN的DenseNet作为基线模型以进行性能对比。训练时随机对顶点对采样，使用DenseNet分别进行是否同行、同列、同单元格的结构关系分类，而在测试时，则对图中每一个顶点对都进行三种分类，得到测试结果。模型整体架构如图15所示。作者将模型在他们自己生成的约有50万个表格的数据集上进行测试，表格被分为4种类别：全线表、无线表、少线表和错切表，其中最后一种是为了模拟由相机等设备获取到的有形变的表格数据而准备的。作者使用完美匹配率来衡量识别效果，模型预测的三种结构关系分类全部正确的表格视为完美匹配表格。最终在4种表格数据上测试最好结果依次为96.9%、94.7%、52.9%和68.5%，均为使用DGCNN得到的结果，可见GNN的确可以产生更好的效果，然而少线表和错切表仍然是难点。

由特征提取，特征交互整合，结构关系分类三个部分组成
TableStructure Extraction with Bi-directional Gated Recurrent Unit Networks⁸
针对单元格在行列上具有重复性的序列特征这个特点，提出使用循环神经网络来进行表格结构识别任务。该文作者同样是使用两个独立的模型来进行行列分割，整体架构如图16所示。针对不同的分割任务，首先使用类似的预处理操作使得表格区域变为一种对于深度学习网络来说更容易处理的形式，包括去除非文本前景对象、二值化和水平或竖直的膨胀操作，膨胀操作是为了使得图像中的行或列特征更明显。然后，将预处理结果按像素行或列放入独立的两个两层双向循环神经网络，以同时将某个像素行或列的相邻两个邻居考虑进去。接着将循环神经网络的输出行列特征分类为是否属于行列分隔符区域，最终把预测分隔区域的中点作为最终的行列分割结果。作者尝试了LSTM和GRU这两个经典循环神经网络模型，发现GRU在实验效果上更有优势。最后，作者在UNLV和ICDAR2013表格竞赛表格结构识别子任务的数据集上进行测试，都超过了之前方法中的最好结果，其中在ICDAR2013数据集上单元格关系匹配F1值达到93.39%。

整体架构，分为行分割（左）和列分割（右）两个独立的部分
TableNet: Deep Learning Model for End-to-end Table Detection and Tabular Data Extraction from Scanned Document Images⁹

作者则使用深度学习模型同时解决表格检测和表格结构识别两个任务。作者提出了一种端到端的、多任务的、基于编解码器的图像语义分割模型TableNet，整体架构类似于U-Net

编码器阶段使用了ImageNet上预训练的VGG-19模型来提取特征，而解码器阶段则分成两个分支，分别上采样恢复到原图大小并最终得到表格和表格区域中列分割的mask图。下采样中对应大小的特征图被添加到上采样对应层的特征图中，以恢复最终图像中的位置信息。最终，再使用基于规则的方法将列分割结果处理为最终的表格单元格邻接关系结果，得到表格真正的逻辑结构。多任务模型有利于融合表格分割和表格列分割任务中涉及到的信息或特征，以产生相互促进性能提升的效果。此外，作者还尝试将OCR识别出的文本区域的数据类型这种语义特征添加到输入中，采用的做法是使用正则表达式简单对文本区域进行数据类型匹配分类，然后对于不同数据类型的文本区域添加上不同的、独有的颜色高亮背景。作者在Marmot和ICDAR2013表格竞赛数据集上训练，然后在ICDAR2013表格竞赛数据集上进行测试，实验结果也达到了非常好的水平，表格检测和结构识别任务上最好的F1值分别达到96.62%和91.51%，证明了模型的有效性，同时也通过对比实验证明了语义信息和在目标数据集上进一步微调对性能有提升作用。作者最后提出之后可以将行分割任务也结合进来，或者使用更多的其他语义信息。

ICDAR2021 竞赛

比赛论文：ICDAR 2021 Competition on Scientific Literature Parsing¹⁰

Davar-Lab-OCR,海康威视研究所
论文：LGPMA：Complicated Table Structure Recognition with Local and Global Pyramid Mask Alignment¹¹
代码：https://github.com/hikopensource/DAVAR-Lab-OCR/tree/main/demo/table_recognition/lgpma
表识别框架包含两个主要过程:单元格生成和结构推断
(1)基于Mask-RCNN检测模型构建表格单元格生成。训练模型学习文本内容区域的行/列对齐的单元格级边界框及其对应的掩码。还引入了金字塔掩码监督，并采用大型骨干网络 HRNet-W48 Cascade Mask RCNN 来获得可靠的 bounding box。使用单行文本检测模型和一个基于注意的文本识别模型来提供OCR信息。这可以通过选择只包含单行文本的实例来实现。还采用了多尺度集成策略上对单元格和单行文本检测模型进一步提高性能。
(2)在结构推断阶段，根据单元格的对齐重叠程度，将单元格的包围盒进行水平/垂直连接。然后通过Maximum Clique Search过程生成行/列信息，在此过程中可以轻松定位空单元格。
为了处理一些特殊情况，还训练了另一个表检测模型来过滤不属于该表格的文本。
VCGroup, 平安
所用方法论文：
PingAn-VCGroup’s Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML¹²
PingAn-VCGroup’s Solution for ICDAR 2021 Competition on Scientific Table Image Recognition to Latex.¹³
MASTER: Multi-aspect non-local network for scene text recognition¹⁴
将表格内容识别任务分为4个子任务:表格结构识别、文本行检测、文本行识别和文本框分配。表结构识别算法和文本识别算法都是基于文本识别算法MASTER的。文本检测使用的是 PSENet。最后，在框分配阶段，我们将PSENet检测到的文本框与通过表结构预测重构的结构项相关联，并将文本行识别的内容填充到对应项中。
PaodingAI，庖丁
官网：https://www.paodingai.com/
表格识别用的方法是 SPLERGE³
主要分为三个部分:文本块检测、文本块识别和表结构识别。文本检测采用的是 MMDetection 提供的 Detectors cascade rcnn r50 2x 模型，文本识别使用的是 SAR_TF 模型。表结构识别是对SPLERGE 中提出的模型的实现。除了上面的模型，还使用规则和一个简单的分类模型来处理，，和空白字符。不是端到端的模型，也没有使用集成的方法

TAL，好未来
TAL系统由两种方案组成:
1.通过表头检测、行检测、列检测、单元格检测和文本行检测5个检测模型重建表结构。都是基于 Mask R-CNN，只是针对不同的检测任务进行有针对性的优化。在识别部分，将单元格检测和文本行检测的结果输入到CRNN模型中，得到每个单元格对应的识别结果。
2.表结构的恢复被当作一个img2seq问题。为了缩短解码长度，我们将每个单元格内容替换为不同的数字。数字由文本行检测结果得到。然后我们使用CNN对图像进行编码，使用transformer对表的结构进行解码。然后利用CRNN模型得到相应的文本行内容。
利用上述两种方案可以得到完整的表结构和内容识别结果。我们有一套选择规则，结合两种方案的优点，输出一个最好的最终结果。

中国图象图形学报

表格识别技术研究进展【2021年度发展报告】

PRCV 2021

PRCV 2021和好未来AI研究院联合举办的2021年好未来表格识别技术挑战赛
竞赛地址
PRCV 2021表格识别技术挑战赛–分阶段表格识别方案

腾讯

https://cloud.tencent.com/developer/article/1452973
https://zhuanlan.zhihu.com/p/69793742
github地址：https://github.com/tommyMessi/tableImageParser_tx
复现腾讯表格识别解析| 鹅厂技术

小米

小米表格识别技术揭秘
技术框架

2021论文

ICCV2021

TGRNet: A Table Graph Reconstruction Network for Table Structure Recognition¹⁵
代码地址：https://github.com/xuewenyuan/TGRNet

将表结构识别问题重新表述为表图重构问题。
使用 ResNet50+FPN 提取特征图，分别送到两个分支进行处理，一个单元格检测分支和一个单元格逻辑定位分支，共同预测不同单元格的空间位置和逻辑定位。
对于单元格位置定位，首先使用基于分割的方法来生成单元格分割图，来检测单元格的位置。
对于单元格逻辑定位，用图卷积网络(GCN)来学习表格的图表示，并将其作为有序节点分类问题来解决。并使用损失函数 focal loss 来解决不平衡问题。
最后预测结果包含每个单元格的空间位置以及每个单元格的起始行列。

Alibaba-Group: Parsing Table Structures in the Wild¹⁶
论文提出的数据集地址：https://github.com/wangwen-whu/WTW-Dataset
与现有研究主要集中于从扫描的PDF文档中解析具有简单布局的排列良好的表格图像不同，该论文目标是建立一个实用的表格结构解析系统，用于实际场景，其中表格输入图像被获取或扫描时存在严重的变形、弯曲或遮挡。
模型名称叫 Cycle-CenterNet，是在 CenterNet 顶部加上一个新的循环配对模块，同时检测单元格并组成结构化的表格。并且在循环配对模块中，使用了一种新的配对损失函数来训练。

具体流程：该模型同时检测表格单元格的顶点和中心点，并通过学习公共顶点将单元格分组到表格中。一个单元格的中心点和顶点之间存在一种相互指向的关系，这种关系可以利用相邻单元格的交点上的公共顶点来将单元格分组成表格。在此基础上，论文提出了一种配对损失函数来对训练阶段的单元格进行端到端分组。获得表的结构后，使用一个简单的后处理算法来检索已解析的表的行和列信息。
Cycle-Pairing Module：定位单元格并且学习单元格之间的拼接信息。包含两个分支：中心顶点分支和顶点中心分支。在中心顶点分支中，回归表格单元中心到其顶点的偏移量，经过Center-Net的后处理，可以得到表格单元的多边形表示；在顶点中心分支中，学习公共顶点与其周围单元格中心之间的偏移量。最后，在解析处理中推导出表格的拼接信息。
Pairing Loss for Cycle-Pairing Module：通过计算表格中同一个单元的成对的中心和角点的损失函数

ACM MM 2021

Show, Read and Reason: Table Structure Recognition with Flexible Context Aggregator¹⁷
本文设计了一种灵活的上下文聚合器(FLAG)，它以自适应的方式将 Transformer 和基于图的上下文聚合器结合在一起。基于FLAG，提出了端到端网络 FLAG-Net，不需要额外元数据或OCR信息，可以灵活地调节表元素关系推理中密集上下文和稀疏上下文的聚合。

整个模型包含三个部分：表格元素检测、灵活的上下文聚合器和表格结构预测。
首先，使用使用类似于 Faster-RCNN 的结构得到表格元素。采用单词边界框而不是单元格作为表格元素，以避免单元格边界歧义问题。在 NMS 之后，获取到表格元素。把N个特征图（d维）和相对坐标（4维）拼接起来，映射为 Nxd 维的特征作为上下文聚合器的输入。

然后，将上个模块的输出作为 FLAGs 的输入，FLAGs 由一组堆叠的 FLAG (灵活的上下文聚合器)组成的，可以进行灵活的上下文聚合。
FLAG 包括两部分：基于 Transformer 的密集上下文聚合器（DCA）和基于图的稀疏上下文聚合器（SCA），具有较少归纳偏差的基于 Transformer 的聚合器负责从全局范围内的表元素的密集上下文中学习关系，而基于图的聚合器接收构建的表元素的图并以局部方式维护稀疏上下文。文中改进了普通的 MHA（Muti-head attention），为每个头设置了一个独立的门，以结合来自基于图聚合器的稀疏上下文信息，用稀疏上下文对稠密上下文进行增强，并实现稀疏上下文之间的自适应调制。
最后，将具有灵活上下文的输出表格元素向量配对，从单元格、行和列的角度来预测它们之间的关系。

ICDAR 2021

Adaptive Scaling for Archival Table Structure Recognition¹⁸

2022 论文

ACM Multimedia 2022

TSRFormer: Table Structure Recognition with Transformers¹⁹

微软研究院

论文阅读：https://blog.csdn.net/m0_38007695/article/details/127820081

TSRFormer，可以从各种表格图像中稳健地识别具有几何变形的复杂表格的结构，可以处理几何扭曲甚至弯曲的表格，有边框和无边框的表格。
此方法是把表格分隔线预测当作线回归问题而不是图像分割问题，并提出了一种新的基于 DETR 的分隔线预测方法，称为 Separator REgression TRansformer (SepRETR)，直接从表格图像中预测分割线。在分割线预测之后，使用基于简单关系网络的单元合并模块来恢复合并单元。

CVPR 2022

PubTables-1M: Towards comprehensive table extraction from unstructured documents²⁰

TableFormer: Table Structure Understanding with Transformers²¹

提出了一个合成数据集 SynthTabNet

TableFormer包含三部分：

CNN Backbone

结构解码器

单元格边框解码器



Neural Collaborative Graph Machines for Table Structure Recognition²²

腾讯优图
论文阅读：https://blog.csdn.net/m0_38007695/article/details/127844641

2023 论文

LORE: Logical Location Regression Network for Table Structure Recognition²³
阿里
论文链接：https://arxiv.org/abs/2303.03730
代码链接：https://github.com/AlibabaResearch/AdvancedLiterateMachinery/tree/main/DocumentUnderstanding/LORE-TSR

参考文章

原创综述 | ICDAR 2019表格识别论文与竞赛综述（上）

ICDAR 2021表格解析方案汇总

PRCV 2021表格识别技术挑战赛–分阶段表格识别方案

复现腾讯表格识别解析| 鹅厂技术

小米表格识别技术揭秘

E. Koci, M. Thiele, O. Romero, and W.Lehner, A Genetic-based Search for Adaptive Table Recognition in Spreadsheets, ICDAR2019 ↩︎

J.-L. Meunier and H. Déjean,Table Rows Segmentation, ICDAR2019 ↩︎

C. Tensmeyer, V. I. Morariu, B. Price,S. Cohen, and T. Martinez,Deep Splitting and Merging for Table Structure Decomposition, ICDAR2019 ↩︎ ↩︎

S. A. Siddiqui, I. A. Fateh, S. T. R.Rizvi, A. Dengel, and S. Ahmed, DeepTabStr:Deep Learning based Table Structure Recognition, ICDAR2019 ↩︎

W. Xue, Q. Li, and D. Tao, ReS2TIM: Reconstruct SyntacticStructures from Table Images, ICDAR2019 ↩︎

S. A. Siddiqui, P. I. Khan, A. Dengel,and S. Ahmed, Rethinking Semantic Segmentationfor Table Structure Recognition in Documents, ICDAR2019 ↩︎

S. R. Qasim, H. Mahmood, and F.Shafait, Rethinking Table Recognitionusing Graph Neural Networks, ICDAR2019 ↩︎

S. A. Khan, S. M. D. Khalid, M. A.Shahzad, and F. Shafait, TableStructure Extraction with Bi-directional Gated Recurrent Unit Networks, ICDAR2019 ↩︎

S. Paliwal, V. D, R. Rahul, M. Sharma,and L. Vig, TableNet: Deep Learning Model for End-to-end Table Detection and Tabular Data Extraction from Scanned Document Images, ICDAR2019 ↩︎

Antonio Jimeno-Yepes, Peter Zhong, Douglas Burdick, ICDAR 2021 Competition on Scientific Literature Parsing ↩︎

Liang Qiao, Zaisheng Li, Zhanzhan Cheng, Peng Zhang, Shiliang Pu, Yi Niu, Wenqi Ren, Wenming Tan, Fei Wu, LGPMA：Complicated Table Structure Recognition with Local and Global Pyramid Mask Alignment, ICDAR2021 ↩︎

Jiaquan Ye, Xianbiao Qi, Yelin He, Yihao Chen, Dengyi Gu, Peng Gao, Rong Xiao,PingAn-VCGroup’s Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML ↩︎

Yelin He, Xianbiao Qi, Jiaquan Ye, Peng Gao, Yihao Chen, Bingcong Li, Xin Tang, Rong Xiao:
PingAn-VCGroup’s Solution for ICDAR 2021 Competition on Scientific Table Image Recognition to Latex. ↩︎

Ning Lu, Wenwen Yu, Xianbiao Qi, Yihao Chen, Ping Gong, Rong Xiao, Xiang Bai: MASTER: Multi-aspect non-local network for scene text recognition ↩︎

Wenyuan Xue, Baosheng Yu, Wen Wang, Dacheng Tao, Qingyong Li: TGRNet: A Table Graph Reconstruction Network for Table Structure Recognition, ICCV2021 ↩︎

Rujiao Long, Wen Wang, Nan Xue, Feiyu Gao, Zhibo Yang, Yongpan Wang, Gui-Song Xia: Parsing Table Structures in the Wild, ICCV2021 ↩︎

Hao Liu, Xin Li, Bing Liu, Deqiang Jiang, Yinsong Liu, Bo Ren, Rongrong Ji:
Show, Read and Reason: Table Structure Recognition with Flexible Context Aggregator,ACM MM 2021 ↩︎

Xiao-Hui Li, Fei Yin, Xu-Yao Zhang, Cheng-Lin Liu: Adaptive Scaling for Archival Table Structure Recognition，ICDAR2021 ↩︎

Weihong Lin, Zheng Sun, Chixiang Ma, Mingze Li, Jiawei Wang, Lei Sun, Qiang Huo:
TSRFormer: Table Structure Recognition with Transformers， ACM Multimedia 2022 ↩︎

Brandon Smock, Rohith Pesala, Robin Abraham:PubTables-1M: Towards comprehensive table extraction from unstructured documents，CVPR2022 ↩︎

Ahmed S. Nassar, Nikolaos Livathinos, Maksym Lysak, Peter W. J. Staar:TableFormer: Table Structure Understanding with Transformers，CVPR2022 ↩︎

Hao Liu, Xin Li, Bing Liu, Deqiang Jiang, Yinsong Liu, Bo Ren: Neural Collaborative Graph Machines for Table Structure Recognition，CVPR2022 ↩︎

Hangdi Xing, Feiyu Gao, Rujiao Long, Jiajun Bu, Qi Zheng, Liangcheng Li, Cong Yao, Zhi Yu: LORE: Logical Location Regression Network for Table Structure Recognition. CoRR abs/2303.03730 (2023) ↩︎

Milvus 数据批量导入实战：Python代码解析修破立生 Milvus milvus python 人工智能
1引言在处理大规模数据的存储和检索时，向量数据库逐渐成为一种热门的解决方案。Milvus作为一款高性能的向量数据库，在人工智能、机器学习等领域有着广泛的应用。本文将介绍如何使用Python代码将数据批量导入到Milvus数据库中，通过实际的代码示例来帮助大家理解导入过程和相关的技术要点。2代码功能概述我们的代码主要实现了从本地文件读取数据，并将其批量导入到Milvus数据库的功能。代码涉及到命令行
基于RK3588的AI摄像头应用解决方案浙江启扬智能科技有限公司 linux ARM 嵌入式开发嵌入式硬件
随着人工智能（AI）技术的快速发展，越来越多的视频监控系统开始直接在摄像头上部署AI分析，视频监控从早期的图像记录发展到如今具备AI运算能力和算法，可进行目标识别、行为分析以及事件反馈，实现从被动记录到主动预警的转变。目前有三种算力部署方式：AI分析部署在云端、AI分析部署在边缘、AI分析部署在摄像头，也就是我们常说的云，边，端。但越来越多的摄像头本身就集成了AI分析能力，这一趋势的出现存在多方面
AI江湖风云：GPT-4.5与Grok-3的巅峰对决广拓科技人工智能
在科技飞速发展的今天，人工智能领域的竞争可谓是一场没有硝烟的战争。各大科技巨头和新兴企业纷纷投入大量资源，力求在这个充满无限可能的领域中抢占先机。就在前不久，AI界发生了一件大事，OpenAI的明星产品GPT-4.5竟然被马斯克旗下xAI公司的Grok-3反超，这个消息犹如一颗重磅炸弹，瞬间在科技圈掀起了惊涛骇浪。大家纷纷猜测，这背后究竟隐藏着怎样的故事？Grok-3究竟凭什么能够后来居上，实现对
OLMo 7B：推动自然语言处理领域的技术革新单皎娥
OLMo7B：推动自然语言处理领域的技术革新OLMo-7B项目地址:https://gitcode.com/hf_mirrors/ai-gitcode/OLMo-7B引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。然而，在实际应用中，NLP技术仍然面临着诸多挑战，如语境理解、信息抽取、情感分析等。为了解决这些问题，艾伦人工智能研究所（AI2）推出了OLMo系列模型，其中
探索未来文本的无限可能：OLMo 开源语言模型深度解析钟洁祺
探索未来文本的无限可能：OLMo开源语言模型深度解析OLMoModeling,training,eval,andinferencecodeforOLMo项目地址:https://gitcode.com/gh_mirrors/ol/OLMo在人工智能的浩瀚领域中，一个崭新的星体正在升起——OLMo：OpenLanguageModel。由AI2（艾伦人工智能研究所）的科学家们精心打造，OLMo不仅仅是
手写数字识别项目：从原理到实践北屿升：微信新浪微博 facebook 微信公众平台百度
在当今数字化时代，手写数字识别作为模式识别和人工智能领域的重要应用，有着广泛的用途，如邮政信封上的邮编识别、银行支票上的数字处理等。本文将详细介绍手写数字识别项目的相关内容，包括原理、数据集、实现步骤和应用前景。一、手写数字识别原理手写数字识别主要依赖于模式识别和机器学习技术。其基本原理是将手写数字的图像转换为计算机能够处理的数字信号，然后通过特征提取和分类算法来判断该数字的具体值。常用的特征提取
Dolma:开源大规模语言模型预训练数据集与工具包 2401_87458718 语言模型人工智能自然语言处理
Dolma:开源大规模语言模型预训练数据集与工具包Dolma是由Allen人工智能研究所(AI2)开发的一个开源项目,旨在为大规模语言模型的预训练提供高质量的数据集和强大的数据处理工具。Dolma包含两个主要组成部分:Dolma数据集和Dolma工具包。Dolma数据集Dolma数据集是一个包含3万亿个token的开放数据集,涵盖了多样化的内容来源,包括网页内容、学术出版物、代码、书籍和百科全书材
BP神经网络计算过程：从数学原理到实践优化 Acd_713 BP神经网络神经网络人工智能深度学习
引言：神经网络的时代意义与BP算法地位在深度学习重构人工智能边界的今天（Goodfellowetal.,2016），误差反向传播（Backpropagation，BP）算法作为神经网络训练的基石，其数学优雅性和工程实用性完美统一。本文将深入剖析BP神经网络的计算本质，揭示其如何在非线性空间中构建认知通道。第1章神经网络拓扑结构的数学建模1.1生物神经元到M-P模型的抽象跃迁McCulloch-Pi
成为LLM大师的必读书籍：这几本大模型书籍，详细到让你一篇文章就收藏足够 AGI大模型老王产品经理大模型教程学习大模型人工智能 LLM 大模型书籍
以下是几本关于大模型和人工智能领域的经典书籍，它们各自具有独特的特点和适用人群：《深度学习》（DeepLearning）作者：伊恩·古德费洛（IanGoodfellow）、约书亚·本吉奥（YoshuaBengio）、亚伦·库维尔（AaronCourville）简介：《深度学习》是深度学习领域的经典之作，全面介绍了深度学习的基础知识、主要模型及其应用。书中详细讲解了神经网络、卷积神经网络、循环神经网
深度学习模型未来可能会在这些领域取得突破性进展 xinxiyinhe 人工智能深度学习人工智能深度学习模型深度学习
深度学习模型作为人工智能的核心技术之一，未来有望在多个领域取得突破性进展。以下是一些可能的方向：1.通用人工智能（AGI）目标：开发具有通用智能的模型，能够像人类一样处理多种任务。潜在突破：更强的推理和抽象能力，解决复杂问题。结合多模态数据（文本、图像、声音等）实现更全面的理解。自我学习和适应能力，减少对大量标注数据的依赖。2.医疗与生命科学目标：提升疾病诊断、药物研发和个性化治疗的水平。潜在突破
深度学习进阶：TensorFlow实战指南 ELSON麦香包
本文还有配套的精品资源，点击获取简介：《TensorFlow实战Google深度学习框架》详细指导读者学习TensorFlow，涵盖基础概念、数据流图、API使用、张量和变量操作，深度学习基础如CNN和RNN，以及自定义层和优化算法。书中还提供使用TensorFlow构建和训练深度学习模型的实例，包括AlexNet、VGG、ResNet以及LSTM和GRU，并通过图像分类和文本情感分析等实战案例，
AI学习预备知识-数据操作（3）广播机制羞涩的小吉他人工智能学习
AI学习预备知识-数据操作（3）广播机制提示：本系列持续更新中文章目录AI学习预备知识-数据操作（3）广播机制前言广播机制总结前言随着开始人工智能的学习越来越多，那么再学习过程中，我们应该有一定的基础知识储备，本系列为基础知识储备介绍，在以往系列中我们提到了相同形状的张量按元素操作，那不同形状的张量操作就涉及到本文主要讲解AI学习储备知识–广播机制。广播机制提示：默认使用python，数据操作使用
AI与.NET技术实操系列胖头鱼不吃鱼- 人工智能 .net
引言在当今技术飞速发展的时代，人工智能（ArtificialIntelligence,AI）已成为推动创新和变革的核心力量。从智能助手到自动化决策系统，AI的应用无处不在，深刻影响着我们的生活和工作方式。对于软件开发者而言，掌握AI技术不仅意味着紧跟潮流，更是在竞争激烈的市场中保持优势的关键。作为微软的旗舰开发平台，.NET为开发者提供了丰富的工具和库，使他们能够轻松地将AI功能集成到应用程序中。
Python深度学习之路：TensorFlow与PyTorch对比步入烟尘 Python超入门指南全册 python 深度学习 tensorflow
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
深度学习实战：TensorFlow 开源项目指南劳治亮
深度学习实战：TensorFlow开源项目指南Deep-Learning-TensorFlow项目地址:https://gitcode.com/gh_mirrors/dee/Deep-Learning-TensorFlow项目介绍本项目基于GitHub仓库https://github.com/blackecho/Deep-Learning-TensorFlow.git，旨在提供一个全面的学习与开发
深度学习实战：用TensorFlow构建高效CNN的完整指南芯作者 DD：日记深度学习
一、为什么每个开发者都要掌握CNN？在自动驾驶汽车识别路标的0.1秒里，在医疗AI诊断肺部CT片的精准分析中，甚至在手机相册自动分类宠物的日常场景里，卷积神经网络（CNN）正悄然改变着我们的世界。本文将以工业级实践标准，带您从零构建一个在CIFAR-10数据集上达到90%+准确率的CNN模型，深入解析TensorFlow2.x的最新特性，并揭秘模型优化的七大核心策略。[外链图片转存失败,源站可能有
Python从0到100（十八）：面向对象编程应用是Dream呀 python 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
机器学习笔记有涯小学生赵卫东机器学习笔记机器学习人工智能
1概述1.1简介机器学习（MachineLearning）是计算机科学的子领域，也是人工智能的一个分支和实现方式。“对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善，那么就称这个计算机程序在从经验E学习。”（汤姆·米切尔（TomMitchell），1997，MachineLearning）1.2机器学习、人工智能、数据挖掘从本质上看，数据科学的目标是通过处理各
大模型技术在网络安全领域的应用与发展蓝色的香菇 web安全安全大模型
一、概述大模型技术，尤其是深度学习和自然语言处理领域的大型预训练模型，近年来在网络安全领域得到了广泛应用。这些模型通过其强大的数据处理能力和泛化能力，为网络安全带来了新的机遇和挑战。本文将对大模型技术在网络安全领域的应用进行全面分析，识别关键应用进展，并探讨其对网络安全领域的潜在影响。二、大模型技术在网络安全领域的应用安全运营网络日志分析：大模型可以通过分析大量网络日志，自动识别异常行为和潜在威胁
基于opencv答题卡识别判卷深度学习乐园深度学习实战项目 opencv 人工智能计算机视觉
项目源码获取方式见文章末尾！回复暗号：13，免费获取600多个深度学习项目资料，快来加入社群一起学习吧。**《------往期经典推荐------》**项目名称1.【基于DDPG算法的股票量化交易】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LS
职坐标AIGC课程实战项目深度解析职坐标在线其他
内容概要在人工智能技术加速渗透各行业的背景下，职坐标IT培训体系中的AIGC课程以实战项目经验为核心，构建了从基础理论到产业落地的立体化培养框架。课程聚焦人工智能生成内容（AIGC）的核心技术链，涵盖自然语言处理、生成模型架构及多模态数据融合等模块，通过电商智能客服系统与新媒体文案生成工具两类典型场景的深度实践，强化学员对模型训练、参数调优及商业落地的综合能力。为适配行业需求，课程设计采用“三阶递
从入门到精通：清华DeepSeek全六版使用手册，AI学习的超强攻略指南 2501_90771553 pdf
从入门到精通：清华DeepSeek全六版使用手册，AI学习超强攻略指南在人工智能飞速发展、应用日益广泛的今天，越来越多的人渴望踏入AI学习的领域，探索其中的奥秘。然而，AI知识体系庞大复杂，从基础概念到前沿技术，想要快速掌握并非易事。此时，拥有一套系统、全面且权威的学习指南就显得尤为重要。今天，我们就为大家带来清华DeepSeek全六版使用手册，堪称AI学习的超强攻略指南，助力你从入门小白成长为A
智能驾驶：驶向未来的变革之路测试者家园人工智能质量效能智能驾驶人工智能质量效能机器人智能驾驶智能汽车无人汽车无人驾驶
在科技迅猛发展的今天，智能驾驶作为人工智能与交通运输深度融合的产物，正引领着汽车行业的革命性变革。从最初的驾驶辅助系统到如今的高度自动驾驶，智能驾驶技术的演进不仅改变了人们的出行方式，也对社会经济、法律法规等多个层面产生了深远影响。一、智能驾驶的技术演进与现状1.技术等级划分根据国际自动机工程师学会（SAE）的定义，自动驾驶技术被分为L0至L5六个等级：L0级：无自动化，完全由人类驾驶员控制。L1
深度学习揭秘：神经网络如何模拟人脑 shelly聊AI AI核心技术深度学习神经网络人工智能
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。AI工具集1：大厂AI工具【共23款】，一次性奉上，今天是百度和阿里AI工具集2：大厂AI工具【共12款】，一次性奉上，看看腾讯和字节的宝贝人工智能&AIGC术语100条Shelly聊AI-重磅发布一
【价值洼地的狩猎机制】调皮的芋头机器学习
大资本构建价值掠夺网络的本质，是一场精密设计的系统性剥削工程。其运作逻辑远超普通市场行为，而是通过技术霸权、制度漏洞与认知操控三位一体的组合拳，实现对目标领域的深度殖民化控制：一、价值洼地的狩猎机制1.量子级数据建模摩根士丹利开发的"经济熵变监测系统"，实时抓取全球2.3亿个数据节点（包括电力消耗、集装箱空置率、社交媒体情绪指数等），通过深度学习预测区域经济断裂点。例如2014年预判委内瑞拉石油危
DeepSeek vs Grok vs ChatGPT：大模型三强争霸，谁将引领AI未来？带上一无所知的我 chatgpt 人工智能 DeepSeek
DeepSeekvs.Grokvs.ChatGPT：大模型三强争霸，谁将引领AI未来？在人工智能领域，生成式模型的竞争已进入白热化阶段。DeepSeek、Grok和ChatGPT作为三大代表性工具，凭借独特的技术路径和应用优势，正在重塑行业格局。本文将从技术架构、核心功能、应用场景、性能成本等多维度展开深度对比，揭示其背后的竞争逻辑与未来趋势。一、技术架构：从知识图谱到通用智能的演进1.DeepS
RAG检索增强:知识图谱赋能的高效问答系统 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着互联网和信息技术的飞速发展，人们获取信息的方式和途径也发生了巨大的变化。传统的搜索引擎已经无法满足用户对于更精准、更个性化、更智能的信息获取需求。问答系统作为一种能够直接回答用户问题的智能系统，应运而生，并逐渐成为信息检索领域的研究热点。早期的问答系统主要基于模板匹配和关键词匹配等方法，其回答准确率和效率都比较低。近年来，随着深度学习技术的兴起，基于深度学习的问答系统取得了显著的进
基于深度学习的田间杂草检测系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成深度学习&目标检测实战项目深度学习 YOLO ui 人工智能目标检测
随着农业科技的发展，农作物的种植和管理越来越依赖于智能化技术。杂草作为农田生产中的一种主要竞争作物，会对农作物的生长造成负面影响。为了提高作物产量和品质，及时准确地检测和管理杂草显得尤为重要。本文将详细介绍如何构建一个基于深度学习的田间杂草检测系统，使用YOLO模型进行目标检测，包含数据集准备、模型训练、用户界面设计及系统实现。目录1.项目概述1.1背景1.2项目目标2.环境准备2.1软件需求2.
呼叫智能体：AI时代下的智能交互革命 MARS_AI_ 人工智能自然语言处理信息与通信 nlp
在人工智能技术高速发展的今天，呼叫智能体（CallAgent）正成为企业服务升级的核心引擎。它不仅是传统呼叫中心的智能化延伸，更是融合语音克隆、多语种交互、智能体编排等前沿技术的综合解决方案。本文将从技术原理、行业挑战、应用场景三个维度，解析这一突破性技术。一、呼叫智能体的核心技术栈声音克隆与TTS进化通过深度学习模型（如VITS、FastSpeech2），系统可克隆特定人声音色，结合大语言模型生
AI 外呼产品架构解读：让智能外呼更精准高效 MARS_AI_ 人工智能架构自然语言处理信息与通信
在人工智能（AI）技术迅猛发展的今天，AI外呼系统已成为呼叫中心领域的新宠。本文将剖析AI外呼产品的基本架构，帮助读者理解其背后的技术逻辑和应用价值。一、支撑能力层：AI外呼的基石AI外呼系统的底层架构，即支撑能力层，为整个系统提供了坚实的技术基础。这一层主要包括以下三个核心组成部分：1.AI基础能力AI基础能力涵盖了语音识别（ASR）、自然语言处理（NLP）和语音合成（TTS）等技术。这些技术使
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

表格识别技术综述

表格结构识别综述

ICDAR2019

ICDAR2021 竞赛

中国图象图形学报

PRCV 2021

腾讯

小米

2021论文

ICCV2021

ACM MM 2021

ICDAR 2021

2022 论文

ACM Multimedia 2022

CVPR 2022

2023 论文

参考文章

你可能感兴趣的:(深度学习,人工智能)