zhugeheihei

异构文档的表格检测

摘要：在文档图像中检测表是很重要的，因为不仅表包含重要信息，而且大多数布局分析方法在文档图像中存在表时都失败了。现有的表检测方法主要集中在检测单列文本中的表，在不同布局的文档上工作不可靠。本文提出了一种实用的表检测算法，该算法对不同布局的文档(公司报告、报纸文章、杂志页面等)具有较高的准确性。．该算法的开源实现作为Tesseract OCR引擎的一部分提供。该算法对公开的UNL V数据集的文档图像进行了评估，与商业OCR系统的表检测模块相比，显示出具有竞争力的性能。

关键词：页面分割、表格检测、文档分析

1、介绍

纸质文档自动转换为可编辑的电子表示依赖于光学字符识别(OCR)技术。一个典型的OCR系统包括三个主要步骤。首先，执行布局分析以定位文档图像中的文本行text-lines并确定其阅读顺序。然后，字符识别引擎处理文本行图像，并通过识别文本行图像中的单个字符生成文本字符串。最后，语言建模模块使用字典或语言模型对文本字符串进行更正。

由于布局分析是该过程的第一步，因此所有后续阶段都依赖于布局分析才能正确工作。布局分析面临的主要挑战之一是检测表区域。表检测是一个困难的问题，因为表的布局有很大的变化。现有的开源OCR系统缺乏表检测能力，其布局分析模块在存在表区域时失效。在这个阶段应该区分表检测和表识别[8]。表检测处理在页面图像中查找表边界的问题。另一方面，表识别侧重于通过查找所检测到的表的行和列来分析表，并试图提取表的结构。本文的重点是表检测问题。

表检测和识别的先驱工作之一是Kieninger等人[11,10,12]。他们开发了一种被称为T-Recs的表定位和结构提取系统。系统依赖于单词包围框作为输入。通过构建“分割图”，将这些词框以自底向上的方法聚为区域。如果满足一定的条件，则将这些区域指定为候选表区域。该方法的主要局限性是仅基于单词框，不能非常准确地处理多列布局。因此，它只适用于单列页面。

Wang等[20]对表检测问题采用了统计学习方法。给定一组候选文本行，将根据连续单词之间的间隙识别候选表行。然后，将具有大间距的垂直相邻行和水平相邻单词组合在一起，以生成表实体候选。最后，采用基于统计的学习算法对候选表进行优化，减少误报。他们假设最大栏数为2，设计了3种页面布局模板(单栏、双栏、混合栏)。他们应用列样式分类算法来找出页面的列布局，并将此信息作为发现表区域的先验知识。这种方法只能处理经过训练的那些布局。此外，训练算法需要大量的标记数据。

Hu等人[6]提出了一种从扫描的页面图像或纯文本文档中检测表的系统。他们的系统假设一个单列输入页面，可以很容易被分割成单独的文本行(例如通过水平投影)。然后，表检测问题被提出为一个优化问题，其中属于表的开始和结束文本行通过优化一些质量函数来识别。与以前的方法一样，这种技术不能应用于多列文档。

在[7]中，Hu等人在UW-III数据集[5]上使用地真区域信息(为每个地真区域确定它是否是表)评估了他们的表检测算法。这种评估是不实际的，因为将表划分为单个区域实际上是表检测系统中比较困难的部分。这更接近于文档区域分类的方向[21,9]，其目标是将每个分割的文档区域分配到一组预定义的类中(文本、数学、表格、半色调……)．

Cesarini等[2]提出了一种通过检测平行线来定位表区域的系统。以这种方式形成的表格假设，然后通过在平行线之间的区域中定位垂直线或空白来验证。但是，仅仅依靠水平线或垂直线进行表检测限制了系统的范围，因为不是所有的表都有这样的直线。最近在表检测方面的工作由Gatos等[4]和Costa e Silva[3]报道。Gatos等[4]专注于定位同时具有水平和垂直规则的表，并找到它们的交点。然后，通过绘制连接所有交点对的相应水平线和垂直线来实现表重构。该系统适用于目标文档，但当表的行/列没有被划线分隔时，就不能使用了。Costa e Silva[3]的工作重点是使用隐马尔可夫模型(hmm)从PDF文档中提取表区域。他们使用pdftotext Linux实用程序从PDF中提取文本。提取文本中的空格用于计算特征向量。显然，这种方法不适用于文档图像。

总结表检测技术的现状，我们可以看到现有方法的明显局限性。这些方法不能很好地处理多列文档图像。这可能是由于大多数现有的方法都集中在表识别上，以提取表的结构(行、列、单元格)，因此对表检测部分做了一些简化的假设。当必须处理一些具有简单布局的特定文档图像类时，这种方法非常有效。但是，在处理异构文档集合时，需要更健壮的表检测算法。在本文中，我们试图弥补这一差距。我们的目标是在复杂的异构文档(公司报告、期刊文章、报纸、杂志等)中准确地发现表区域。．一旦发现表区域，就可以使用现有的表识别技术之一(例如[10])来提取表的结构。

本文的其余部分组织如下。首先，我们在第2节中描述了Tesseract的布局分析模块[18,19]，它将被用作我们的表检测算法的基础。然后，我们的表检测算法在第3节中进行了说明。第4节介绍了用于评估系统的不同性能指标。第5节给出实验结果和讨论，第6节给出结论。

2、通过制表符停止检测进行布局分析

Tesseract的布局分析是开源OCR系统[19]的最新版本。它基于在文档图像中检测制表符停止的思想。在输入文档时，制表符是文本对齐的位置(左、右、中心、十进制……)．因此，制表符停止符可以作为文本块开始或结束位置的可靠指示。通过制表符停止检测来查找页面的布局，如下所示(参见图1):

首先，执行文档图像预处理步骤，以识别水平和垂直的标线或分隔符，并定位文档中的半色调或图像区域。然后，根据文本组件的大小和笔画宽度，执行连接组件分析以识别候选文本组件。
过滤后的文本组件被评估为位于制表符停止位置的候选文本。这些候选对象被分组到垂直的行中，以找到垂直对齐的制表符停止位置。作为最后一步，对连接的制表符行进行调整，使它们在相同的y坐标处结束(参见图1(a))。在此阶段，垂直制表行标记文本区域的开始和结束。
根据选项卡行，推断页面的列布局，并将连接的组件分组到column Partitions中。列分区是一个连接的组件序列，这些组件不跨越任何制表行，并且具有相同的类型(文本、图像……)．文本列分区可以视为文本行的初始候选(参见图1(b))。
最后一步创建列分区流，以便将相同类型的相邻列分区分组到同一个块中(图1(c))。具有不同字体大小和行间距的文本列分区被分组到不同的块中。然后，确定这些块的读取顺序。块的边界表示为等线多边形(所有边都平行于轴的多边形)。

3、发现表格

我们的表检测算法建立在布局分析模块的两个组件之上：1. 列分区2。列布局

列分区为我们提供了按类型分组的连接组件，这些组件不跨越制表符停止行。因此，文本列在文档中划分近似的文本行。半色调区域和水平黑线(规则)报告为“图像”和“水平线”类型的列分区。除了列分区之外，列布局还提供了特定列分区是完全位于一列内还是跨越多列的信息。如图2所示，在存在表区域时，列分区和列布局都可能给出错误的结果。

对存在表区域的布局分析结果的进一步分析显示了两种主要场景。在第一种情况下，表列被报告为页面列，从而破坏了页面的柱状结构。这种情况在表单元对齐得很好的情况下尤其会发生。对齐导致检测到大量的制表符停止，因此制表符行足够强，可以报告列的存在。因此，表中的每个单元格都报告为一个单列分区。在第二种情况下，由于单元格没有很好地对齐，系统会忽略表列。因此，可以正确识别页面的柱状结构。在这种情况下，列分区跨越表的不同列。这两种情况都在图2的示例图像中进行了说明。基于此分析，我们的表检测算法设计如下。

3.1识别表分区

我们的算法的第一步确定可以属于表区域的文本列分区，称为表分区。根据上一段中提到的观察结果，有三种类型的分区被标记为表分区:(1)在其连接的组件之间至少有一个大间隙的分区，(2)仅由一个单词组成的分区(组件之间没有明显的间隙) (3)沿y轴与同一列内其他分区重叠的分区。第一种情况标识了将表中不同列的单元格合并到一个分区中的表分区。第二种情况检测由单个数据单元组成的表分区。第三种情况标识位于一列中但由于存在强选项卡行而没有连接在一起的表分区。

这个阶段非常积极地尝试寻找表分区候选。这样做的好处是，即使很小的表存在的证据也不会丢失，因为在这个阶段丢失的任何表将无法在后面的阶段恢复。这种激进方法的缺点是可能会产生一些错误警报，例如单个单词的节标题、页眉和页脚、编号的方程、边缘噪声中的一小部分文本单词以及划线区域。平滑过滤器用于检测上面或下面没有其他表分区邻居的隔离表分区。这些分区将从候选表分区列表中删除。示例图像的候选表分区如图3(a)所示。

3.2 检测页列分割

下一步是检测由于表的存在而导致页面列布局中的分裂。当表的单元格非常好地对齐时，就会发生这种分裂。为了检测这种情况，我们将页面划分为列，并找出每列中表分区的比例。被错误地报告为页列的表列很容易被检测出来，因为与正常的文本分区相比，它们具有较高的表分区比例。然而，在这个阶段需要特别注意撤销列分割(即合并两列)，因为错误的决定会导致合并两个文本列，从而导致页面布局分析本身出现大量错误。因此，我们只在如下情况下撤消页列分割：出现了足够数量的跨越两列的文本分区并且列中的分割从表分区开始。

当页面中没有流动文本时，这种额外的注意可以防止合并全页表中的表列。

从布局分析错误的角度来看，错误决策的代价非常高，因此我们选择防御性地执行这一步。

3.3定位表格列

这一步的目标是将表分区分组到表列中。为此，将垂直相邻的表分区的运行分配给单个表列。如果遇到“水平规则”类型的列分区，则继续运行。当找到任何其他类型的分区时，到目前为止获得的表列就结束了。如果一个表列仅由一个表分区组成，则将其作为假警报删除。示例图像的标识表列如图3(b)所示。

3.4定位表区域

以上步骤中获取的表列可以很好地提示该区域中是否存在表。我们在这里做一个简单的假设:在单个页面列中，流动文本不与沿y轴的表共享空间。这一假设适用于我们在实践中遇到的大多数布局，因为如果一个表格与流动文本垂直共享空间，就很难看到文本是否属于表格。基于这个假设，我们水平地将表列的边界扩展到包含它们的页列。因此，我们为每个页列获得内入列表区域。

在此阶段，将正确识别在一列中布局的表。但是，跨多个页列的表是过度分段的。尽管如果相邻页列中的两个表区域的开始位置和结束位置对齐，则可以合并它们，但这可能会错误地合并这两列中的不同表。因此，只有当至少有一个任何类型的列分区（文字、表、水平线）被发现与两个表重叠时，才执行合并。没有包含在任何表中并且在x轴上有较大重叠的表区域的正上方或正下方的表分区和水平规则分区也包含在相邻表中。由此为示例图像获得的表区域如图3(c)所示。

3.5消除虚假告警

虽然在之前的阶段中，大部分来自正常文本区域的假警报已经被删除，但其他假警报来源，如边缘噪声[17]和数字仍然存在。

因此，标识的表区域将通过一个简单的有效性测试:一个有效的表应该至少有两列。由单列组成的假警报通过分析它们在x轴上的投影来去除。有效表在x轴上的投影应该至少有一个零谷值大于页面的全局x高度中值。因此，在其垂直投影中没有零谷的候选表将被删除。

4. 性能指标

文献中已经报道了用于评估表检测算法的不同性能指标。这些范围从简单的基于精度和召回的措施[6,13]到更复杂的措施，如检测表结构提取是否完整的算法[8]。在本文中，由于我们只关注表发现，所以我们使用标准措施来进行文档图像分割，重点关注表区域。因此，根据[13,14,16,20]，我们使用几个度量来定量评估我们的表发现算法的不同方面。

我们的算法检测到的表和ground-truth/真实表都由它们的包围框表示。设Gi代表文档图像中第i个ground-truth表的包围框，Dj代表文档图像中第j个检测到的表的包围框。两者之间的重叠量定义为:

其中，分子的交集表示两个区域的交的面积，|Gi|， |Dj|代表ground-truth和检测表的个别区域。区域重叠A的数量将在0到1之间变化，这取决于地面真实表Gi和检测表Dj之间的重叠。如果两个表完全不重叠A = 0，并且如果两个表完全匹配，即|Gi∩Dj| = |Gi| = |Dj|，则A = 1。

1. 正确检测:这些是与检测到的表之一有较大重叠(a≥0.9)的ground-truth/有效正确的表的数量。
2. 部分检测:这些是与被检测表一一对应的真实表的数量，但是重叠的数量不够大(0.1 < a < 0.9)，不能被归类为正确的检测(见图4(a))。
3. 过分段表:这些是与多个检测到的表有主要重叠(0.1 < a < 0.9)的基本真实表的数量。这表明，ground-truth表的不同部分被检测为单独的表(参见图4(b))。
4. 分段下表(Under-Segmented Tables):这些是与一个检测到的表有主要重叠(0.1 < a < 0.9)的ground-truth表的数量，但相应的检测到的表也与其他groundtruth表有主要重叠。这表明检测算法合并了多个表(可能相邻)，并将其报告为单个表(参见图4(c))。
5. 缺失表:这些是与任何检测到的表没有主要重叠的groundtruth表的数量(a≤0.1)。这些表被检测算法视为漏检。
6. 假阳性检测:这些是检测到的表的数量，这些表与任何基本真相表都没有重大重叠(a≤0.1)。这些表被认为是假阳性检测，因为系统将一些非表区域误认为是表(参见图4(d))。
7. 区域精度:虽然上面定义的度量有助于理解表检测算法产生了哪些类型的错误，但该度量的目标是通过测量被检测到的表区域实际上属于groundtruth图像中的表区域的百分比来总结算法的性能。当对表区域的存在做出非常保守的决定时，可以获得很高的精度。
8. 区域召回(Area Recall):该测量方法评估了由算法标记为属于一个表的ground-truth表区域的百分比。精度和召回度量的概念类似于它们在信息检索社区[13]中的使用。

5、试验和结果

为了评估我们的表检测算法的性能，我们选择了UNL V数据集[1]。UNL V数据集包含各种各样的文件，从技术报告和商业信件到报纸和杂志。该数据集专门用于分析UNLV年度OCR精度[15]测试中领先的商业OCR系统的性能。它包含10,000多张不同分辨率的扫描页和1000份传真文件。扫描的页面分为双色调文档和灰度文档。双色调文档再次分组为不同的扫描分辨率(200、300和400 dpi)。对于每一页，都提供了手动键入的ground-truth文本，以及手动确定的区域信息。区域根据其内容(文本、表格、半色调等)进一步标记。．我们在实验中选择了300 dpi类的双色调文档，因为这代表了扫描文档的最常见设置。在这些图像中，有427个包含表区域的页面被选中。这些页面图像被进一步分为213张图像的训练集和214张图像的测试集。在算法的开发中使用了训练图像，并在这些图像上对算法的不同步骤进行了广泛的评估。最后用测试图像对整个系统进行了评价。

我们的表检测算法对来自UNLV数据集的一些样本图像的结果如图5所示。表1和图6给出了该算法的详细评估及其与最先进的商用OCR系统的比较。应该注意的是，UNLV数据集提供的地面真相表区域还包括区域内的表标题。由于表标题不是一个表格结构，它被所有OCR系统排除在表之外。因此，我们通过手动标记所有文档中的表标题区域来编辑ground-truth信息。然后将该区域从数据集提供的ground-truth表区域中排除。这是通过缩小ground-truth表区域来紧紧包围所有不属于表标题的前景像素来实现的。实验结果表明，该系统能够在测试数据上识别出86%的表区域。召回率也相当高(79%)，显示出精度和召回率之间的良好妥协。另一方面，商用OCR系统的召回率较低(37%)，但精度较高(96%)。

我们的算法所产生的一些错误如图4所示。对结果的分析表明，错误的主要来源是整页的表格。在这些情况下，列查找算法报告几列文本。由于报纸也有几个文本栏，不使用关于文件类型的先验知识(报告，报纸，…)很难检测到大量的列是由于整页表造成的。一个典型的例子是包含“目录”的页面。这些页面被标记为UNL V数据集提供的基本真实信息中的表区域。然而，我们的算法将它们视为常规文本页面，因此要么完全丢失这些“表”，要么部分检测到它们。

分析了该算法的假阳性检测结果。我们注意到我们算法的一个有趣的副作用。由于许多图形区域内的文本是间隔的，因此这些区域也被标记为表格。尽管这样的情况被报告为错误警报，但在某些情况下，额外发现图形区域也可能是有益的。其他虚假警报的情况源于表格方程。在纯文本区域，假警报相当罕见。

6、结论

本文提出了一种表检测算法，作为Tesseract开源OCR系统的一部分。所提出的算法使用Tesseract的布局分析模块的组件来定位具有各种布局的文档中的表。对来自UNLV数据集的不同类别的文档(公司报告、期刊文章、报纸文章、杂志页面)的实验结果表明，我们的表检测算法与商业OCR系统相比具有更高的召回率和略低的精度。我们计划在未来将这项工作扩展到表结构提取的方向。

如何在编辑器wangEditor中完美复制粘贴WORD内容？ M_Snow 编辑器 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
网页版wangEditor如何实现WORD图片的高效粘贴？ M_Snow word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word ueditor导入pdf
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
C++11 lambda 顾小玙 c++开发语言
前言在Cpp11以前，为了把函数当作对象调用，可以使用C中的函数指针类型，也可以使用Cpp98的仿函数。但二者都不是很好用，函数指针return_type(*name)(parameters)的长相就令人望而却步，仿函数将一个函数重载为一个类的operator()的方式又沉重麻烦。C++11中做出了(抄Python的)更灵活、轻便的lambda表达式。lambda表达式lambda表达式是一个匿名
机器学习中的数学：数学建模常用知识点-1 数字化与智能化机器学习中的数学机器学习凸函数泰勒公式 Jensen 不等式
一、凸函数1、凸函数讲解设函数f(x)是定义在区间X上的函数，若对于区间上任意两点x1、x2和任意实数��∈(0,1)，总有如下表达式成立：则称为f(x)是X上的凸函数；反之，如果下式成立：则称为f(x)在X上的凹函数。如图所示：Python实现凸函数：importnumpyasnpimportmatplotlib.pyplotasplt#定义凸函数defconvex_function(x):re
2025年AI编程工具推荐小猴崽 AI编程 AI编程 ai编程
以下基于2025年权威技术报告、开发者社区评测及厂商白皮书，对当前主流AI编程工具进行客观综述与推荐。数据来源包括IDC《2025中国生态告》、信通院《AI辅助编程技术成熟度评》、StackOverflow开发者调查及头部企业实测案例。一、国际主流AI编程工具GitHubCopilotX核心能力：基于GPT-4模型升级，支持37种编程语言（Python/Java/JS等），可解析数万行代码库的全局
【学习】《算法图解》第七章学习笔记：树程序员
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
python里面的单引号，双引号以及三引号的介绍 scuter_yu python python 单引号双引号以及三引号
第一次在csdn上写博客，内心有点小激动。该怎么表达我此刻的心情呢？哎呀，让我来唱一首《小苹果》吧。“你是我的小呀小苹果……balabala”！好啦，疯言疯语过后还是赶快进入主题吧。我今天要讲得是python里面的单引号（‘’），双引号（“”）以及三引号（“““”””）的区别。相信刚接触的python的朋友都会遇到这样的一个困惑，就是对单引号（‘’），双引号（“”）以及三引号（“““”””）的使用
智能体综述和参考资料整理木鱼时刻大模型人工智能
目录总体介绍核心组件记忆系统工具系统计划与推理开发框架Single-AgentMulti-Agent智能体平台技术实现通信协议角色系统对话记忆MCP协议参考链接总体介绍智能体（AIAgents）是人工智能领域的重要发展方向，它们能够通过传感器感知环境并通过执行器对环境采取行动。根据罗素和诺维格在《人工智能：一种现代方法》（2016年）中的定义，AIAgent是任何可以通过传感器感知其环境并通过执行
主流AI代码编程工具分享 scuter_yu ai ai编程
在当今数字化时代，AI代码编程工具已成为提升开发效率、优化代码质量的重要助手。这些工具利用人工智能技术，为开发者提供从代码生成、补全到调试、优化等一系列功能，极大地简化了编程流程，让编程变得更加高效、便捷和智能。以下将介绍几款热门的AI代码编程工具。通义灵码产品介绍：通义灵码是阿里云出品的基于通义大模型的智能编程辅助工具，提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成
【python】pip 国内镜像源叶阿猪 python python pip 开发语言
使用pip下载安装python第三方库的时候，经常会很慢，甚至报错。如下：pip._vendor.urllib3.exceptions.ReadTimeoutError:HTTPSConnectionPool(host='f而使用Python的镜像源（也称为国内安装源或PyPI镜像源）可以提高Python包（如numpy、pandas等）的安装速度和稳定性。Python的镜像源是在国内设置的代理服
Deepoc大模型在半导体技术芯片性能应用协助突破物理极限 Deepoch 人工智能网络智能化 AI 科技数据分析硬件工程信息与通信
半导体垂直大模型在芯片设计中的应用与技术突破半导体垂直大模型（SemiconductorVerticalLLM）是专为芯片设计、制造与优化领域训练的大规模人工智能模型，其通过融合半导体物理、工艺知识、设计规则及行业经验，正在重构芯片开发全流程。以下从设计流程革新、性能优化、可靠性提升三大维度，结合具体技术路径与行业案例，解析其应用场景与价值。Deepoc模型在半导体技术应用中取得了巨大突破，可以协
接口自动化测试（Python+pytest+PyMySQL+Jenkins）万能程序员-传康Kk python pytest jenkins
接口自动化测试一个完整的企业级接口自动化测试解决方案目录项目介绍技术架构功能特性项目结构环境要求安装部署使用方法测试用例说明预期结果报告系统配置说明数据库设计Jenkins集成常见问题项目亮点扩展指南联系方式项目介绍项目背景接口自动化测试作为现代软件开发流程的核心环节，已成为保障系统质量、提升交付效率的关键手段。本项目基于Python技术栈，构建了一套完整的接口自动化测试解决方案，旨在为开发团队提
如何获取Swift变量的内存内容?如何理解Swift的if let语句?如何理解Swift “case let xxx:“?Swift可以像Python一样在定义变量时省略var或者let?
目录如何获取Swift变量的内存内容?如何理解Swift的iflet语句?如何理解Swift"caseletxxx:"?如何理解Swift"case10...20=a"这种条件表达式?Swift可以像Python一样在定义变量时省略var或者let?Swift结构体或枚举mutating的本质为什么Swift枚举变量前面可以加符号"."?Swift权限控制如何获取Swift变量的内存内容?可使用M
Apache POI导入导出excel文件实战小白de成长之路 Java相关 apache excel 前端
文章目录前言技术栈1、引入依赖2、导入代码实现3、导出代码实现3.1、准备导出文件模板3.2、导出代码实现4、代码实现解释5、常见问题前言这两天公司项目业务提出需求，要求在前端上传excel文件然后解析展示，因此写篇文章记录一下实现。技术栈springboot2.6.61、引入依赖maven格式：org.apache.poipoi3.14org.apache.poipoi-ooxml3.142、导
卷积神经网络亿只小灿灿 Python 算法与数据结构人工智能 cnn 人工智能神经网络
一、引言在当今人工智能的浪潮中，卷积神经网络（ConvolutionalNeuralNetwork，CNN）无疑是一颗璀璨的明星。它在图像识别、语音处理、自然语言处理等众多领域取得了巨大的成功，极大地推动了人工智能技术的发展。那么，什么是卷积神经网络？它的算法原理是什么？本文将深入探讨这些问题，并通过Python代码实现一个简单的卷积神经网络，以帮助读者更好地理解和掌握这一强大的技术。二、卷积神经
【鸿蒙开发】ArkUI滚动类组件-Scroll、Scroller 胡辰和鸿蒙开发 HarmonyOS 移动开发 harmonyos 鸿蒙开发 ArkUI 组件化容器移动开发 Scroll
鸿蒙开发往期学习笔录：鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……Scroll作为可滚动的容器类组件，它最多包含一个子组件，当子组件的布局尺寸在指定的
腾讯社招前端面经（成都）
本人经验是1.8年，拉钩投递，分享面经用于学习，大家可供参考~面试流程电话面同事面组长面部长面电话面首先会接到一个面试官的电话，问一些简单的问题，简单确认是否水平真实，没有录音，记不到什么了~过了才有线下面试机会(网上说这个只是来简单判断简历是否有水分，所以如果经历正常下能过滴～)。自我介绍上家公司业务、规模项目中遇到的最大挑战react与vue的区别离职原因同事面电话面过了的话，差不多三个工作日
Python pdfminer.six库【PDF解析库】全面使用指南老胖闲聊 Python库大全 python pdf 开发语言
想全面了解DeepSeek的看过来【包邮】DeepSeek全攻略人人需要的AI通识课零基础掌握DeepSeek的实用操作手册指南【限量作者亲笔签名版售完即止】玩转DeepSeek这本就够了【自营包邮】DeepSeek实战指南deepseek从入门到精通实用操作指南现代科技科普读物AI普及知识读物人工智能使用教程中小学读物京东超级618Python初学者的入门教程动手学深度学习PyTorch版李沐和
AI教学应用作业多元化和教师批改多样化蹦跑的蜗牛 AI 人工智能 ai
AI教学应用作业多元化和教师批改多样化目标是解决「作业形式多样化+教师批改压力大+教学反馈个性化不足」的问题一、需求大学生的作业和高中完全不一样，比如：作业类型多：可能是论文/实验报告（文字类）、Python代码（编程类）、电路仿真图（图片类）、小组调研视频（视频类）、甚至社会调查的问卷数据（表格类）。教师批改难：比如一篇5000字的论文，老师要检查逻辑、查重、给修改建议；一份代码作业要跑通测试、
《Python之禅》：优雅代码的哲学指南郝学胜-神的一滴 Python python 开发语言
Python不仅仅是一门编程语言，它更像是一种编程哲学的体现。而这份哲学的精髓，就藏在一句简单的代码中：importthis运行这段代码，你会看到一段充满诗意的“代码准则”——《Python之禅》（TheZenofPython）。它由Python之父GuidovanRossum的同事TimPeters编写，用19条简洁的格言，定义了Python语言的设计理念和开发者应遵循的编码哲学。《Python
HCCDA – AI华为云人工智能开发者认证-60道单选题题库及答案_华为人工智能入门级开发者认证题库 2401_89172925 人工智能华为云华为
单选题及答案AI模型的评测指标主要分为精度指标和性能指标，以下哪一项不属于常用的性能指标？A.FPS(FramesPerSecond)B.FLOPs(Floating-pointOperationsPerSecond)C.aPs（QueryPerSecond）D．F1值Mask＿Detection技能模板提供了口罩检测技能，针对每个人，若没有检测到人脸，也没有检测到口罩，则会显示什么信息？A.No
esp32 支持 sd卡 micropython 文件系统_ESP32 / ESP8266 MicroPython教程：读取文件 weixin_39891317 esp32 支持 sd卡 micropython 文件系统
原标题：ESP32/ESP8266MicroPython教程：读取文件引言本篇ESP32/ESP8266MicroPython教程主要说明如何从MicroPython的文件系统中读取一个文件。本教程在esp32和esp8266上进行了测试。通常我会使用Putty与MicroPython命令行界面进行交互。但是为了演示，我在本篇教程中会使用ArduinoSerialMonitor与设备进行交互。因为
AttributeError: module ‘distutils‘ has no attribute ‘version‘ 一只小狐狸坐在沙丘上深度学习人工智能
问题描述run(unidexgrasp)tianyu@tianyu:~/UniDexGrasp/dexgrasp_generation$python./network/train.py--config-nameipdf_config--exp-dir./ipdf_trainError:Traceback(mostrecentcalllast):File"./network/train.py",li
Agent-to-Agent (A2A) 协议全面解析：定义、原理、应用与未来 C7211BA a2a llm mcp
Agent-to-Agent(A2A)协议全面解析：定义、原理、应用与未来在人工智能技术迅猛发展的今天，AI智能体(Agent)正从独立运作向协同工作演进，而Agent-to-Agent(A2A)协议作为这一转变的关键基础设施，正在重塑AI生态系统的协作方式。本文将从A2A协议的基本定义出发，深入剖析其设计原则、核心机制、技术实现、与MCP协议的对比关系、安全考量以及实际应用场景，帮助读者全面理解
软件测试进阶：Python 高级特性与数据库优化（第二阶段 Day6） study软测数据库 python sql
在掌握SQL复杂查询和Python数据库基础操作后，第六天将深入探索Python高级编程特性与数据库性能优化。通过掌握Python的模块与包管理、装饰器等高级语法，结合数据库索引优化、慢查询分析等技术，提升测试工具开发与数据处理效率。一、Python高级编程：模块、包与装饰器1.模块与包的使用模块导入：将代码拆分到不同.py文件中，通过import实现复用#自定义模块my_module.pydef
C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
【5分钟力扣】1160.拼写单词（python3实现）金鞍少年金鞍少年的刷题之路字符串 leetcode 力扣1160题 python拼写单词
文章目录一、前言二、题目三、哈希表解法3.1哈希表基本概念3.2解题思路3.3代码实例四、字符串比较解法4.1解题思路4.2代码实例一、前言如果放弃太早，你永远都不知道自己会错过什么。每天五分钟，看懂一道简单、中等难度的算法题，尽可能将复杂的题讲清楚。疯狂学习python中，2020-07-20更新二、题目给你一份『词汇表』（字符串数组）words和一张『字母表』（字符串）chars。假如你可以用
前端进阶之路-从传统前端到VUE-JS（第一期-VUE-JS环境配置）（Node-JS环境配置）（Node-JS/npm换源）恰薯条的屑海鸥前端 vue.js vue入门 vue vue框架 node.js nodejs配置
经过前面的传统前端开发学习后，我们接下来进行前端的VUE-JS框架学习（写这篇文章的时候VUE-JS最新版是VUE3，所以默认为VUE3即可）首先，我们要配置Node-JS环境，虽然我们还不学习Node-JS但是Node-JS可以快速配置我们的VUE-JS框架，所以本期内容主要以Node-JS环境配置为主Node-JS下载官网：https://nodejs.cn/en/downloadhttps:
人工智能中的知识图谱与向量数据库：选择与应用指南 AI Agent首席体验官人工智能知识图谱数据库
1.人工智能领域，知识图谱是什么？知识图谱是人工智能和语义网领域的一个重要概念，它是一种结构化的知识表示方法，用于存储实体之间的语义关系。知识图谱基本上是由节点（实体）和边（关系）组成的图结构：节点：代表现实世界中的实体或概念，如人物、地点、组织等边：代表实体间的语义关系，如"出生于"、“工作于”、"创立了"等知识图谱的主要特点和应用包括：语义网络表示：以三元组形式（主体-关系-客体）存储知识，如
Python包管理之Protry的基本使用菜鸟级后端 python linux 开发语言
一，Poetry是什么Poetry是Python生态中一款革命性的依赖管理与项目打包工具，它通过现代化的设计理念解决了传统工具（如pip+virtualenv）在项目管理中的诸多痛点，比pip的功能强大许多。核心功能如下：1，智能依赖管理Poetry采用pyproject.toml文件统一管理项目元数据、依赖声明及构建配置，通过poetryadd命令即可自动解析依赖树并安装精确版本，避免版本冲突（
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

异构文档的表格检测

你可能感兴趣的:(人工智能,python,前端)