sinat_38007523

[博士论文]基于图数据的可信赖机器学习

密歇根大学

Towards Trustworthy Machine Learning on Graph Data

https://deepblue.lib.umich.edu/handle/2027.42/174201

摘要

机器学习已经被应用于越来越多影响我们日常生活的与社会相关的场景，从社交媒体和电子商务到自动驾驶汽车和刑事司法。因此，为了避免对个人和社会的负面影响，开发可靠的机器学习方法至关重要。在本文中，我们关注理解和提高图机学习的可信度，这由于图数据的复杂关系结构提出了独特的挑战。

特别地，我们认为机器学习模型的可信性在异常情况下是可靠的。例如，机器学习模型在对抗攻击下或在子种群上的性能不应严重退化，分别对应对抗鲁棒性或公平性问题。值得信任的图机器学习的独特挑战是，在图数据的上下文中有许多更复杂的，有时是隐式的异常条件。本文识别了未充分挖掘的异常情况，理解了识别出的异常情况下的预期模型行为，并改进了现有模型在此类异常情况下的行为。

重点关注图神经网络(GNN)，这是一类流行的图机器学习模型，利用了深度学习的最新进展。本文确定了图神经网络的三种异常情况。首先，受社交网络应用场景启发，通过一个新的实际威胁模型研究了GNN的对抗鲁棒性，并研究了GNN何时以及为什么会遭受对抗攻击。发现现有的GNN对许多现实世界的图数据可能会被错误指定，并开发了一个新的框架来改进现有的模型。发现了一种与节点结构位置相关的测试节点子种群之间的GNN预测的不公平性。本文还提出了一种主动学习框架来缓解不公平问题。

第一章引言

人工智能(AI)，特别是机器学习(ML)，已经作为一种通用技术融入人类社会，有望在许多方面重塑我们的日常生活，从社交媒体和电子商务，到自动驾驶汽车和刑事司法。然而，尽管AI和ML带来了巨大的经验成功和商业价值，但要更广泛地部署这些技术，需要更好地理解ML模型对社会的影响。因此，可信的ML成为了一个越来越受欢迎的研究方向。Trustworthy ML是一个概括性的概念，包括关于ML可靠性和透明度的各种主题，如公平性、鲁棒性、可解释性等。

例如，机器学习模型可能在特定子种群上的系统表现较差，这导致了公平性问题。因此，对机器学习公平性的研究兴趣迅速增加。也有现实世界的ML应用程序证明了偏见和不公平:亚马逊的人工智能招聘工具被发现具有性别偏见[37];一种曾经广泛使用的犯罪预测工具，矫正罪犯管理分析替代制裁(COMPAS)，被发现具有种族偏见[4]。另一个例子是，ML模型已被证明对添加到数据中的小的对抗性扰动很敏感，因此容易受到对抗性攻击[136]。例如，最先进的计算机视觉模型可能通过停车标志[45]上看似随机的涂鸦，将停车标志识别为限速标志。

由于相关主题的多样性和我们对可信机器学习的科学理解的文献历史，社区自然发展出了一套相对被广泛接受的可信性问题的概念类别，包括但不限于公平性、鲁棒性、安全性、隐私、可问责性、可解释性和因果性。虽然这种概念分类，像任何分类系统一样，有助于简化对该领域的理解，但有时也会产生误导。

首先，这种分类可以使可信机器学习的不同问题被视为孤立的主题。然而，这些不同的可信性问题可能相互冲突或相关。例如，在某些隐私和公平概念之间存在固有的冲突[32,24]。另一方面，公平性也可以与域外泛化相关[99]。此外，可解释的ML[41]和因果推理[113]可以成为一些公平性或鲁棒性问题的候选解决方案。一个扁平的概念类别分类方法无法捕捉不同主题之间丰富的相互关系。

其次，这种分类倾向于为每个主题寻找过度通用的解决方案，这可能不是解决可信机器学习问题的最佳方法。由于主题的概念性质，通常有各种直观合理的方法来将可信性概念(例如，公平性或鲁棒性)形式化为定量概念，而同时实现所有概念的可信性是不现实的。例如，Kleinberg等人[78]证明，通常不可能有一种算法同时满足三个常见的公平标准。因此，没有一个通用的解决方案是所有应用的万能药。此外，不同的可信性问题的重要性和恰当表述是高度特定于应用程序的。就可信性不同方面的重要性而言，例如，自动驾驶汽车可能会遭受对抗性攻击，因为它在野生[45]中接受数据输入;相比之下，对电子健康记录(EHR)数据进行对抗性攻击实际上要困难得多，因为这些数据由授权的医疗专家生成，并且在封闭的系统中循环。另一方面，EHR数据的隐私标准远高于驾驶数据。在可信性的正确制定方面，研究表明，制定的选择应该利用利益相关者在具体应用[28]中的感知。总的来说，应该将可信性作为位于特定类型的应用程序场景中的ML技术的属性来研究，而不是作为通用ML技术的属性。

许多现有的可信性概念可以按照这个程序重新制定。例如，机器学习模型的不公平性问题往往是由于它们在特定少数子种群上的性能下降，而与它们在多数子种群上的性能相比。机器学习的对抗漏洞是指与在干净数据上的性能相比，它们在对抗攻击下的性能下降。另一方面，其他一些可信性概念，如可解释性或因果关系，不能通过上述过程直接表述。在某种程度上，不公平或不鲁棒的模型将产生直接后果，而可解释性或因果关系可以被视为缓解问题的候选解决方案(例如，不公平或不鲁棒)。上述过程关注的是作为问题而不是解决方案的可信性概念。这个过程还强调应用场景的可信性问题。

为约束特定应用场景下的可信范围，本文对图机器学习(GML)的可信性进行了研究。现实世界的数据中存在大量的关系结构，通常以图的形式表示。例如，社交媒体上的用户或物联网系统中的传感器通过图结构进行连接。如果在预测任务中使用得当，这种关系图结构可以提供显著的预测能力。GML是一个流行的机器学习技术家族，它将图结构用于预测模型。近年来，GML在许多影响人们日常生活的应用中表现出了优异的性能。举个常见的例子，GML在Uber Eats[65]、亚马逊[162]和Pinterest[157]的工业推荐系统中发挥着重要作用;GML还被广泛用于在谷歌Map[38]中的ETA预测或房地产价格估计等任务中对地理数据进行建模[114]。此外，由于关系结构的普遍性，GML方法已经应用于或准备应用于高利害攸关的决策问题，如社会正义。例如犯罪预测和数据驱动的起诉[68,156]，警察不当行为预测[22]，假释决定的风险评估[132]，公共安全监视[95]，以及许多其他社会公正和安全问题[111]。

鉴于GML的众多社会相关应用场景，这类ML系统的可信性问题变得至关重要。此外，与传统的ML相比，由于GML复杂的关系结构，在理解和改进GML的可信性问题方面存在独特的挑战。特别是，在GML的上下文中，有许多更复杂，有时甚至是隐式的异常条件。以对抗性攻击为例，在传统的机器学习设置中，攻击者大多通过向输入特征添加对抗性扰动来进行攻击。对于GML，在实际应用中存在着更复杂的威胁:攻击者不仅可以扰动GML节点属性，还可以扰动图结构;攻击者还可以通过扰动邻居节点来间接影响节点的预测结果。在子种群之间的机器学习公平性方面，大多数传统文献研究的是有关某些敏感属性的子种群，如性别或种族。在图数据中，人们可以根据图结构来调查子群体，例如节点中心性[12,13]或社区结构[51,47]。社会科学理论认为，社会网络中人们的结构特征往往与其社会经济地位相关[53,16]。图数据中独特的对抗性威胁和基于结构的子群呈现出在传统ML文献中没有充分探索的例外情况，使可信的GML更具挑战性。

本文旨在解决这些对理解和提高GML可信性的独特挑战。具体而言，本文旨在回答以下3类研究问题，并在3种应用场景下展示研究方法。

1. GML模型在实际应用场景中可能遇到的潜在异常情况是什么?

2. 在确定的异常条件下，GML模型的预期行为是什么?

3.在识别出的异常情况下，如何缓解GML模型的性能差异?

在GML方法中，我们关注图神经网络(GNN)[52,124,77]，这是一个大的趋势GML模型家族，将深度学习[83]的最新进展利用到GML中，并在许多真实世界的应用程序中显示出卓越的性能。

第二章前期工作

第三章对图神经网络的实际对抗攻击

图神经网络（GNNs）[151]，图上的深度学习模型家族，在机器学习对图数据的各种应用中显示出了良好的经验性能，如推荐系统[157]、社会网络分析[85]和药物发现[131]。与其他深度学习模型一样，gnn也被证明在对抗性攻击[169]下是脆弱的，这最近吸引了越来越多的研究兴趣[70]。事实上，对抗性攻击已经成为分析图神经网络的理论性质和实际责任的有效工具。由于图形数据比图像或文本数据具有更复杂的结构，研究人员提出了不同的对抗性攻击设置。例如，有不同的任务（节点分类和图分类）、攻击者的知识假设（白盒、灰盒和黑盒）、策略（节点特征修改和图结构修改），以及相应的预算或其他约束（特征变化的规范或边缘变化的数量）。尽管进行了这些研究，但在攻击性的设置和现实之间仍然有相当大的差距。假设攻击者可以改变大量节点的输入是不合理的，即使存在预算限制，假设他们可以按照自己的意愿攻击任何节点也是不合理的。例如，在现实世界的社交网络中，攻击者通常只能访问几个机器人账户，而且他们不太可能是网络中的顶级节点之一；攻击者很难入侵和改变名人账户的属性。此外，攻击者通常对平台所使用的底层机器学习模型的知识有限（例如，他们可能大致知道使用了什么类型的模型，但无法访问模型参数或训练标签）。基于真实的攻击场景，本章研究了一种新型的黑盒对抗性攻击，该攻击更有限、更现实，假设攻击者无法访问模型参数或预测。我们的设置不同于现有的工作，在节点访问方面有一个新的约束，即攻击者只能访问图中的一个节点子集，并且他们只能操作少量的

提出的黑盒对抗攻击需要两步步骤： 1)在节点访问的限制下选择小子节点进行攻击；2)在每个节点预算下改变节点属性或边。在本章中，我们将重点关注第一步，并研究节点选择策略。该策略的关键观点在于，在没有访问GNN参数或预测的情况下，GNN模型的强结构诱导偏差可以作为一种有效的攻击信息源。由各种神经结构（如卷积神经网络中的卷积核）编码的结构归纳偏差在深度学习模型的成功中发挥着重要作用。由于图结构和重权重共享设计，gnn具有更明确的结构归纳偏差。理论分析表明，对结构归纳偏差的理解可以导致更好地设计GNN模型[153,79].从一个新的角度来看，我们的工作表明，这种结构性归纳偏差可以在黑盒攻击中变成安全问题，因为图的结构通常暴露给攻击者。

据此，我们推导了一个节点选择策略，并对所提出的黑箱攻击设置进行了正式分析。通过利用gnn的反向传播和随机游动之间的联系，我们首先将白盒攻击中的梯度范数推广到一个类似于PageRank的模型无关的重要性得分。在实际应用中，攻击重要性得分较高的节点会显著增加分类损失，但对误分类率不会产生相同的影响。我们的理论和实证分析表明，这种差异是由于错误分类率的收益递减效应。我们进一步提出了一种计算重要性分数的贪婪修正程序。在三个真实世界的基准数据集和流行的GNN模型上的实验表明，所提出的攻击策略明显优于基线方法。我们总结了我们的主要贡献如下：

1.我们提出了一种新的黑盒攻击的设置，与现有的工作相比，这是迄今为止最受限制和现实的。

2.我们证明了gnn的结构诱导偏差可以作为黑盒对抗性攻击的有效信息源。

3.我们分析了分类损失和错误分类率之间的差异，并提出了一种实用的节点分类任务的贪婪对抗攻击方法。

4.我们在使用流行的GNN模型的三个基准数据集上验证了该方法的有效性。

第四章图在图神经网络中的表征和相关作用

图作为存储丰富关系信息的灵活数据表示，在数据科学任务中常用。在图[23]上的机器学习方法，特别是图神经网络（GNNs），已经引起了研究界越来越多的兴趣。它们被广泛应用于推荐系统[157]、社交网络分析[85]、交通预测[158]等现实问题。在异构类型的图结构数据中，值得注意的是，图通常在不同的上下文、不同的数据集和不同的任务中发挥不同的角色。有些角色是关系的，因为图可能表示连接观察的某些统计关系；有些是表征的，因为图的拓扑结构可能编码数据的重要特征/模式；有些甚至是因果关系，因为图可能反映了领域专家指定的因果关系。

为了正确地利用图结构数据中的信号，识别图的不同作用是至关重要的。在本章中，我们将在节点级的环境中区分图的表征作用和相关作用（半）监督学习，我们研究如何设计更好的gnn，利用这两种角色。

在节点级预测任务中，数据中观察到的图可能以多种方式与感兴趣的结果（例如，节点标签）相关联。从概念上讲，如果可以利用图来构造更好的特征表示，我们就认为图具有表征作用。例如，在社交网络分析中，从朋友那里聚集用户特征通常是有用的（多亏了众所周知的同质性现象[104]）。此外，用户的本地网络的结构属性，例如结构多样性[140]和结构孔[17,93]，通常为预测该用户的某些结果提供了有用的信息。另一方面，有时一个图直接编码了连接节点的结果之间的相关性，我们称之为扮演相关性的作用。例如，超链接的网页很可能被一起访问，即使它们有不同的内容。在时空预测中，基于所有特征，附近位置的结果可能仍然是相关的。

虽然在图形结构数据中，表征和相关角色都很常见，但我们发现，通过模拟研究，许多现有的GNN模型无法利用图中编码的相关信息。具体来说，我们设计了一个用于节点级回归的合成数据集。节点级的结果来自于多元正态分布，以均值和协方差作为图的函数，分别反映表征和相关的作用。我们发现，当图只提供节点结果的相关信息时，许多流行的GNN模型都不如一个根本不考虑图的多层感知器运行。

为了缓解gnn的这一缺陷，我们提出了一个有原则的解决方案——连接图神经网络（CopulaGNN），它可以以广泛的gnn作为基础模型，提高其建模相关图信息的能力。

该方法的关键观点是，通过将节点结果的联合分布分解为边缘密度和连接密度的乘积，可以将表征信息和相关信息分别建模。前者通过基GNN的边缘密度建模，后者通过高斯连接建模。该方法还易于扩展到各种类型的节点结果变量，包括连续变量、离散计数变量，甚至是混合类型的变量。我们分别用正态边际分布实例化正态边际分布和泊松边际分布的CopulaGNN用于连续和计数回归任务。我们还实现了两种类型的两种类型的连接参数化。

我们评估所提出的方法在连续和计数回归的合成和真实数据任务。实验结果表明，当数据中的图同时表现出相关和表征作用时，连接的GNN显著优于其对应的基本GNN。我们总结了我们的主要贡献如下：

1.我们提出了区分图所扮演的两个角色的问题，并证明了当许多现有的gnn扮演纯粹的相关角色时，它不能利用图信息。

2.我们提出了一个有原则的解决方案，CopulaGNN，来整合图的表征和相关作用。

3.我们证明了基本gnn在半监督回归任务上的有效性。

第五章图神经网络的推广与公平性

图神经网络（GNNs）[52,124,77]是一组机器学习模型，可以用于以一种灵活的方式建模非欧几里得数据以及相互相关的样本。近年来，gnn在药物发现[69]、计算机视觉[106]、交通预测[158]、推荐系统[157]等各个领域都取得了巨大的成功应用。根据预测目标的类型，应用程序任务可以大致分为为节点级、边缘级、子图级和图级任务[151]与显著的经验成功相比，对gnn泛化能力的理论理解一直相当有限。在现有的文献中，一些研究[42,49,89]集中在图级任务的分析上，其中每个样本都是一个完整的图，而图的样本都是IID。[125,142]探索节点级GNN任务的GNN泛化的研究非常有限，但他们假设节点（及其相关的邻域）是IID样本，这与常见的基于图的半监督学习设置不一致。Baranwal等人[6]研究了没有IID假设但在特定数据下的GNN泛化

在本章中，我们的第一个贡献是提供一种新的pac-贝叶斯分析，用于在非IID假设的节点级任务上的泛化能力。特别地，我们假设节点特征是固定的，并且节点标签是根据节点特征的分布中独立采样的。我们还假设训练集和测试集可以被选择为图上节点的任意子集。在此非IID设置下，我们首先证明了两个一般的pac-贝叶斯推广界（定理5.4.2和定理5.4.3）。随后，我们根据GNN模型的特征和节点特征，推导出了GNN的一个推广界（定理5.4.10）。

值得注意的是，GNN的泛化边界受到测试节点和训练节点之间的聚合节点特征的距离的影响。这表明，给定一个固定的训练集，“远离”所有训练节点的测试节点可能会遭受更大的泛化错误。基于这一分析，我们的第二个贡献是发现了一种不公平，这种不公平来自于理论上在测试节点的某些子组之间可预测的精度差异。我们进一步进行了实证研究，调查了四种流行的GNN模型对不同的测试节点子组的预测精度。在多个基准数据集上的结果表明，这些子组之间的测试准确性确实存在显著差异。我们总结了本章的贡献如下：

(1)我们建立了一种新的-贝叶斯分析基于图的半监督学习非IID假设。

(2)在这种情况下，我们推导了gnn的一个推广界，它可以应用于测试节点的任意子组。

(3)作为泛化界的一个暗示，我们预测将存在GNN预测的不公平，这来自于测试节点的子组之间的准确性差异。

(4)我们通过实证验证了流行的GNN模型在多个基准数据集上的精度差异的存在性，正如我们的理论分析所预测的那样。

第六章基于分区的图神经网络的主动学习

在前一章中，我们已经看到，训练节点的选择对gnn的泛化和公平性起着至关重要的作用。在本章中，我们研究了主动学习设置[128]中基于gnn的半监督学习（GSSL）问题，在有限的注释预算下，允许主动查询图上的节点标签。我们的目标是设计有效的主动学习策略，可以提高gnn的泛化和公平性。

在GSSL中，主动学习设置也特别有趣，因为我们通常在学习之前访问大量的未标记样本，在许多情况下（例如，在社交网络上），我们可以灵活地查询一小部分样本的标签。此外，由于GNN的一个关键优势是能够利用相互连接的样本之间的关系信息，正确地选择节点进行注释可能会进一步提高GNN的性能。

然而，由于问题和GNN模型的特殊结构，直接使传统的主动学习方法适应于GSSL可能是次优的。实际上，利用数据的适当的平滑性特性一直是对许多主动学习方法的成功。例如，一个常用的假设（我们称之为特征平滑性）是，具有相似特征的样本有更高的机会落入同一类。除了特征平滑性之外，现实世界的GSSL任务经常利用图上的多种类型的平滑性属性，跨越局部平滑性和全局平滑性[163]之间的频谱。虽然已经有一些基于图的主动学习方法利用这些平滑特性[36,19,150]，但在适当的水平上充分利用特征和结构平滑的方法是很少的

在本章中，我们提出了一种基于图分区的gnn主动学习方法。该方法在很大程度上是由在现实世界的图形中通常存在的社区结构所驱动的。节点和结构属性在群落内往往表现出同质性和群落间的异质性。我们用社区级别的图形结构数据的适当平滑性假设（由图的分区表示）将这一观察结果形式化，并在这些假设下对GNN分类错误进行了新的分析。该分析进一步推动了该方法中的图划分步骤。特别是，图部分首先根据模块化[29]将图分割为几个分区，然后在每个分区中选择最具代表性的节点进行查询。该方法的一个重要优点是，它没有引入额外的超参数，而这对主动学习设置是至关重要的，因为标记的验证数据经常缺失。通过大量的实验，我们证明了该方法在多基准上优于现有的主动学习方法

区块链技术核心组件及应用架构的全面解析
区块链技术是一套融合密码学、分布式系统与经济激励的复合型技术体系，以下是其核心组件及应用架构的全面解析：一、区块链核心技术栈1.分布式账本技术（DLT）核心原理：多节点共同维护不可篡改的数据链数据结构：哈希指针哈希指针区块N区块N+1区块N+2关键创新：默克尔树（MerkleTree）实现高效数据验证2.密码学保障技术算法示例应用场景非对称加密ECC/secp256k1,RSA数字签名（设备身份认
03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
定位问题position
1.relative相对对位：占有原来的位置。以浏览器为准定位进行移动top/left/right/bottom2.absolute绝对定位：不占有原来的位置（脱标）如果没有祖先元素或者祖先元素没有定位，以浏览器为准定位；如果祖先元素有定位（相对、绝对、固定），则以最近一级的有定位祖先元素为参考点移动位置；加了绝对定位的盒子不能通过margin：0auto垂直水平居中，但可以通过算法居中left：
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【算法刷题记录（简单题）002】字符串字符匹配（java代码实现）挺菜的 java 算法开发语言
一、题目描述对于给定的字符串s和t，检查s中的所有字符是否都在t中出现。（一）输入描述第一行输入一个长度为1≤len(s)≤200、仅由小写字母组成的字符串s。第二行输入一个长度为1≤len(t)≤200、仅由小写字母组成的字符串t。（二）输出描述如果s中的所有字符都在t中出现，则输出true，否则输出false。（三）示例输入：bcabc输出：true二、题目解答（一）解题思路1.使用HashM
C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

[博士论文]基于图数据的可信赖机器学习

摘要

第一章 引言

第二章 前期工作

第三章 对图神经网络的实际对抗攻击

第四章 图在图神经网络中的表征和相关作用

第五章 图神经网络的推广与公平性

第六章 基于分区的图神经网络的主动学习