xiaopihaierletian

Graph Neural Networks (GNN)（一）：Spatial-GNN

1. 想法
CNN 中的卷积核（e.g., 3 * 3）算某一个像素点的 feature 的时候，可以看成把这个像素点周围的像素点的特征按照一定的权重加权求和。

卷积操作类似于内积，即把卷积核里的每个权重和对应像素点值相乘，最后相加，得到的结果就是这个点的新的特征。

Spatial-GNN 想要把这种卷积操作直接推广到 Graph 上。

2. 做法
将某个节点周围的领域节点特征收集起来，进行某一种操作，然后更新这个节点的特征。
图片来源：李宏毅老师 2020 课程：

上面我觉得直接把 i 看成 0 来理解会好一些，假设第 0 层的图和特征如上面图左边所示。

为了更新 $h^{0}_{3}$ （也就是第 0 层的 3 号节点）的节点特征，那么类似的我们需要将它周围的节点的特征聚合（aggregate）起来，然后进行某种操作，来更新这个节点的特征。类似于卷积中除了对周围像素操作职位，也对自己本身做了操作，因此 Spatial-GNN 通常也会结合自己本身的特征来更新下一次的特征。

这里在我读过的论文里面总结得最好的论文是 GIN《HOW POWERFUL ARE GRAPH NEURAL NETWORKS?》

k 代表第 k层网络，经过 k 层网络的某一节点会收集到他 k 跳邻居的节点信息。
AGGREGATE 操作就是将收集到的节点的特征进行聚合，聚合方案的不同是导致这一类方法不同模型的主要原因。同样的 COMBINE 操作就是将聚合的特征和自己节点这一层的特征结合起来，形成新的特征。这样就可以经过 k 层网络之后，每个节点就会根据自己周围的拓扑结构和特征，得到新的特征，可以更好的用于下游任务。

当然对于图分类的任务，需要整个图的特征：

其中 K 是最后一层的网络，这里表示将最后一层所有节点的特征进行某种 READOUT 操作，就得到整个图的特征。当然也可以把前面所有层的特征一起进行操作，甚至加权都是可以的。比如 GIN 中就用到了所有层的特征。

3. 经典例子：
接下来就是这一类方法的经典例子：这里面有大名鼎鼎的 GAT 和 GraphSage。

3.1 NN4G
论文《Neural Network for Graphs: A Contextual Constructive Approach》

NN4G 的想法很简单：就是把一跳邻居的节点特征相加，然后通过一个权重矩阵做变换，加上自身的值做一个权重矩阵相乘的变换。这里的 $x_{3}$ 是这个节点本来值（比如化学分子中的原子符号），然后经过一种 embedding（例如 word2vec 等），得到第一次的特征 $h^{0}_{3}$ 。通常现有的数据集预处理原始数据的过程是已经实现了的，因此，我们可以认为他 COMBINE 的就是上层自己的特征经过一个线性变换。

对于获取整个图的特征：

将每一层的所有节点特征求平均得到这一层的图表示，然后将所有层的图是加权求和得到最终的图表示。

AGGREGATE：求和之后做一个 Transform
COMBINE：加上自身做一个 Transform 的结果。
READOUT：先用平均操作求每一层的图表示，然后将所有层的图表示加权求和得到最终的图表示。
3.2 DCNN
论文：《Diffusion-Convolutional Neural Networks》

MEAN ⁡ ( d ( 3 , ⋅ ) = 1 )指的是在 Graph 中距离某个节点距离为 1 的节点。
MEAN ⁡ ( d ( 3 , ⋅ ) = 2 ) 指的是在 Graph 中距离某个节点距离为 2 的节点。
这样就很好理解 diffusion 扩散操作的含义了。

这样第一层就收集 1 跳邻居的信息，第二层就收集 2 跳邻居的信息。

这里收集多跳邻居的行为和其他大部分方法有点差异：大部分方法并不是显式的收集多跳邻居，而是按照下面方法：第一层网络每个节点收集自己 1 跳邻居的信息更新节点特征。第二层也是收集自己 1 跳邻居的信息更新节点特征。注意，这种行为是可以收集到 2 跳邻居的信息的，因为第二层自己 1 跳邻居已经在第一层收集了他们的 1 跳邻居，而 1 跳邻居的 1 跳邻居中包含了自己的 2 跳邻居。
当然这种显式的方法本质上是一样的，只是最终学到的网络参数不同而已。

进一步，将每一层网络中所有节点的向量组成一个矩阵：

$\mathbf{H}^{\mathbf{K}}$ 代表第 K层的矩阵，假设有 n 个节点，特征维度为 d ，那么这个矩阵就是一个 n × d 的矩阵，然后 K 层，就有一个 K × n × d 的一个张量。

然后最后的特征不是简单的最后一层网络输出的节点特征，他显式的考虑之前的节点。

图中所示的意思是，将 $n \times d$ 矩阵中的某一行拿出来，也就是某一节点的特征，然后 $K \times n \times d$ 张量就成了一个 $K \times d$ 的矩阵，然后做一个 Transform （乘以一个矩阵），最后得到这个节点的特征向量。

其实我们可以这样想节点最后特征的形成：

第 K 层使用 K 跳邻居的信息求平均得到第 K 层的节点特征。
将所有层的节点特征构成一个矩阵，然后做一个 Transform （乘以一个矩阵），最后得到这个节点最终的特征向量。
之所以连接成矩阵形式，是为了充分利用 GPU 并行计算的能力。
因此这里的 AGGREGATE 方案和 COMBINE 方案有一点差异：

AGGREGATE：求平均。但是并不是简单的拿最后一层特征作为输出特征，而是把所有层特征做一个 Transform 得到最后的节点特征。
COMBINE：没有加上自身。
READOUT：简单的把所有节点表示做平均。但是文中也提到在这个方案里面做平均效果不太好。

3.3 MoNet
论文《Geometric deep learning on graphs and manifolds using mixture model CNNs》

MoNet 也提出了一个统一的框架，并且表示 GCN 等都是这个框架的特例。其实 GCN 也可以看成一种 Spatial-GNN，即使它是从频谱 GNN 推导出来的。
MoNet 的基本公式如下：

其中 $\mathcal{N}(x)$ 代表 x 的邻居节点， $\mathbf{u}(x, y)$ 是一种定义好的节点之间的度量（我们可以理解为距离、相似度等），注意这个度量是一个向量，然后我们通过一个网络/加权函数（也可以看作核），这个网络可以理解为一种模式（然后检查这个节点和邻居节点组合一起有没有构成某种模式，也就是模式匹配），然后可以有多个这样的网络（核或者模式），最后所有邻居节点和所有模式加权求和，更新这个节点的特征。

不同的度量选择和不同的加权函数选择对应不同的方法：

MoNet 使用的核是多个高斯核，度量是基于节点度的度量，因此也可以认为 MoNet 是一种高斯混合模型（GMM）：

我们可以简单的理解， $\mathbf{u}(x, y)$ 和 $w_{j}(\mathbf{u})$ (多个 $w_{j}(\mathbf{u})$ ) 一起计算这个邻居节点对于这个本身节点的重要性，然后所有邻居节点加权求和来更新这个节点的特征。

这个时候一个自然地问题，我们上面表中的方法和 Monet 中的， $\mathbf{u}(x, y)$ 和 $w_{j}(\mathbf{u})$ 都是手动定义的，因此一个自然地想法，这个重要性（权重）我们自己去学，这也就是后面 GAT 的想法。

AGGREGATE：求加权和。权值的计算是通过度量和模式匹配来进行的。
COMBINE：可以认为没有加自身的特征，但是在考虑度量和模式的时候都有用到自身的特征。

3.4 GraphSAGE
论文《Inductive Representation Learning on Large Graphs》

半监督学习可以分为：Transductive 和 Inductive

Transductive（转换的）：测试样本在训练的时候是已知的可用的（当然标签是不知道的，但是我们知道他们的特征）。例如半监督的 Node Classification 中，我们训练的时候用到了测试节点的特征，因为你在聚合周围节点特征的时候，某个训练节点的周围可能是测试节点。
Inductive（归纳的）：测试样本在训练的时候是不可知不可用的。
大多数现有方法 Graph Embedding 的方法都是 Transductive 的，训练的时候需要所有的节点，无法很好地泛化到之前没有见过的节点。

GraphSAGE：学习一个 function 来通过采样和聚合一个节点领域的特征来生成 Embedding。实际上 GraphSAGE 学习的是一组聚合函数（Aggregate Function），然后在测试的时候使用学习到的这一组聚合函数对节点的领域进行采样和聚合最后得到节点的 embedding。

前向算法的描述如下，也就是假设我们训练好了聚合函数如何在测试的时候使用：这里有 K 个聚合函数，每个函数有自己的权重矩阵 $\mathbf{W}^{k}$ 。我们可以看成 K 层网络。

我们每次采样都是采样自己的 1 跳邻居，那么是怎么可以收集到多跳邻居的信息的呢？注意，每一次外层循环，我们要对所有节点的特征进行更新，这样我们第 2 层的网络即时采样自己的 1 跳邻居也可以收集到 2 跳邻居的信息，因为在第 1 层网络的时候，1 跳邻居根据自己的 1 跳邻居更新自己的特征（其中包括了 2 跳邻居）。因此 K 个聚合函数，相当于 K 层网络，相当于最终节点会收集到 K 跳邻居的信息。

然后每一次外层循环，都是聚合自己领域节点的信息，然后和本身链接起来，最后更新自身的节点信息。最后一层，也就是第 K 层的输出就是最终的 Embedding。

根据算法，可以发现 GraphSAGE 就是我们 Spatial-GNN 的标准范式

接下来就是具体的聚合方案：

Mean aggregator：很好理解，就是对所有领域节点的特征向量求平均，然后和自身向量一起做一个线性变化加一个非线性激活。这种方式做一点细微的修改就和 GCN 很类似了：

这个公式和标准的 GCN 只差一个归一化常数。GCN 可以看成就是把邻居向量和自身向量一起求平均，通过一个线性转换加一个非线性激活，得到新的特征表示，注意这一公式包括了算法中的第 4 行和第 5 行。虽然过程有点差异，但是本质上是类似的，GraphSAGE-Mean 中把自身一起求平均修改为领域节点求平均然后和自身连接在一起。

Pooling aggregator：将领域节点向量送到一个完全连接层，然后对输出之后的向量池化。例如 max-pooling 就是逐元素求最大值。

LSTM aggregator：我们上面所有的聚合方案都有两个很好地特性：（1）对于不同数量的领域节点，都可以直接使用，避免了 Graph 数据不同节点的领域数不同的问题。（2）与领域节点的输入顺序无关。但是 LTSM 不一样，LSTM 对输入顺序是很敏感的，但是 LTSM 模型的表现力更强，为了借助这个表现力，GraphSAGE-LSTM 把采样到的节点顺序打乱之后送入 LSTM，得到聚合的向量，然后和自身连接起来，送到一个完全连接层。

模型的训练分为有监督的和无监督的：有监督的很简单，就是根据监督任务定义损失函数，学习每个聚合函数也就是每层网络的参数（聚合方案一旦确定就是不变的）。如果是无监督的，损失函数基于 graph 结构：相邻节点具有相似的特征向量，相互远离的特征向量不同：

$\mathbf{z}_{u}^{\top} \mathbf{z}_{v}$ 代表两个节点向量内积，向量相似，内积大，然后取相反数，就是损失函数越小越好。 $\mathbf{z}_{v}$ 是在一定长度的随机游走上出现了点，即相近的点，我们期望他们向量相似）。后面的是负采样， $Q \cdot \mathbb{E}_{v_{n} \sim P_{n}(v)} \log \left(\sigma\left(-\mathbf{z}_{u}^{\top} \mathbf{z}_{v_{n}}\right)\right)$ ，Q 是负采样节点数，负采样中向量内积多了一个相反数，也就是希望负采样向量和这个节点向量差异越大越好。

实验实施：

只需要两个聚合函数，也就是两层网络，第一层采样 25 个邻居节点，第二层采样 10。之所以设置固定的领域节点数，而不是采样所有节点是为了使每个节点的时间空间消耗一致，直接原因就是为了方便简单。至于有的节点少于需要的节点数，那么就是有放回的采样，如果充足的领域节点，那么可以无放回的采样。

优点：（1）可以使用在不断扩张演进的图上；（2）可以泛化到新的图上；

3.5 GAT
论文：《Graph Attention Networks》

GAT 的核心思想就是隐式地给不同领域节点不同的权重，不用像 MoNet 一样手动的定义节点之间的度量，而是通过学习得到的。 GAT 也可用于 Inductive 的半监督学习。

知道想法就是学习加权和的权重，那么就很好理解了：

1、首先是将节点向量做一个线性变换： $\mathbf{W} \in \mathbb{R}^{F^{\prime} \times F}$ ，然后将两个节点（GAT 中很显然我们只需要聚合领域节点的，因此只需要给每个节点的每个领域节点求 attention）： $e_{i j}=a\left(\mathbf{W} \vec{h}_{i}, \mathbf{W} \vec{h}_{j}\right)$ ，其中 $\mathbb{R}^{F^{\prime}} \times \mathbb{R}^{F^{\prime}} \rightarrow \mathbb{R}$ ，表示这个 $e_{i j}$ 是一个实数，来表示这个邻居节点对这个节点的重要性指数。当然一个节点一般具有多个邻居节点，因此对所有邻居节点的重要性指数，softmax 归一化：

当然在实际操作中，加入了一个 LeakyReLU 的非线性激活：

其中 $\overrightarrow{\mathrm{a}} \in \mathbb{R}^{2 F^{\prime}}$ 将连接的两个向量转换为一个实数。
2、然后每个节点的特征，就是算到的 attention 作为权重的加权和：

3、文中提到为了稳定自注意力机制的训练稳定性，使用了多头注意力机制，其实就是上面的过程用多个不同参数相同结构的网络重复使用，然后将所有网络的输出连接起来（最后一层取平均）：

优点：（1）权重自己学的，比自己定义的权重计算方法好，提高了模型的表现力；学到的权重可以用来解释一些现象，提高可解释性。（2）时间复杂度不高： $O\left(|V| F F^{\prime}+|E| F^{\prime}\right)$ ；

3.6 GIN
论文《How Powerful are Graph Neural Network?》
文章主要贡献：

1.证明了GNN 最多只和 Weisfeiler-Lehman (WL) test 一样有效，即 WL test 是 GNN 性能的上限
2.提供了如何构建 GNN，使得和 WL一样有效
3.用该框架分析了 GCN 和 GraphSAGE 等主流 GNNs 在捕获图结构上的不足和特性
4.建立了一个简单的神经结构——图同构网络 (GIN)，并证明了它的判别/表达能力和 WL 测试一样

文中提出的框架首先将给定节点的邻居的特征向量集表示为一个多集，即，一个可能有重复元素的集合。然后，可以将 GNN 中的邻居聚合看作是多集上的聚合函数。因此，为了拥有强大的表示能力，GNN 必须能够将不同的多集聚合到不同的表示中。单射函数指的是：对每一值域内的 y，存在至多一个定义域内的 x 使得 f(x) = y。也就是当且仅当 a = b, f(a) = f(b)，在 GNN 中也就是具有完全相同的领域的一个节点才会被映射为同一个 embedding。

WL 测试和 Spatial-GNN 的联系：Weisfeler-Lehman 迭代进行以下操作得到节点新标签以判断同构性：

1.聚合方案：聚合每个节点邻域和自身标签。
2.更新节点标签：使用 Hash 映射节点聚合标签，作为节点新标签。

文中给出了具体证明（详细证明参考论文）：WL 测试是 GNN 性能的上限。

那么问题来了，什么样的 GNN 和 WL 测试一样强大呢？

如果邻居 Aggregate 函数和 Readout 函数是单射的，那么得到的 GNN 与 WL 测试一样强大。

$h_{v}^{(k)}=\operatorname{MLP}^{(k)}\left(\left(1+\epsilon^{(k)}\right) \cdot h_{v}^{(k-1)}+\sum_{u \in \mathcal{N}(v)} h_{u}^{(k-1)}\right)$

$h_{G}= CONCAT ( \left(\text { READOUT }\left(\left\{h_{v}^{(k)} | v \in G\right\}\right) | k=0,1, \ldots, K\right)$

实际上 READOUT 是用的求和，即

$h_{G}=\mathrm{CONCAT}\left(\operatorname{sum}\left(\left\{h_{v}^{(k)} | v \in G\right\}\right) | k=0,1, \ldots, K\right)$

最后获取图表示，是将每一层的节点表示 READOUT 然后连接起来。和之前一些方法只操作最后一层不同。

文章实例说明为什么 mean 和 max 的不是最强大的 GNN：

1.（a）中两个图是不同的结构（多集）：但是 Mean 和 Max 都认为是一样的结构。对于 mean: (a + a ) / 2 = (a + a + a) / 3。对于 max: max(a, a) = a = max (a, a, a)。
2.（b） max 方法认为是一样的结构，失效
3.（c）Mean 和 Max 都认为是一样的结构，失效。
由于 mean 和 max-pooling 函数不满足单射性，无法区分某些结构的图，因此不是最强力的 GNN。但是实际中那么多网络使用这两种方法，为什么有效呢？

sum：学习全部的标签以及数量，可以学习精确的结构信息
mean：偏向学习分布信息。（学习多集中元素的比例，因为按相同倍数扩大，Mean 映射为同一个结果），因此对于分布信息重要的任务，mean 是有效的。并且如果多集中几乎没有重复元素，那么 mean 和 sum 的能力会差不多。
max：学习多集的基础集（多集中删除重复元素形成的集合，即形成各不相同的元素集合）。将多集视为普通集合，因为多个相同元素 max 之后就只有这一个元素：max(a, a, b, b, b) = max(a, b)。

【Python】已解决：error: subprocess-exited-with-error 屿小夏 python 开发语言 linux
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AI在电商平台商品描述生成中的应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI在电商平台商品描述生成中的应用关键词：人工智能、电商平台、商品描述、自然语言处理、机器学习、深度学习摘要：本文深入探讨了人工智能在电商平台商品描述生成中的应用。首先，我们回顾了人工智能的概述和电商平台的发展背景。随后，分析了商品描述在电商平台中的重要性以及存在的问题。接下来，我们重点介绍了AI在商品描述生成中的应用技术，包括自然语言处理、机器学习和深度学习等。文章还通过实战案例展示了AI商品描
【Python】已解决：（cmd进入Python环境报错）No Python at ‘C:\Users…\Python\Python39\python.exe’ 屿小夏 python linux 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习之基于Django+YOLOv5商标识别 Q1744828575 python plotly python
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景在数字化时代，商标作为企业的重要资产，其保护和管理显得尤为重要。然而，传统的商标识别方法往往依赖于人工审查，效率低下且容易出错。随着深度学习技术的不断发展，尤其是目标检测领域的进步，自动化、高精度的商标识别成为可能。本项目旨在利用DjangoWeb框架和YOLO
动手学深度学习-卷积神经网络-3填充和步幅像污秽一样动手学深度学习深度学习 cnn 人工智能神经网络
目录填充步幅小结在上一节的例子（下图）中，输入的高度和宽度都为3，卷积核的高度和宽度都为2，生成的输出表征的维数为2×2。正如我们在上一节中所概括的那样，假设输入形状为nh×nw，卷积核形状为kh×kw，那么输出形状将是(nh−kh+1)×(nw−kw+1)。因此，卷积的输出形状取决于输入形状和卷积核的形状。还有什么因素会影响输出的大小呢？本节我们将介绍填充（padding）和步幅（stride）
RTX 4090D和A10和T4显卡差别、价格对比张3蜂软件安装部署开源神经网络人工智能深度学习机器学习
RTX4090D、NVIDIAA10和NVIDIAT4三款显卡在设计用途、性能、功耗、价格等方面都有显著差异，以下是它们的主要区别：1.设计用途：RTX4090D:面向高端消费者市场，主要用于游戏、内容创作和3D渲染，适合需要高图形性能的用户，如游戏玩家和内容创作者。NVIDIAA10:专为数据中心和企业应用设计，优化了AI推理、深度学习、虚拟桌面基础设施(VDI)以及多实例GPU（多用户共享显卡
【TVM教程】为 Mobile GPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数（tile因子
非凸科技招聘来啦！技术岗及非技术岗由你选！欢迎大家加入！招聘
公司介绍：非凸科技成立于2018年，是国内领先的智能算法和交易系统服务公司，专注于智能算法交易领域的研究和开发。公司特点：投研团队来自华尔街顶级资管公司BlackRock等，以及多位来自腾讯、字节跳动的顶尖工程师；在职员工100+，投研和技术团队占总人数比例75%，多位成员是ACM/ICPCWorldFinal选手；公司司正基于Rust生态，结合机器学习、深度学习等新兴技术，打造高效率、低延迟、高
深度学习-70-大语言模型LLM之基于大模型LLM与检索增强技术RAG的智能知识库皮皮冰燃深度学习人工智能深度学习语言模型
文章目录1RAG出现的背景2搭建过程2.1数据收集2.2数据处理2.2.1数据清洗与预处理2.2.2文本分块2.2.3微调数据格式统一2.3建立向量索引2.4大模型选择与微调3开源知识库项目3.1FastGPT3.2AnythingLLM3.3LangChain-Chatchat4商业化解决方案4.1百度智能云+千帆大模型知识库4.2阿里云PAI+向量检索5参考附录1RAG出现的背景自从2022年
transformer.js（一）：这个前端大模型运行框架的可运行环境、使用方式、代码示例以及适合与不适合的场景余生H 前端的AI工具书前端 transformer javascript hugginface webml web大模型
随着大模型的广泛应用，越来越多的开发者希望在前端直接运行机器学习模型，从而减少对后端的依赖，并提升用户体验。Transformer.js是一个专为前端环境设计的框架，它支持运行基于Transformer架构的深度学习模型，尤其是像BERT、GPT等广泛应用于自然语言处理（NLP）的模型。本文将全面解析Transformer.js的运行环境、使用方式、代码示例，以及其能够完成的功能与目前的限制，帮助
Python magenta库：一款人工智能生成音乐与艺术的创新工具程序员喵哥 python 人工智能开发语言
更多Python学习内容：ipengtao.com随着人工智能在创意领域的不断进步，音乐和艺术生成正成为一种新的可能性。Magenta是由Google推出的一个开源项目，它结合了深度学习与艺术创作，为开发者提供了一系列强大的工具，帮助他们创作音乐、绘画等艺术作品。基于TensorFlow，Magenta不仅适用于研究人员，也适合开发者和艺术家，提供了易于上手的API和丰富的模型。安装在使用Mage
Python&aconda系列：CUDA+Anaconda的安装以及 Conda实用命令坦笑&&life #python python conda 开发语言
这里写目录标题一.深度学习环境配置：CUDA+Anaconda的安装3.1.1CUDA简介3.1.2查看电脑显卡型号是否支持CUDA的安装3.1.3查看电脑显卡的驱动版本3.1.4根据显卡驱动版本下载支持的CUDA版本3.1.5检查CUDA是否安装成功3.1.6安装Anaconda3.1.7检查Anaconda是否安装成功3.1.8配置Anaconda的安装包下载源二.Conda实用命令conda
深度学习探索：ChatGPT数据分析精髓 & 梯度下降优化方法深度剖析网罗开发 AI 大模型人工智能深度学习 chatgpt 数据分析
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【深度学习】Squeeze-and-Excitation (SE) 模块优势解读理想不闪火深度学习入门到精通系列讲解
【深度学习】Squeeze-and-Excitation(SE)模块优势解读文章目录1概念辨析—下采样和上采样2Squeeze-and-Excitation(SE)3压缩（Squeeze）4激励（Excitation）5scale操作6相乘特征融合7SE模块的实现8优势1概念辨析—下采样和上采样概念上
人工智能技术的应用前景及未来发展键盘上的蚂蚁- 人工智能生活
引言人工智能（AI）作为21世纪最具创新性和革命性的技术之一，正在全球范围内深刻地改变着我们的生产、工作和生活方式。随着深度学习、强化学习、自然语言处理（NLP）、计算机视觉（CV）等技术的飞速进展，AI不再仅仅是学术研究中的一个热点，而是渗透到各个行业，成为推动创新、优化生产和提升效率的核心力量。对于开发者来说，理解和掌握AI技术不仅是提升个人技能的途径，更是应对未来技术变革、抓住职业机遇的关键
AI人工智能深度学习算法：在生物信息学中的应用 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能深度学习算法：在生物信息学中的应用关键词：人工智能、深度学习、生物信息学、基因组学、蛋白质结构预测、药物发现、个性化医疗文章目录AI人工智能深度学习算法：在生物信息学中的应用1.背景介绍2.核心概念与联系2.1人工智能（AI）2.2机器学习（ML）2.3深度学习（DL）2.4生物信息学2.5应用领域3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1卷积神经网络（CNN）3.1.
深度学习——模型过拟合和欠拟合的原因及解决方法发呆小天才O.o 深度学习深度学习人工智能
一、定义1.过拟合（Overfitting）过拟合是指模型在训练数据上表现非常好，但在测试数据或新的数据上表现很差的现象。模型过度地学习了训练数据中的细节和噪声，以至于它无法很好地泛化到未见过的数据。例如，在一个图像分类任务中，过拟合的模型可能对训练集中的每一张图像的特定细节（如某张猫图片背景中的一个小污点）都学习得过于精细，以至于在测试集中，只要图像背景稍有不同，就无法正确分类。2.欠拟合（Un
【TVM 教程】线性和递归核
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：TianqiChen下面介绍如何在TVM中进行递归计算（神经网络中的典型模式）。from__future__importabsolute_import,print_functionimporttvmimporttvm.testing
基于 PyTorch 的深度学习模型开发实战一ge科研小菜鸡人工智能深度学习
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言深度学习已广泛应用于图像识别、自然语言处理、自动驾驶等领域，凭借其强大的特征学习能力，成为人工智能的核心技术之一。PyTorch作为当前流行的深度学习框架，提供了灵活的张量操作和动态计算图，便于模型的快速开发和调试。本教程将通过一个完整的深度学习模型开发流程，从数据预处理、模型构建、训练与优化、评估以及部署，帮助读者深入理解深度学习的关键技术
神经架构搜索：自动化设计神经网络的方法君君学姐架构自动化神经网络
神经架构搜索：自动化设计神经网络的方法一、引言在深度学习领域，神经网络架构的设计对模型的性能具有至关重要的影响。传统的神经网络设计依赖于专家经验和大量实验，这一过程繁琐且耗时。为了解决这一问题，神经架构搜索（NeuralArchitectureSearch,NAS）应运而生。NAS是一种自动化设计神经网络架构的方法，旨在通过搜索最优的神经网络结构来提高模型性能。本文将详细介绍神经架构搜索的定义、产
2024 年高教社杯全国大学生数学建模竞赛 B 题生产过程中的决策问题详细思路+matlab代码+python代码+论文范例 2025年数学建模美赛 2024年数学建模国赛 2024高教社杯 2024 B题生产过程中的决策问题思路 2024数学建模国赛
持续更新中，2024年所有数学建模比赛思路代码都会发布到专栏内，只需要订阅一次。5号6号半价，会结合历年优秀论文、人工智能深度学习算法、chatgpt。会定期发布思路、代码和论文。思路和论文基本拿不到国奖，想要获得国奖的同学不要购买。适合基础差的学生，容易获得省奖！B题生产过程中的决策问题某企业生产某种畅销的电子产品，需要分别购买两种零配件（零配件1和零配件2），
第八章：AI大模型的未来发展趋势8.3 新兴应用领域8.3.2 生成对抗网络的应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.背景介绍生成对抗网络（GenerativeAdversarialNetworks，GANs）是一种深度学习技术，由伊玛·古德姆（IanGoodfellow）于2014年提出。GANs由两个相互对抗的神经网络组成：生成器（Generator）和判别器（Discriminator）。生成器生成假数据，判别器试图区分假数据和真实数据。这种对抗训练方法使得GANs能够学习数据分布并生成高质
开发者实战 | OpenVINO™ 协同 Semantic Kernel：优化大模型应用性能新路径 OpenVINO 中文社区 openvino 人工智能
点击蓝字关注我们,让开发变得更有趣作者：杨亦诚作为主要面向RAG任务方向的框架，SemanticKernel可以简化大模型应用开发过程，而在RAG任务中最常用的深度学习模型就是Embedding和Textcompletion，分别实现文本的语义向量化和文本生成，因此本文主要会分享如何在SemanticKernel中调用OpenVINO™runtime部署Embedding和Textcompleti
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统 yolov8来训练无人机数据集并检测无人机 QQ_1309399183 无人机类 YOLO 无人机深度学习
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统yolov8来训练无人机数据集并检测无人机无人机数据集，yolo格式种类为uav，一共近5w张图片，如何用yolov8代码训练无人机检测数据集文章目录以下文章及内容仅供参考。1.环境部署2.数据预处理数据集准备划分数据集3.模型定义4.训练模型5.评估模型6.结果分析与可视化7.集成与部署PyQt6GUI(`
Llama3本地部署的解决方案 herosunly llama3 llama 本地部署 API 解决方案
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Llama3本地部署的解决方案，希望对学习大语言模型的同学们有所帮助。文
深入解析vLLM：加速大模型推理的高效框架秋声studio 口语化解析人工智能模型调优 nlp vLLM
深入解析vLLM：加速大模型推理的高效框架引言在现代深度学习应用中，大型语言模型（如GPT、GLM、LLaMA、Qwen等）的推理速度和资源利用率成为关键挑战。vLLM(VirtualLargeLanguageModel)是由伯克利大学LMSYS组织开源的大语言模型高速推理框架，旨在极大地提升实时场景下的语言模型服务的吞吐量与内存使用效率。本文将深入探讨vLLM的工作原理及其优化技术。一、vLLM
AI 驱动的创业产品设计趋势：大模型赋能下的创新 AI天才研究院【精选大厂面试题详解】大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI驱动的创业产品设计趋势：大模型赋能下的创新一、背景随着人工智能技术的飞速发展，特别是深度学习和大型语言模型（如GPT）的广泛应用，AI正在逐渐改变创业产品设计的游戏规则。大模型赋能下的创新成为许多创业公司脱颖而出的关键。本文将探讨以下几个方面的内容：AI驱动的创业产品设计趋势大模型在产品设计中的具体应用AI驱动创业产品的成功案例分析大模型赋能下的产品设计和开发挑战二、AI驱动的创业产品设计趋势
简要说一下关于实现整个深度学习项目的流程懒大王12138 机器学习深度学习神经网络人工智能算法
我们以识别生物信号为例子，其他类似与图像、文本和目标/故障检测的同样适用1.信号预处理；首先要将得到的生物信号进去噪音去除，另外所有的生物信号由于采样时间不同可能长度并不一样，这时候你需要统一长度。2.特征工程；你需要对所有的经过预处理并且将要输入神经网络的信号提取特征，比如信号的频谱图、时间-频率图或者是一些非线性的动力学特征，比如相空间这些。最重要的是提取的特征数据形状必须一致。3.搭建深度学
在PyTorch框架上训练ImageNet时，Dataloader加载速度慢怎么解决？ cda2024 pytorch 人工智能 python
在深度学习领域，PyTorch因其灵活性和易用性而受到广泛欢迎。然而，在实际应用中，特别是在处理大规模数据集如ImageNet时，Dataloader的加载速度往往成为瓶颈。本文将深入探讨这一问题，并提供多种解决方案，帮助你在PyTorch框架上高效地训练ImageNet。1.问题背景ImageNet是一个包含超过1400万张图像的大规模数据集，被广泛用于图像分类任务的研究。在PyTorch中，D
深度学习篇---Anaconda&LabelImg Ronin-Lotus 深度学习篇深度学习人工智能学习 python 程序人生机器学习计算机视觉
文章目录前言第一部分：Anaconda是什么？1.简介2.特点（1）包管理器Conda（2）环境管理（3）预装包（4）跨平台（5）社区支持3.安装WindowsLinux3.基本命令（1）conda--version（2）condaupdateconda（3）condacreate--namemyenvpython=3.6（4）condaactivatemyenv（5）condadeactivat
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

Graph Neural Networks (GNN)（一）：Spatial-GNN

你可能感兴趣的:(图神经网络,深度学习)