利用PyG实现图池化minCUT Pool（图分类任务）

文章目录

图池化
论文介绍
- 技术原理Spectral Clustering with GNNs
基于PyG实现图池化minCUT Pool
- 导入需要的包
- 数据集导入和处理
- ** *模型搭建* **
- 模型训练函数
- 模型测试函数
- 模型训练与测试

图池化

在我的理解，图池化就是利用聚类的方法，将强连通的节点簇进行合并，从而将图中的有效信息进行池化提取。也可以认为，利用一定的聚类方法，生成图的粗化版本。 池化在具有大量节点的数据集上更为有效，因为它可以有效地从大规模图形中提取有用的信息。

论文介绍

《Spectral Clustering with Graph Neural Networks for Graph Pooling》为2020年发表在国际机器学习大会ICML的论文。谱聚类（SC）是一种流行的聚类技术，用于在图上找到强连通的社区。SC可用于图形神经网络（GNN），以实现聚合属于同一集群的节点的池操作。然而，Sc的聚类方法基于拉普拉斯的特征分解，这在训练中是昂贵的，并且由于聚类结果是特定于图的，基于SC的池方法必须对新的样本执行新的优化。
而作者在本文中提出了一种可以在样本外的图上快速评估的聚类函数。根据所提出的聚类方法，作者设计了一个图池算子minCUT，并在有监督和无监督任务上都取得了极佳的性能。通俗来讲，作者提出的基于GNN的实现是可微分的，不需要计算频谱分解，并且学习了一个可以在样本外图上快速评估的聚类函数。
—————————————————————————————————————————
用本人的理解，作者的方法在实质上是将节点特征空间通过神经网络映射到了聚类分配空间。
—————————————————————————————————————————

技术原理Spectral Clustering with GNNs

首先，作者对聚类问题进行了分解：
1、图拓扑——同一集群的节点直接应当互相具有强连接
2、节点特征——同一集群的节点应有类似的特征
作者的方法假设节点特征表示计算集群分配的良好初始化。**核心在于通过集群(社区/簇)分配矩阵S 来计算出聚类（池化）后的邻接矩阵和特征（把每个簇融合成一个节点生成新的特征和邻接矩阵），然后可利用该邻接矩阵和特征进行下游任务。通过多加 n 层 MinCutPool 即可实现 n 层的池化迭代。**总体结构图如下：

首先，设X为一个或多个MP层产生的节点表示矩阵。这里的X既拥有节点特征信息，也有拓扑信息。然后使用输出层具有softmax的多层感知器（MLP）计算节点的群集分配S（该感知器将每个节点特征xi映射到软群集分配矩阵S的第i行）：

通过最小化由两个项组成的无监督损失函数Lu来联合优化上面GNN和MLP的参数。 左边的损失函数鼓励类间的节点尽可能的接近，右边则是鼓励类间正交且每个类具有相同数量的节点。

||F代表了Frobenius范数。
其中Lc用来对minCUT进行评估，取值范围为[-1,0]。最小化Lc会鼓励强连接节点聚集在一起。 当分子=0时，Lc取最大值0，如果对于每对连接的节点（即，aij>0），簇分配是正交的（即=0），则会发生这种情况。当分子=分母时，Lc取最小值-1，当在具有K个断开连接的组件的图中，相同组件中的所有节点的簇分配相等，并且与不同组件中的节点的簇指定正交时，会发生这种情况。
然而，Lc是一个非凸函数，其最小化可能导致局部极小或退化解。例如，给定一个连通图，一个平凡但最优的解决方案是将所有节点分配给同一个集群。作为连续松弛的结果，所有节点都平等地分配给所有簇。MP操作加剧了这个问题，其平滑效果使节点特征更加均匀。
为了规避这种退化解，正交性损失项Lo鼓励簇分配是正交的，并且簇具有相似的大小。 由于Lo中的两个矩阵具有F范数，很容易看出0≤Lo≤ 2。因此，这两项可以安全地求和，而无需重新缩放它们，这样可以减少时间和空间成本。IK可以被解释为（重新缩放的）聚类矩阵ST与S矩阵相乘，其中S为每个聚类精确分配N/K个点。在2017年Deep spectral clustering learning聚论文中已经证明类矩阵之间的Frobenius范数值不受聚类大小差异的影响，因此可用于优化聚类内方差。
引用作者原文：虽然传统的SC需要计算每个新样本的谱分解，但在这里，聚类分配是由神经网络计算的，该神经网络学习从节点特征空间到聚类分配空间的映射。由于神经网络参数与图的大小无关， 并且由于GNN中的MP操作在节点空间中是局部化的，并且与拉普拉斯谱无关，因此所提出的聚类方法在推理时适用于未看到的图。
这也提供了在小图上训练我们的网络的机会，然后使用它来对较大的图进行聚类。
总体来说，minCUT就是利用集群分配矩阵S生成图的粗化版本，并对其池化的误差进行计算。
————————————————————————————————————————————
将每个簇结合成一个点，粗化后的邻接矩阵和集合顶点特征分别计算为：

其中Apool为KxK的大小，可以看出将每个簇的节点融合为了一个节点并产生融合后的链接关系，其中aii代表簇中节点间边的权重加权和，aij代表簇i和簇j间的边加权和。Xpool为KxF，xij是i组元素中j特征的加权和，即代表每个簇内所有节点的特征融合为了一个特征。
Apool对应于计算损失时的Lc，tr’的max使其产生内部强链接，彼此弱链接的簇——对角占优的矩阵。但这也导致Apool自循环强，这会阻碍节点传播。我们对Apool进行对角线归零：

第二个归一化公式也是GNN中常见的处理方法。

用作者原文进行总结：通过联合优化Lu以及特定下游任务的任何监控损失，可以端到端地学习每个MinCutPool层的参数。与仅在正交矩阵空间内搜索可行解的SC方法相反，Lo只引入了在学习过程中可能部分违反的软约束。这使得GNN能够在Lu和监督损失之间找到最佳折衷，并使处理具有本质不平衡簇的图成为可能。

基于PyG实现图池化minCUT Pool

我们在选取数据集的时候，首先要注意选择多图数据集，而并非Cora这种单图数据集。池化针对的是图分类任务， 对于多图数据集（每个子图属于某一个类，一个图有一个标签），池化可以将每个子图的节点量不断缩小，最后坍缩成一个点来代表类别，与实际标签进行误差计算，并反向传播给参数更新，最后达到分类的任务效果。
而单图数据集的标签往往是与节点对应而不是与图对应， 每个节点有其自己的标签。如果对单图数据集做池化，会合并一部分节点，而这些节点往往具有不同的类别，那么合并后的节点将不再具有标签。
我们选择在PROTEINS数据集上进行论文优化部分的代码复现。PROTEINS数据集是蛋白质数据数据集，其中的1113个图表示蛋白质,图的标签分为2类,表示酶或者非酶.节点是蛋白质的二级结构,如果二级结构在氨基酸序列或者蛋白质三维空间中是邻居,那么节点之间有边存在。
通俗地讲，该数据集一共包含1113张无向图。PyG中PROTEINS数据集的具体的参数如下图：

在实现数据集引入和处理方面，本人主要使用了PyTorch Geometric这个库，这是我的大牛师兄推荐的一个比较简单的处理图问题的函数库，它的函数兼容性好并且操作相比于networkx较为简单（个人感觉哈），内置了大量数据集的自下载及其处理方式。具体介绍可以见官网：https://pytorch-geometric.readthedocs.io/en/latest/

导入需要的包

这里我们直接使用PyG内自带的GCN卷积核，这个类的输入为PyG格式的edge_index，而不需要提前转换成adj的邻接矩阵格式，可以说是数据集拿过来不用处理就可以做卷积，非常的便捷。
PyG中，DenseGraphConv可以对三个维度的图群进行卷积，这支持我们批量进行图卷积；dense_mincut_pool为PyG内置的minCUT层，返回的值为池化后的批量图节点特征矩阵，池化后的邻接矩阵，上面论文讲到的Lc和Lo。
它们的输入和输出在下面会进行具体的讲解。

from math import ceil
import torch
import torch.nn.functional as F
from torch.nn import Linear
from torch_geometric.datasets import TUDataset
from torch_geometric.loader import DataLoader
from torch_geometric.nn import DenseGraphConv, GCNConv, dense_mincut_pool
from torch_geometric.utils import to_dense_adj, to_dense_batch

数据集导入和处理

我们选用PyG中内置的PROTEINS数据集，并对其进行训练集、测试集、验证集的划分。
第二行，我们计算出平均节点数量（由上面数据集图片可知为39）方便后面的维度计算。
第三行到第六行代码，我们将图进行了十等分，用于划分1113个图为训练、测试和数据（÷10代表划分8：1：1）。
最后，我们设置一次load20个图进行批量训练（神经网络通常以批量方式训练。PyG内置的DataLoader函数可以通过创建稀疏块对角邻接矩阵（由edge_index定义），并在节点维度上连接特征和目标矩阵，从而在小批量上实现并行化。这种组合允许在一个批次中的示例中有不同数量的节点和边）。

dataset = TUDataset(root='../tmp/PROTEINS', name='PROTEINS').shuffle()
average_nodes = int(dataset.data.x.size(0) / len(dataset))
n = (len(dataset) + 9) // 10
test_dataset = dataset[:n]
val_dataset = dataset[n:2 * n]
train_dataset = dataset[2 * n:]
test_loader = DataLoader(test_dataset, batch_size=20)
val_loader = DataLoader(val_dataset, batch_size=20)
train_loader = DataLoader(train_dataset, batch_size=20)

** 模型搭建 **

这里是本算法的核心部分，尤其要注意矩阵的维度，有利于模型的快速理解。
首先我们在初始化模型的同时按照论文设置了一系列卷积层、池化层和全连接层。由上面可以知道，平均节点数量为39，所以此处的num_nodes为20（第一处）和10（第二处）。
在调用该模型时，我们的输入有节点信息和边信息以及batch（尤其注意！这里的节点和边信息是20张图的）。我们假设输入的x有542个点，故x的尺寸为节点数x特征数542x3.
首先根据上面的论文，我们要先生成一个节点表示矩阵x并用x生成集群（社区/簇）分配矩阵s。minCUTPool可以利用他们生成图的粗化版本。 我们首先对输入的x经过一层图卷积（论文中为MLP，为了减少计算开销我们用一层线性层代替），得到节点表示矩阵x（由初始化卷积信息可得输出维度为32维，故x维度为542x32）。接着，我们对节点信息和边进行to_dense操作，使其转换由统一的节点和边矩阵转换为20个图的节点特征矩阵和邻接矩阵。 首先是对x进行to_dense操作，输出x为20x96x32，mask为20x96。x的20x96代表原本20个图中的542个点本来是集合的，现在转换在了各个图里，比如第一个96是第一个图的96个点，第二个96是第二个图的96个点。但是有的图的节点数比较少，这时就需要mask（里面由true和false构成）。比如，第10个图实际上只有40个点，但他的节点数维度为96，这时mask就会在对应维度用40个true和56个false来表示，这里的96个点只有40个有效。（这里的96可以理解为，这20个图中节点数最多的图有96个节点）同理，输出的adj邻接矩阵为20x96x96，代表了20个图分别的邻接矩阵。
转换完成后的x和adj都是具有三个维度，所有不可以使用只作用于二维矩阵的图卷积GCNConv进行卷积操作，后面的卷积都换成了DenseGraphConv。
我们对x进行全连接层操作得到集群分配矩阵s，由初始化的mlp1参数可得s的维度为20x96x20。然后我们将x，adj，s，mask带入PyG内置的minCUT Pool函数中，得到了池化后的节点特征矩阵x[20x20x32],邻接矩阵adj[20x20x20],以及返回的两个损失Lc和Lo。这表明minCUT Pool对20个图每个图的96个节点都池化为了20个节点，并且保持原有的特征维度32不变。即通过融合聚类后的节点生成了图的粗化版本。
然后我们再进行一次上述步骤，在第二次minCUT Pool池化后将20个点再次池化为10个点，特征矩阵x为[20x10x32],邻接矩阵adj[20x10x10]，第二次的损失Lc和Lo。
然后我们需要根据池化后的特征，将每张图所属的类别（标签）预测出来。即每张图坍缩为一个点进行标签预测。 首先对x进行降维，通过mean函数对每个图的10个点求平均，使每个图具有32个特征。x此时维度为20x32。然后经过两层线性层即MLP进行概率预测，变为20x2，即输出每个图对应不同类别的概率（该数据集一共两个类别）。


class Net(torch.nn.Module):
    def __init__(self, in_channels, out_channels, hidden_channels=32):
        super().__init__()

        self.conv1 = GCNConv(in_channels, hidden_channels)
        num_nodes = ceil(0.5 * average_nodes)
        self.mlp1 = Linear(hidden_channels, num_nodes)

        self.conv2 = DenseGraphConv(hidden_channels, hidden_channels)
        num_nodes = ceil(0.5 * num_nodes)
        self.mlp2 = Linear(hidden_channels, num_nodes)

        self.conv3 = DenseGraphConv(hidden_channels, hidden_channels)

        self.lin1 = Linear(hidden_channels, hidden_channels)
        self.lin2 = Linear(hidden_channels, out_channels)

    def forward(self, x, edge_index, batch):
        x = self.conv1(x, edge_index).relu()

        x, mask = to_dense_batch(x, batch)
        adj = to_dense_adj(edge_index, batch)

        s = self.mlp1(x)
        x, adj, mc1, o1 = dense_mincut_pool(x, adj, s, mask)

        x = self.conv2(x, adj).relu()
        s = self.mlp2(x)

        x, adj, mc2, o2 = dense_mincut_pool(x, adj, s)

        x = self.conv3(x, adj)

        x = x.mean(dim=1)   #20*32
        x = self.lin1(x).relu()
        x = self.lin2(x)
        return F.log_softmax(x, dim=-1), mc1 + mc2, o1 + o2

模型训练函数

首先初始化模型参数和优化器。其次在训练函数中，每次使用20个图作为一个批量（batch）进行训练，得到输出的类别概率和Lc、Lo。将输出的类别概率和实际的标签带入nll_loss损失函数中计算误差并加上Lc（评估minCUT）和Lo（簇损失）作为整体的损失进行梯度求导和误差的反向传播 ，使模型中各个环节的参数进行更新。
每调用一次训练函数会对所有batch进行训练，即训练（所有图的数量/批量数batch）次。

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = Net(dataset.num_features, dataset.num_classes).to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=5e-4, weight_decay=1e-4)


def train(epoch):
    model.train()
    loss_all = 0

    for data in train_loader:
        data = data.to(device)
        optimizer.zero_grad()
        out, mc_loss, o_loss = model(data.x, data.edge_index, data.batch)
        loss = F.nll_loss(out, data.y.view(-1)) + mc_loss + o_loss
        loss.backward()
        loss_all += data.y.size(0) * float(loss)
        optimizer.step()
    return loss_all / len(train_dataset)

模型测试函数

仍然是每次取一个批量20个图，并计算损失。但这里不进行误差的反向传播，因为是测试所以不需要梯度更新，而是直接使用预测概率中最大的值作为预测类别与实际的标签进行比较，观察在所有图上有多少图在训练后的分类正确——即用所有预测正确的图数量除以数据集所有图的数量。


@torch.no_grad()
def test(loader):
    model.eval()
    correct = 0
    loss_all = 0

    for data in loader:
        data = data.to(device)
        pred, mc_loss, o_loss = model(data.x, data.edge_index, data.batch)
        loss = F.nll_loss(pred, data.y.view(-1)) + mc_loss + o_loss
        loss_all += data.y.size(0) * float(loss)
        correct += int(pred.max(dim=1)[1].eq(data.y.view(-1)).sum())

    return loss_all / len(loader.dataset), correct / len(loader.dataset)

模型训练与测试

设置训练1000轮，每一轮依次调用训练函数进行训练，并在训练集上和验证集上进行精度测试。我们设置耐力系数为50，如果测试的损失小于目前已得到的最小损失，则说明此时的精度大于之前的精度，我们就在测试集上进行精度测试，获取在测试集上的精度（正确率）并重置耐力系数为50。如果验证集的损失并没有大于目前已得到的最小损失，意味着测试的精度并没有大于目前已得到的最好精度，我们就没有必要在测试集进行测试了，而是对耐力系数进行减一。耐力系数50的作用即为确保如果50轮内没有更高的精度出现，即已经几乎达到最大精度了便停止训练，避免多余无用的训练。 比如在600——650这50轮内的训练始终没法进一步提高精度，便视为已经达到最高精度停止训练。


best_val_acc = test_acc = 0
best_val_loss = float('inf')
patience = start_patience = 50
for epoch in range(1, 1000):
    train_loss = train(epoch)
    _, train_acc = test(train_loader)
    val_loss, val_acc = test(val_loader)
    if val_loss < best_val_loss:
        test_loss, test_acc = test(test_loader)
        best_val_acc = val_acc
        patience = start_patience
        best_epoch =  epoch
    else:
        patience -= 1
        if patience == 0:
            break
    print(f'Epoch: {epoch:03d}, Train Loss: {train_loss:.3f}, '
          f'Train Acc: {train_acc:.3f}, Val Loss: {val_loss:.3f}, '
          f'Val Acc: {val_acc:.3f}, Test Loss: {test_loss:.3f}, '
          f'Test Acc: {test_acc:.3f}')

print(f'The Best Epoch: {best_epoch:03d},Test Loss: {test_loss:.3f}, Test Acc: {test_acc:.3f}')

输出结果部分截图为：

证明具有minCUT Pool的模型可以在较短时间内达到很高的精度。

两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
服不服输，还要看人蒙语
人生路上没有常胜将军，有失败的时候是在所难免的，但是失败归失败，在失败的时候需要我们认输的时候，却不是那么干净利落的就认输了，因为失败的原因并不是那么容易的让自己接受，所以有的时候真的很不服，暗地里问了自己无数次，怎么就输了，怎么就变成这样了，在自己没有想清楚之前，还是会做各种尝试，希望有个万一存在，死灰复燃是自己最希望的，而且在对上某些人的时候，不管事实再怎么清楚，我们还是不会就轻易的服输了。图
【STM32系统】基于STM32设计的锂电池电量/电压检测报警器系统——文末完整资料下载（程序源码/电路原理图/电路PCB/设计文档/模块资料/元器件清单/实物图/答辩问题技巧/PPT模版等）阿齐Archie 单片机嵌入式项目 stm32 嵌入式硬件单片机
基于STM32设计的锂电池电量/电压检测报警器系统系统视频：摘要：本设计旨在研究一个基于STM32F103C8T6微控制器的锂电池电量/电压检测报警器系统，应用于便携式电子设备电池管理。系统通过STM32的ADC模块对锂电池电压进行采集，利用LCD1602显示模块实时显示电池电压，当检测到电池电量不足或电压异常时，蜂鸣器报警模块会发出警报提醒用户。系统采用简单的硬件结构和优化的软件架构，通过对实际
关于UI刷新重绘草帽小子J
最近做了一个关于用户雷达图的需求，有用到关于ui绘制相关的东西，于是去了解了下关于invalidate()、postInvalidate()、requestLayout()的知识。invalidate该方法会请求重绘view树，即draw(),刷新UI,并且不会调用onMeasure()，谁调用重绘谁，ViewGroup则重绘整个ViewGroup.一般会触发invalidate的主要为如下几种方
2021-11-06 简藏格物奢侈品服务中心
找代购买奢侈品，一定要做这两件事，才不会被骗上一期我们聊到，找代购为什么会买到仿品。其实大部分代购都是诚信的，为什么还有那么多会买到仿品。那是因为很多挂着代购名衔的，他们就不是代购，只是朋友圈包装成一个忙碌的“搬运工”。大家在购买之前，最好找卖家要几张鉴定点的高清图，大家可以先拿图鉴定。最好让卖家多拍些实物图，并且挂上防调包扣。这样做，一点是为了确定收到的货，与图片是同一个，防调包扣是避免后续纠纷
外卖返利宝app下载外卖返利宝(外卖红包返现软件) 氧惠购物达人
外卖返利软件是可以帮助用户进行点外卖省钱以及点外卖之后获得返利的外卖返利软件分类合集，外卖返利软件可以帮助喜欢点外卖的用户省钱以及获得返利实惠，外卖返利软件中每日都有大量优惠券赠送活动，还有霸王餐可以秒杀，获得霸王餐的机会，用户可以直接免单外卖，不用花费一分钱。小编这里推荐了多款外卖返利软件。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。
为用户都喜欢购买阿里云服务器？阿里云服务器有何优势？阿里云最新优惠和活动汇总
随着企业数字化转型的加速和云计算技术的日益成熟，云服务器已成为企业搭建应用、存储和处理数据的重要基础设施。在众多云服务提供商中，阿里云以其卓越的性能、丰富的产品线、出色的技术支持和强大的生态系统，赢得了众多用户的青睐。那么，阿里云服务器到底有哪些优势？为何如此多的用户选择使用阿里云服务器呢？阿里云服务器优势图.jpg阿里云服务器的优势一、技术领先，性能卓越阿里云作为国内最早涉足云计算领域的企业之一
4×4矩阵键盘详解（STM32）辰哥单片机设计 STM32传感器教学矩阵计算机外设 stm32 嵌入式硬件单片机传感器
目录一、介绍二、传感器原理1.原理图2.工作原理介绍三、程序设计main.c文件button4_4.h文件button4_4.c文件四、实验效果五、资料获取项目分享一、介绍矩阵键盘，又称为行列式键盘，是用4条I/O线作为行线，4条I/O线作为列线组成的键盘。在行线和列线的每一个交叉点上设置一个按键，因此键盘中按键的个数是4×4个。这种行列式键盘结构能够有效地提高单片机系统中I/O口的利用率，节约单
STM32的寄存器深度解析千千道 STM32 stm32 单片机物联网
目录一、STM32寄存器概述二、寄存器的定义与作用三、寄存器分类1.内核寄存器2.外设寄存器四、重要寄存器详解1.GPIO相关寄存器2.定时器相关寄存器3.中断相关寄存器4.RCC相关寄存器五、寄存器操作方法1.直接操作寄存器2.使用库函数操作寄存器六、总结在嵌入式系统开发中，STM32微控制器以其强大的性能和丰富的功能而备受青睐。而理解和掌握STM32的寄存器是深入学习和开发STM32的关键。本
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
Xilinx 7系列FPGA架构之器件配置（二） FPGA技术实战 FPGA器件架构 Xinx FPGA硬件设计 fpga开发
引言：本文我们介绍下7系列FPGA的配置接口，在进行硬件电路图设计时，这也是我们非常关心的内容，本文主要介绍配置模式的选择、配置管脚定义以及如何选择CFGBVS管脚电压及Bank14/15电压。1.概述Xilinx®7系列设备有五个配置接口。每个配置接口对应一个或多个配置模式和总线宽度，如表1所示。有关接口详细的时序信息，可以参阅相应的7系列FPGA数据手册。配置时序主要与FPGA配置时钟管脚CC
图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
四、模型的下载与使用梦中星华 AI画图人工智能
模型的下载与使用在我们已经熟悉的文生图和图生图的基础知识之上，现在是时候选择我们的艺术伙伴——AI模型了。在本篇讲义中，我们将学习掌握模型的下载和安装过程，以及如何在实际创作中灵活调用它们。通过本课程的学习，我们将能够更加自如地驾驭AI绘画工具，让我们的艺术创作更加多元和高效。让我们一起迈出这一步，选择一位能够理解我们创意愿景的AI画家，共同创作出令人赞叹的艺术作品。§1.模型的基本概念与下载\S
“杜苏芮”是谁？“杜苏芮”到底有多可怕？峡谷风6248
这两天，“杜苏芮”成为最热的词，那“杜苏芮”是谁？是明星吗？是唱歌的还是跳舞的还是演员、作家？“杜苏芮”到底有多可怕？“杜苏芮”感觉像人名，还和明星阿杜和苏芮的名字意外相似，但它与阿杜和苏芮没有半毛钱的关系。那“杜苏芮”到底是谁呢？“杜苏芮”是2012年太平洋台风季第六个被命名的风暴，其名字“杜苏芮”一名由韩国提供，意为秃鹫，猛禽，狼鹰的一种。网图侵删这个台风为什么叫“杜苏芮”？原来台风的命名是论
架构师备考的一些思考（四） kiba518
前言对于数学，我们之前学的是对的，但不是真的，所以我们没有数学思维。对于计算机，我们学校教的是对的，但不是真的，所以仅仅从学校学习知识的应届毕业生，不论985,211，本科，专科都一样，都是一张白纸，啥也不会。案例分析案例分析是5选3，第一题必答。问题一的类型架构风格对比问题二的类型质量属性填写问题三的类型ER图分析问题类型四场景分析，此类型题比较多。案例分析主要是结合我们之前介绍的内容和自身的经
Spark 组件 GraphX、Streaming 叶域大数据 spark spark 大数据分布式
Spark组件GraphX、Streaming一、SparkGraphX1.1GraphX的主要概念1.2GraphX的核心操作1.3示例代码1.4GraphX的应用场景二、SparkStreaming2.1SparkStreaming的主要概念2.2示例代码2.3SparkStreaming的集成2.4SparkStreaming的应用场景SparkGraphX用于处理图和图并行计算。Graph
数据归档方案（带流程图）别逼逼！出马吧！持久层操作功能实现
需求背景：最近两天新开发了一个功能由于热表中存储数据较多导致插入查询缓慢，所以要求做数据归档需求：以年为单位进行归档，但每个归档表又存在一个阈值方案可以使用定时调用下图为实现思路（流程图）：1.首先判断年度归档表是否存在，不存在则创建归档表把数据进行归档2.存在则判断表中数据是否超过阈值，没超过则直接进行归档3.若超过阈值则需要判断是否存在归档的子表，不存在则创建子表进行归档4.存在则重复上述操作
Spring Boot 请求处理流程：从负载均衡到多实例并发 - 电子商务网站实例烟雨国度 spring boot 负载均衡后端
SpringBoot请求处理流程：从负载均衡到多实例并发-电子商务网站实例SpringBoot请求处理流程：从负载均衡到多实例并发SpringBoot作为一个强大的Java应用开发框架，能够有效地处理高并发请求。本文将基于三个关键流程图，详细分析SpringBoot应用如何从负载均衡到请求处理，再到多实例并发处理的整个过程。1.负载均衡和多实例处理首先，让我们看一下描述负载均衡和多实例处理的流程图
HTTP 请求处理的完整流程到Servlet流程图烟雨国度 http servlet 流程图
HTTP请求处理的完整流程。从TCP三次握手开始，一直到Servlet处理请求并返回响应。首先，让我解释一下response.setContentType("text/html;charset=UTF-8");这行代码：这行代码设置了HTTP响应的Content-Type头。它告诉浏览器：响应的内容类型是HTML(text/html)字符编码是UTF-8(charset=UTF-8)这样浏览器就知
500吨“翔”要来了，我们投“翔”么？蜗牛哒嗒
AD：打开支付宝首页搜索“7857987”立即领取红包事件起因：小区直线距离不到500米的地方要建一个大型垃圾站了，每天能处理500吨的垃圾！！！以后的日子里……不能淡定了。。。公示摘要：项目：罗泾中转站改扩建项目（宝山区生物能源再利用项目）地点：宝山区宝山工业园区潘川路1510号用地面积：8316.63平方米公示网站：宝山区人民政府门户网站看到这个公示的规划设计图，再去百度地图上搜了一看，那距离
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
Axure移动端原型模板实例100+，APP原型设计模版，高保真高交互含大组件库默林工作室 AxureRP原型模板 axure 原型模板
作品概况页面数量：共100+页（长期更新中…）源文件格式：rp格式，兼容AxureRP9/10，非程序软件无源代码适用领域：APP、小程序、H5作品特色本品为「移动端原型模板实例100+」，属于APP+H5+小程序的页面实例原型模板，主要运用了中继器＋动态面板，栏目丰富样式多多，高保真高交互高复用（带仿真交互），可以快速组装成美观大方的原型图。该原型模板的页面尺寸为375×812像素，推荐演示设备
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
使用 LangChain 和 Neo4j 构建智能图数据库查询系统 aehrutktrjk langchain neo4j 数据库 python
使用LangChain和Neo4j构建智能图数据库查询系统引言在本文中，我们将探讨如何结合LangChain和Neo4j图数据库来构建一个智能的图数据库查询系统。这个系统能够将用户的自然语言问题转换为准确的Cypher查询，并生成易于理解的回答。我们将重点关注如何通过实体映射来提高查询的准确性，这对于处理复杂的图数据尤为重要。主要内容1.环境设置首先，我们需要安装必要的包并设置环境变量：#安装必要
早春风景图 1号曹议文
初春，大地复苏，竹林已被新叶染成一片嫩绿；桃树绽放了几朵粉红色的小花；在岸上期待了一个冬天的鸭子早已下水了；河里布满蒌蒿和新出芽的芦苇；田园之美，美轮美奂，独具一格。
小学数学知识记忆的六大技巧海韵互联
记忆是知识的仓库，学过的知识记得牢，积累的知识就丰富，而丰富知识的积累将为创造型人才的培养奠定坚实的基础。如何才能提高学生记忆数学知识的效果呢？下面为大家介绍六种技巧，具体内容如下：一、归类归类记忆法就是根据识记材料的性质、特征及其内在联系，进行归纳分类，以便帮助学生记忆大量的知识。比如，学完计量单位后，可以把学过的所有内容归纳为五类：长度单位；面积单位；体积和容积单位；重量单位；时间单位。这样归
作品设计等你的晚安Z
作品名称：《光影》作品观念：万物皆有裂痕，那是光照进来的地方创作过程：1.地点：楼道、书桌2.时间：中午3.手法：运用手机拍摄加后期加工4.理念：第一张图以楼道为背景，左边灯的开关与照进来的阳光相对应，代表白天有阳光照耀，夜晚也有灯光的照亮，表明只要积极面对生活，内心将不会有黑暗。第二张图以书为主体，“人间失格”、枯叶、光影相结合，表明光阴似箭、时光流逝。作品：
Servlet容器的作用、HttpServlet的工作机制流程图烟雨国度 servlet 流程图 hive
HttpServletRequest解析过程是否GETPOST其他方法Servlet生命周期init-初始化Servletservice-处理请求destroy-销毁ServletgetMethod返回HTTP方法getRequestURI返回请求URIgetQueryString返回查询字符串getParameter返回特定参数值客户端发送HTTP请求服务器接收请求Web容器创建ServletR
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后