mydoubts

dgl框架实现graphsage代码流程梳理

代码git地址：https://github.com/dmlc/dgl/blob/master/examples/pytorch/graphsage/train_sampling.py
dgl在最近的4月份更新的0.4.3版本中增加了dgl.sampling.sample_neighbors的模块，用来采样邻居节点，之前的版本里面实现的graphsage没有做采样，这里记录一下实现的代码过程，对一些地方加了注释：
有几个比较重要的点：
1.RedditDataset数据集232965个节点，节点向量维度是602，edges=114848857,n_classes=41，train_nid 13w训练样本的id
2.dataloader每次yeild一个batch的seed是依次从节点id里取的（见DataLoader立马的batchsamper），然后自定义的collate_fn函数利用这个seed来采样k阶的邻居节点,这里是采样了2阶，采样是取的边数，1000个点采样10000条边，生成第一个block1000-9640的一个二部图，利用9640采样25倍24100的边，生成第二个block9640-10w+节点的二部图，注意的是为了方便计算这里的二部图里src节点里面包含了dst的节点。
3.训练的时候，SAGE网络框架里定义了两层的dglnn.SAGEConv，第一层是602 * 16,第二层转换是16 * 41,其中第一层SAGEConv处理的是block9640-10w+节点的二部图，把src节点的向量发送到dst节点并取均值，加上dst的节点的原始特征向量后，利用全连接转换602 * 16 , 第二层SAGEConv处理
block1000-9640的二部图，同样取均值转换再转换16 * 41。
4.在Inference时候，因为需要采样所以预测过程有点复杂，先算完一层结果再算另一层的结果；
5.采样的函数中是实现了一篇论文中的方法，看起来挺复杂@_@

import dgl
import numpy as np
import torch as th
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torch.multiprocessing as mp
from torch.utils.data import DataLoader
import dgl.function as fn
import dgl.nn.pytorch as dglnn
import time
import argparse
from _thread import start_new_thread
from functools import wraps
from dgl.data import RedditDataset
import tqdm
import traceback

#### Neighbor sampler

class NeighborSampler(object):
    def __init__(self, g, fanouts):
        self.g = g
        self.fanouts = fanouts

    def sample_blocks(self, seeds):
        seeds = th.LongTensor(np.asarray(seeds)) #这个seed一开始是dataloader里的batchsampler，按照batch大小依次把graph的id一个个yeild出来
        blocks = []
        for fanout in self.fanouts: #[10,25]
            # For each seed node, sample ``fanout`` neighbors. 这里的sampler是在v0.4.3版本新加入
            frontier = dgl.sampling.sample_neighbors(g, seeds, fanout, replace=True) #利用1000个seeds得到的10000个边？节点
            # Then we compact the frontier into a bipartite graph for message passing.
            block = dgl.to_block(frontier, seeds) # to_black操作是把将采样的子图转换为适合计算的二部图,这里特殊的地方在于block.srcdata中的id是包含了dstnodeid的
            # Obtain the seed nodes for next layer.
            seeds = block.srcdata[dgl.NID]
            # 一个种子的长度是1000，就是一个batch的索引,1000个一个batch，采样10个邻居，得到10000边9640个点，再采样25个点，得到241000个边，105693个点，Blocks里面是两个子图
            blocks.insert(0, block)
        return blocks

class SAGE(nn.Module):
    def __init__(self,
                 in_feats,
                 n_hidden,
                 n_classes,
                 n_layers,
                 activation,
                 dropout):
        super().__init__()
        self.n_layers = n_layers
        self.n_hidden = n_hidden
        self.n_classes = n_classes
        self.layers = nn.ModuleList()
        self.layers.append(dglnn.SAGEConv(in_feats, n_hidden, 'mean'))
        for i in range(1, n_layers - 1):
            self.layers.append(dglnn.SAGEConv(n_hidden, n_hidden, 'mean'))
        self.layers.append(dglnn.SAGEConv(n_hidden, n_classes, 'mean'))
        self.dropout = nn.Dropout(dropout)
        self.activation = activation

    def forward(self, blocks, x):
        h = x #第一轮输入的x就是采样两次后的二阶相邻点，维度是10w+*602，其实g.ndata的原始标签
        for l, (layer, block) in enumerate(zip(self.layers, blocks)):
            # We need to first copy the representation of nodes on the RHS from the，两层SAGEConv分别对应两个block
            # appropriate nodes on the LHS.
            # Note that the shape of h is (num_nodes_LHS, D) and the shape of h_dst
            # would be (num_nodes_RHS, D)，blocks0是左9640右10w+的二部图，block1是左1000右9640的二部图
            h_dst = h[:block.number_of_dst_nodes()] # 每一阶的节点里面都包含了他的dst节点在序列的最前面，方便计算。但是这个是怎么抽样的？dgl.to_blockd函数定义里有说。。
            # Then we compute the updated representation on the RHS.
            # The shape of h now becomes (num_nodes_RHS, D)
            h = layer(block, (h, h_dst)) #block是dglnn.SAGEConv().forward(graph,feat)中的graph,feat=(h,h_dst)，h是10w的起始节点特征，h_dst是目的节点的特征
            if l != len(self.layers) - 1: #当汇聚方式是mean的时候，SAGEConv实现了，把h的所有特征发送到dst节点，根据dst节点求平均，加上dst节点的原始特征，接一个fc层输出dst节点的新的特征，如果是gcn的话，其实跟mean基本一样，具体可以看dglnn.SAGEConv里面的4种聚合函数的定义，所谓定义graphsage需要学习的参数权重就是这里SAGEConv内部的权重，比如这里602的维度转换为41的权重。
                h = self.activation(h)
                h = self.dropout(h)
        return h

    def inference(self, g, x, batch_size, device):
        """
        Inference with the GraphSAGE model on full neighbors (i.e. without neighbor sampling).
        g : the entire graph.
        x : the input of entire node set.

        The inference code is written in a fashion that it could handle any number of nodes and
        layers.
        """
        # During inference with sampling, multi-layer blocks are very inefficient because
        # lots of computations in the first few layers are repeated.
        # Therefore, we compute the representation of all nodes layer by layer.  The nodes
        # on each layer are of course splitted in batches.
        # TODO: can we standardize this?
        nodes = th.arange(g.number_of_nodes())
        for l, layer in enumerate(self.layers):
            y = th.zeros(g.number_of_nodes(), self.n_hidden if l != len(self.layers) - 1 else self.n_classes)

            for start in tqdm.trange(0, len(nodes), batch_size):
                end = start + batch_size
                batch_nodes = nodes[start:end]
                block = dgl.to_block(dgl.in_subgraph(g, batch_nodes), batch_nodes)
                input_nodes = block.srcdata[dgl.NID]

                h = x[input_nodes].to(device)
                h_dst = h[:block.number_of_dst_nodes()]
                h = layer(block, (h, h_dst))
                if l != len(self.layers) - 1:
                    h = self.activation(h)
                    h = self.dropout(h)

                y[start:end] = h.cpu()

            x = y
        return y

def prepare_mp(g):
    """
    Explicitly materialize the CSR, CSC and COO representation of the given graph
    so that they could be shared via copy-on-write to sampler workers and GPU
    trainers.

    This is a workaround before full shared memory support on heterogeneous graphs.
    """
    g.in_degree(0)
    g.out_degree(0)
    g.find_edges([0])

def compute_acc(pred, labels):
    """
    Compute the accuracy of prediction given the labels.
    """
    return (th.argmax(pred, dim=1) == labels).float().sum() / len(pred)

def evaluate(model, g, inputs, labels, val_mask, batch_size, device):
    """
    Evaluate the model on the validation set specified by ``val_mask``.
    g : The entire graph.
    inputs : The features of all the nodes.
    labels : The labels of all the nodes.
    val_mask : A 0-1 mask indicating which nodes do we actually compute the accuracy for.
    batch_size : Number of nodes to compute at the same time.
    device : The GPU device to evaluate on.
    """
    model.eval()
    with th.no_grad():
        pred = model.inference(g, inputs, batch_size, device)
    model.train()
    return compute_acc(pred[val_mask], labels[val_mask])

def load_subtensor(g, labels, seeds, input_nodes, device):
    """
    Copys features and labels of a set of nodes onto GPU.
    """
    batch_inputs = g.ndata['features'][input_nodes].to(device)
    batch_labels = labels[seeds].to(device)
    return batch_inputs, batch_labels

#### Entry point
def run(args, device, data):
    # Unpack data, in_feats=602 ,nodes=232965 ,edges=114848857,n_classes=41，train_nid 13w训练样本的id
    train_mask, val_mask, in_feats, labels, n_classes, g = data
    train_nid = th.LongTensor(np.nonzero(train_mask)[0]) #np.nonzeros()返回元组(分别描述非0元素的位置二维)
    val_nid = th.LongTensor(np.nonzero(val_mask)[0])
    train_mask = th.BoolTensor(train_mask)
    val_mask = th.BoolTensor(val_mask)

    # Create sampler初始化，默认的fanout是10,25，这个的意思是一阶抽10倍，2阶抽25倍
    sampler = NeighborSampler(g, [int(fanout) for fanout in args.fan_out.split(',')])

    # Create PyTorch DataLoader for constructing blocks,train—id是15w的数据索引，batch=1000，sampler抽样器，
    dataloader = DataLoader(
        dataset=train_nid.numpy(),
        batch_size=args.batch_size,
        collate_fn=sampler.sample_blocks, #样本不能被batch整除时，需要的处理函数，这里其实是对1000个种子id做抽样，返回block二部图的方法
        shuffle=True,
        drop_last=False,
        num_workers=args.num_workers)

    # Define model and optimizer ，输入维度602，隐层16,n_classes =41
    model = SAGE(in_feats, args.num_hidden, n_classes, args.num_layers, F.relu, args.dropout)
    model = model.to(device)
    loss_fcn = nn.CrossEntropyLoss()
    loss_fcn = loss_fcn.to(device)
    optimizer = optim.Adam(model.parameters(), lr=args.lr)

    # Training loop
    avg = 0
    iter_tput = []
    for epoch in range(args.num_epochs):
        tic = time.time()

        # Loop over the dataloader to sample the computation dependency graph as a list of
        # blocks.
        for step, blocks in enumerate(dataloader):
            tic_step = time.time()

            # The nodes for input lies at the LHS side of the first block.
            # The nodes for output lies at the RHS side of the last block.
            input_nodes = blocks[0].srcdata[dgl.NID] #block0是一个二部图，就是左边9640右边105693个节点(每次采样数量会有变化!!)，边是2410000的二部图，
            seeds = blocks[-1].dstdata[dgl.NID] #seed是种子点1000个，一阶采样是10个边，得到1000-9640的二部图block1,在用9640采样25边，得到9640-105693的二部图block0

            # Load the input features as well as output labels,这里类似把这二hop的105693*603的矩阵作为输出，最后输出的是1000个点。
            batch_inputs, batch_labels = load_subtensor(g, labels, seeds, input_nodes, device) #input_nodes是二阶点的id,batch_inputs是二阶点对应的特征

            # Compute loss and prediction
            batch_pred = model(blocks, batch_inputs)
            loss = loss_fcn(batch_pred, batch_labels)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            iter_tput.append(len(seeds) / (time.time() - tic_step))
            if step % args.log_every == 0:
                acc = compute_acc(batch_pred, batch_labels)
                gpu_mem_alloc = th.cuda.max_memory_allocated() / 1000000 if th.cuda.is_available() else 0
                print('Epoch {:05d} | Step {:05d} | Loss {:.4f} | Train Acc {:.4f} | Speed (samples/sec) {:.4f} | GPU {:.1f} MiB'.format(
                    epoch, step, loss.item(), acc.item(), np.mean(iter_tput[3:]), gpu_mem_alloc))

        toc = time.time()
        print('Epoch Time(s): {:.4f}'.format(toc - tic))
        if epoch >= 5:
            avg += toc - tic
        if epoch % args.eval_every == 0 and epoch != 0:
            eval_acc = evaluate(model, g, g.ndata['features'], labels, val_mask, args.batch_size, device)
            print('Eval Acc {:.4f}'.format(eval_acc))

    print('Avg epoch time: {}'.format(avg / (epoch - 4)))

if __name__ == '__main__':
    argparser = argparse.ArgumentParser("multi-gpu training")
    argparser.add_argument('--gpu', type=int, default=0,
        help="GPU device ID. Use -1 for CPU training")
    argparser.add_argument('--num-epochs', type=int, default=20)
    argparser.add_argument('--num-hidden', type=int, default=16)
    argparser.add_argument('--num-layers', type=int, default=2)
    argparser.add_argument('--fan-out', type=str, default='10,25')
    argparser.add_argument('--batch-size', type=int, default=1000)
    argparser.add_argument('--log-every', type=int, default=20)
    argparser.add_argument('--eval-every', type=int, default=5)
    argparser.add_argument('--lr', type=float, default=0.003)
    argparser.add_argument('--dropout', type=float, default=0.5)
    argparser.add_argument('--num-workers', type=int, default=0,
        help="Number of sampling processes. Use 0 for no extra process.")
    args = argparser.parse_args()
    
    if args.gpu >= 0:
        device = th.device('cuda:%d' % args.gpu)
    else:
        device = th.device('cpu')

    # load reddit data
    data = RedditDataset(self_loop=True)
    train_mask = data.train_mask
    val_mask = data.val_mask
    features = th.Tensor(data.features)
    in_feats = features.shape[1]
    labels = th.LongTensor(data.labels)
    n_classes = data.num_labels
    # Construct graph
    g = dgl.graph(data.graph.all_edges())
    g.ndata['features'] = features
    prepare_mp(g)
    # Pack data
    data = train_mask, val_mask, in_feats, labels, n_classes, g

    run(args, device, data)

图结构数据的构建-DGL库 SatVision-RS 深度学习杂谈人工智能 python
官方文档一、图的特点同构性与异构性相比同构图，异构图里可以有不同类型的节点和边。这些不同类型的节点和边具有独立的ID空间和特征；同构图和二分图只是一种特殊的异构图，它们只包括一种关系节点与边有向图一条边、无向图两条边、加权图具有权重；节点和边可具有多个用户定义的、可命名的特征，用以储存图的节点和边的属性。消息传递（类比神经元）消息传递：定义在每条边上的消息函数，它通过将边上特征与其两端节点的特征相
在Conda中搭建PyTorch+DGL+PyG时需要仔细查看的几个关于版本的网页蛐蛐蛐 conda pytorch 人工智能
这方面的问题我总结过很多次了，例如：基于Conda的PyTorchGeometric报“段错误(核心已转储)”的解决方法_段错误,核心已转储yolov5-CSDN博客但是现在还是能遇到问题，例如今天在一个新的Ubuntu上复现别人论文里的实验，就还是出现了问题。因为这个repo用到了DGL（我也是用DGL和PyG比较多），报了一些诸如：cannotimportname'Mapping'from'c
AutoDL使用conda运行pytorch、dgl 重剑DS 深度学习 conda pytorch 人工智能
环境配置要是出现兼容问题还是挺繁琐的。所以这里记录下成功的配置情况。condacreate--nameTestpython=3.9#构建一个虚拟环境condainitbash&&source/root/.bashrc#更新bashrc中的环境变量condaactivateTest#切换到该虚拟环境pipinstalltorchtorchvisiontorchaudio--index-urlhttp
基于GCN和DGL实现的图上 node 分类, 值得一看!!! Dashesand 分类数据挖掘人工智能
#基于GCN和DGL实现的图上node分类,值得一看!!!基于GCN和DGL实现的图上node分类,值得一看!!!------文章源码下载地址：[点我下载](https://link.juejin.cn?target=http%3A%2F%2Finf.zhihang.info%2Fresources%2Fpay%2F7692.html)[inf.zhihang.info/resources/p…]
HNU-数据挖掘-实验4-链接预测甘晴void #【专选】数据挖掘数据挖掘人工智能
数据挖掘课程实验实验4链接预测计科210X甘晴void202108010XXX文章目录数据挖掘课程实验实验4链接预测实验背景实验要求数据集解析实验建模实验探索过程失败的探索——DGL库DGL库简介读取基因并构建图构建GNN模型训练模型输出结果与可视化模型评估★失败总结任务1数据读取与构建图数据GAT模型定义训练模型评估链接预测结果创建并训练GAT模型链接预测和结果评估图数据可视化部分★结果展示任务
机器学习模型的超参数优化用于分子性质预测 wufeil 药物设计机器学习深度学习 python
在《预测化学分子的nlogP——基于sklearn,deepchem,DGL,Rdkit的图卷积网络模型》中简单介绍了sklearn模型的使用方法。现在来介绍一下，如何对sklearn模型进行超参数优化。要想获得更好的模型，离不开超参数优化。这里的目的是：示例使用交叉验证结合网格搜索，对机器学习模型进行超参数优化。一、导入相关模块主要是pandas和sklearn的模型及模型评价指标。import
NeuralKG运行备忘 GCTTTTTT 知识图谱知识图谱
环境配置：condacreate-nneuralkgpython=3.8condaactivateneuralkgpipinstalltorch==1.9.1+cu111-fhttps://download.pytorch.org/whl/torch_stable.htmlpipinstalldgl-cu111dglgo-fhttps://data.dgl.ai/wheels/repo.htmlp
基于graphsage的欺诈用户风险识别 MO2T 图分析与挖掘 neo4j
图技术利用neo4j、networkx、dgl、python做图分析挖掘【1】最短路径算法dijkstra【2】基于networkx的隐性集团关系识别模型【3】基于Neo4j的担保社群型态分析挖掘【4】基于python求有向无环图中target到其他节点全路径【5】有向图中任意两点的路径【6】图基础入门【7】知识图谱快速入门基于graphsage的欺诈用户风险识别图技术前言一、赛题说明1.数据描述
Graph2NLP浅谈 MO2T 图分析与挖掘知识图谱人工智能算法
图技术利用neo4j、networkx、dgl、python做图分析挖掘【1】最短路径算法dijkstra【2】基于networkx的隐性集团关系识别模型【3】基于Neo4j的担保社群型态分析挖掘【4】基于python求有向无环图中target到其他节点全路径【5】有向图中任意两点的路径【6】图基础入门【7】知识图谱快速入门【8】基于graphsage的欺诈用户风险识别Graph2NLP浅谈图技术
GraphSAGE 到底在训练什么？图上的Mini-Batch 是怎么训练的 ? chuanauc batch 深度学习 pytorch
1.一个端到端的同构图全图训练（Cora数据集）GraphSAGE模型节点分类代码：再次重申下什么是全图训练：全图(使用所有的节点和边的特征)上的训练只需要使用上面定义的模型进行前向传播计算，并通过在训练节点上比较预测和真实标签来计算损失，从而完成后向传播。'''DGL为GraphSAGE实现了2种训练：full-graph和mini-batch:下面这个代码就是full-graph的GraphS
【源码复现】《Simple and Deep Graph Convolutional Networks》——GCNII模型鲸可落图神经网络神经网络深度学习算法
目录1、论文简介2、论文核心介绍2.1、研究动机2.2、创新点2.3、具体实现2.3.1、初始残差链接2.3.2、恒等映射2.3.3、模型3、源码复现3.1、Torch复现3.2、DGL复现1、论文简介论文题目——《SimpleandDeepGraphConvolutionalNetworks》论文作者——MingChen，ZheweiWei，ZengfengHuang，BolinDing&Yal
【源码复现】《Towards Deeper Graph Neural Networks》鲸可落图神经网络神经网络深度学习算法
目录1、论文简介2、论文核心介绍2.1、基本概述2.2、模型介绍3、源码复现3.1、torch复现3.2、DGL复现1、论文简介论文题目——《TowardsDeeperGraphNeuralNetworks》论文作者——MengLiu,HongyangGao&ShuiwangJi论文地址——TowardsDeeperGraphNeuralNetworks源码——源码链接2、论文核心介绍2.1、基本
图神经网络22-DGL实战：针对边分类任务的邻居采样训练方法致Great
边分类/回归的训练与节点分类/回归的训练类似，但还是有一些明显的区别。定义邻居采样器和数据加载器用户可以使用和节点分类一样的邻居采样器。sampler=dgl.dataloading.MultiLayerFullNeighborSampler(2)想要用DGL提供的邻居采样器做边分类，需要将其与:class:~dgl.dataloading.pytorch.EdgeDataLoader结合使用。:
dgl 的cuda 版本环境配置(dgl cuda 版本库无法使用问题解决) chuanauc python DGL
1.如果你同时有dgldglcu-XX.XX那么，应该只会运行dgl（DGL的CPU版本），因此，你需要把dgl(CPU)版本给卸载了但是我只卸载CPU版本还不够，我GPU版本的dglcu依旧不好使，因此吧GPU版本的也得卸载了重新安装最新版的dgl我的cuda版本已经不配了，因此，找老的版本：Linux64::Anaconda.org我下载的是这个：DglCuda11.3::Anaconda.o
GCN,GraphSAGE 到底在训练什么呢？ chuanauc python 深度学习开发语言
根据DGL来做的，按照DGL实现来讲述1.GCNCora训练代码：importosos.environ["DGLBACKEND"]="pytorch"importdglimportdgl.dataimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFfromdgl.nn.pytorchimportGraphConvclassGCN(nn.
第4章：图数据处理管道发呆的比目鱼 图神经网络 python 机器学习深度学习
第4章：图数据处理管道DGL在dgl.data里实现了很多常用的图数据集。它们遵循了由dgl.data.DGLDataset类定义的标准的数据处理管道。DGL推荐用户将图数据处理为dgl.data.DGLDataset的子类。该类为导入、处理和保存图数据提供了简单而干净的解决方案。DGLDataset类DGLDataset是处理、导入和保存dgl.data中定义的图数据集的基类。它实现了用于处理图
大咖眼中的AI开源 | 张建：图神经网络和DGL的实际应用亚马逊云开发者网络
6月26日，亚马逊云科技CommunityDay在上海举办。亚马逊云科技首席开发者布道师、资深数据科学家、资深应用科学家以及亚马逊云科技MachineLearningHero悉数到场，针对AI开源的技术趋势及落地实践项目进行分享和讨论。第一期：大咖眼中的AI开源｜王宇博：四位一体，构建开源机器学习生态系统第二期：大咖眼中的AI开源｜王敏捷：深图在人工智能中的探索和研究第三期：大咖眼中的AI开源|吴
DGL中NN模块的构造函数 ♡Coisíní♡ DGL 深度学习人工智能 DGL GNN 图卷积神经网络异构图 GCN
上图引用自：dgl用户文档第三章(nn模块编写）"""构造函数完成以下几个任务：1、设置选项。2、注册可学习的参数或者子模块。3、初始化参数。"""importtorch.nnasnnfromdgl.utilsimportexpand_as_pairimportdgl.nnimportdgl.functionasfnimporttorch.nn.functionalasFfromdgl.utils
DGL在异构图上的GraphConv模块 ♡Coisíní♡ DGL DGL 图卷积神经网络异构图 GCN GNN
回顾同构图GraphConv模块首先回顾一下同构图中实现GraphConv的主要思路（以GraphSAGE为例）：在初始化模块首先是获取源节点和目标节点的输入维度，同时获取输出的特征维度。根据SAGE论文提出的三种聚合操作，需要获取所使用的聚合类型，方便后面使用Pytorch中的nn模块实现。最后是特征归一化操作。其具体的代码段为：获取相关输入特征#获取源节点和目标节点的输入特征维度self._i
跟着官方文档学DGL框架第七天——下载和处理数据集 cqu_shuai DGL 深度学习 python pytorch DGL 图神经网络
参考链接https://docs.dgl.ai/guide/data.html#guide-data-pipelinehttps://docs.dgl.ai/en/0.5.x/_modules/dgl/data/qm7b.html#QM7bDatasetDGLDatasetDGL在dgl.data里实现了很多常用的图数据集。它们遵循了由dgl.data.DGLDataset类定义的标准的数据处理管
DGL的图数据处理管道 ♡Coisíní♡ DGL GCN 图卷积网络图神经网络 python GNN DGL
DGL在dgl.data里实现了很多常用的图数据集。它们遵循了由dgl.data.DGLDataset类定义的标准的数据处理管道。DGL推荐用户将图数据处理为dgl.data.DGLDataset的子类。该类为导入、处理和保存图数据提供了简单而干净的解决方案。DGL中的Dataset类它是处理、导入以及保存dgl.data提供的图数据集的基类，实现了处理图的基本模板。同时，它还提供了一种标准且方便
DGL获取节点邻居代码 Guapifang 图神经网络 python numpy 深度学习
简单记录一下DGL根据节点采样子图的代码。先创建一个简单的同构图。importdglimporttorch#边0->1,0->2,0->3,1->3u,v=torch.tensor([0,0,0,1]),torch.tensor([1,2,3,3])g=dgl.graph((u,v))#节点特征g.ndata['feat']=torch.randn(4,64)#节点标签g.ndata['label
DGL_图的创建、保存、加载 cici_iii DGL 数据挖掘
importdglimporttorchasthfromdgl.data.utilsimportsave_graphsg1=dgl.DGLGraph()g1.add_nodes(3)g1.add_edges([0,0,0,1,1,2],[0,1,2,1,2,2])g1.ndata["x"]=th.ones(3,5)#3个节点的embeddingg1.edata['y']=th.zeros(6,5)
内置函数和消息传递API ♡Coisíní♡ DGL GCN 图卷积神经网络 DGL 异构图深度学习
消息传递范式消息函数、聚合函数与更新函数消息函数接受一个参数edges，这是一个EdgeBatch的实例，在消息传递时，它被DGL在内部生成以表示一批边。edges有src、dst和data共3个成员属性，分别用于访问源节点、目标节点和边的特征。聚合函数接受一个参数nodes，这是一个NodeBatch的实例，在消息传递时，它被DGL在内部生成以表示一批节点。nodes的成员属性mailbox可以
编写高效的消息传递代码-对消息进行降维 ♡Coisíní♡ DGL DGL 图卷积神经网络异构图 GCN GNN GAT GraphSAGE
DGL优化了消息传递的内存消耗和计算速度。利用这些优化的一个常见实践是通过基于内置函数的update_all()来开发消息传递功能。除此之外，考虑到某些图边的数量远远大于节点的数量，DGL建议避免不必要的从点到边的内存拷贝。对于某些情况，比如GATConv，计算必须在边上保存消息，那么用户就需要调用基于内置函数的apply_edges()。有时边上的消息可能是高维的，这会非常消耗内存。DGL建议用
DGL使用笔记脉望虫 Python DGL pytorch 图神经网络
DGL一个基于pytorch的图神经网络库使用方法importdglimporttorchasthg=dgl.graph(([0,0,1,5],[1,2,2,0]))#6个节点，4条边上面为创建图的过程，表示节点0->1,0->2,…有一个连接，这里是有向图，通过bg=dgl.to_bidirected(g)可将有向图直接转换为无向图，默认是64位整数，通过edges=th.tensor([2,5
DGL创建异构图 ♡Coisíní♡ DGL DGL 图神经网络 GCN GNN GraphSAGE GAT
利用DGL创建具有3种节点类型和3种边类型的异构图graph_data={#(src_type,edge_type,dst_type)('drug','interacts','drug'):(th.tensor([0,1]),th.tensor([1,2])),('drug','interacts',,'disease'):(th.tensor([1]),th.tensor([2]))}g=dgl
虚拟环境 ‘import‘ 不是内部或外部命令，也不是可运行的程序或批处理文件。仙女笔记 pycharm ide python
好智障的错误，在终端import检查包时提示如标题所述，但是pycharm里面程序又可以正常运行，原来是需要先在终端里打开python。。。蛋疼的问题问题截图：解决截图：打开pythonpython导入ptorch检查版本importtorchprint(torch.__version__)导入dgl包检查importdgl.datadataset=dgl.data.CoraGraphDatase
使用dgl库实现GCN【官方案例】 ♡Coisíní♡ DGL 图卷积神经网络异构图 GCN GNN
学习目的学习使用gnn进行节点分类的基本工作流程，即预测图中节点的类别。关于GCN节点分类的综述在图数据上最流行和广泛采用的任务之一是节点分类，其中模型需要预测每个节点的真实类别。在图神经网络之前，许多被提出的方法要么单独使用连通性(如DeepWalk或node2vec)，要么简单地结合连通性和节点自身的特征。相比之下，gnn通过结合局部邻域的连通性和特征提供了获得节点表示的机会。Kipf等人将节
再服务器上配置其他版本的DGL 爱吃甜的火龙果巧克力 python
1、先创建pytorch环境：condacreate-nljj_torch190python=3.8condaactivateljj_torch1902、下载pytorch（带上了cuda111）StartLocally|PyTorch这里面没有安装CUDAToolkit，所以需要再安装匹配cuda的toolkits，报错如下：安装：condainstallcudatoolkit=10.2【最新】
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

dgl框架实现graphsage代码流程梳理

你可能感兴趣的:(dgl)