ca1m4n

【GCN】Semi-Supervised Classification with Graph Convolutional Networks

GCN代码详细解读

如何运行
代码详解
- utils.py
GCN的不足[6]
Reference

基于谱分解的经典方法代表之一：GCN, ICLR2017
Paper
Code(pytorch)

如何运行

先看整个代码文件的结构（运行过的）：

运行的话：
首先一键安装需要的库python setup.py install
可能scipy下载有问题，手动pip install scipy即可
然后就可以直接运行了python train.py

200个epoch两秒内跑完(GPU)
只用CPU需要10分钟

~~就是不清楚图的loss这么高也可以，cv中一般不得行~~
验证集和测试集上的loss远大于训练集

代码详解

先看一部分train.py

# load parameters
args = parser.parse_args()
args.cuda = not args.no_cuda and torch.cuda.is_available()

# generate random seed
# 确保在使用 NumPy 和 PyTorch 库时生成的随机数是可重复的
np.random.seed(args.seed)
torch.manual_seed(args.seed)
if args.cuda:
    torch.cuda.manual_seed(args.seed)

# Load data
adj, features, labels, idx_train, idx_val, idx_test = load_data()

# Model and optimizer
model = GCN(nfeat=features.shape[1],
            nhid=args.hidden,
            nclass=labels.max().item() + 1,
            dropout=args.dropout)
optimizer = optim.Adam(model.parameters(),
                       lr=args.lr, weight_decay=args.weight_decay)

主要是加载参数，生成随机种子和加载数据，
重点看到调用模型部分：

model = GCN(nfeat=features.shape[1],
            nhid=args.hidden,
            nclass=labels.max().item() + 1,
            dropout=args.dropout)
optimizer = optim.Adam(model.parameters(),
                       lr=args.lr, weight_decay=args.weight_decay)

这段代码创建一个GNN模型，并将其赋值给变量model；
还创建了一个优化器对象，并将其赋值给变量 optimizer，一般常用Adam，model.parameters() 用于获取模型中需要被训练的参数，这些参数将会被优化器更新。涉及两个超参数：lr是学习率，表示每次参数更新的步长大小。weight_decay是正则化项的权重衰减系数，用于控制模型的复杂度，防止过拟合。

创建模型使用了GCN类，nfeat设置了输入特征的维度，它是features张量的列数，也就是feature的个数；labels.max().item() + 1计算出了类别的数量。具体地，我们可以在model.py找到这个类的定义：
GCN初始化部分

class GCN(nn.Module):
    def __init__(self, nfeat, nhid, nclass, dropout):
        super(GCN, self).__init__()

        self.gc1 = GraphConvolution(nfeat, nhid)
        self.gc2 = GraphConvolution(nhid, nclass)
        self.dropout = dropout

nfeat为底层节点的参数，feature的个数
nhid为隐藏层的节点个数
nclass为最终的分类数
dropout，一种防止过拟合的有效技术，其基本思想是在每批训练过程中随机忽略网络中的某些单元。

gc1输入尺寸nfeat，输出尺寸nhid
gc2输入尺寸nhid，输出尺寸nclass

可以看到，model初始化实际是在GraphConvolution类中完成的，在文件layer.py里

# bias 是一个布尔参数，指示是否应该包括偏差项
def __init__(self, in_features, out_features, bias=True):

# 以输入输出的特征维度构造权重张量（tensor）
self.weight = Parameter(torch.FloatTensor(in_features, out_features))

参数初始化部分：
（为了让每次训练产生的初始参数尽可能的相同，从而便于实验结果的复现）
def reset_parameters(self):
# 标准差，均匀初始化（通常基于经验或调优）
stdv = 1. / math.sqrt(self.weight.size(1)) # size()函数统计矩阵元素个数：size(0)列，size(1)行
# uniform()方法将在[-stdv, stdv]范围内随机生成下一个实数
self.weight.data.uniform_(-stdv, stdv)
if self.bias is not None:
self.bias.data.uniform_(-stdv, stdv)
前向传播部分：
(GCN卷积公式推导在接下来的part)
support = torch.mm(input, self.weight) # mm 执行二维矩阵相乘
output = torch.spmm(adj, support) # spmm 执行稀疏矩阵乘法
$\hat{A}XW$ ，即邻接矩阵，输入特征，权重三个矩阵相乘

以上是GCN类初始化的示意
继续看，GCN类的前向传播部分

    def forward(self, x, adj):
        x = F.relu(self.gc1(x, adj))
        x = F.dropout(x, self.dropout, training=self.training)
        x = self.gc2(x, adj)
        return F.log_softmax(x, dim=1)

涉及到论文的核心部分，GCN结构及其卷积操作：

结合[1][3]可以推导出GCN-Filter卷积操作
$f^{\prime}=\theta \tilde D^{-\frac{1}{2}} \tilde A \tilde D^{-\frac{1}{2}}f$

简单来说，就是在Cheby-Filter上做的限制和再归一化技巧（对于Cheby-Filter的推导也可以跟着[3]）

限制：

将切比雪夫多项式的阶数K设为1(通过堆叠多层GCN来解决简化后只能建立一阶邻居的依赖的代价)

定义 ${\lambda}_{max} \approx2$ (有理论证明[4] ${\lambda_{N}}\leq2$ )

简化运算复杂度：令参数 $\theta=\theta_0^{\prime}=-\theta_1^{\prime}$

renormalization trick：
对称归一化

GCN：

那么再结合论文提供的网络结构图来理解

首先，获取节点的特征表示 $X$ 并计算邻接矩阵 $\hat{A}=\tilde D^{-\frac{1}{2}} \tilde A \tilde D^{-\frac{1}{2}}$ ；
然后，输入到一个两层（如图a）的GCN网络中（前一层的输出作为下一层的输入），得到每个标签的预测结果。
本文隐藏层使用的激活函数为ReLU，输出层的激活函数为softmax，因此标签的预测结果表示为（成为论文中的样子了）：

另外，文中提到，“对于半监督分类问题，使用所有labeled节点的交叉熵作为损失函数…在这项工作中，我们使用完整数据集对每个训练迭代执行批量梯度下降。”

前向传播就是这么个操作，现在再回看到代码就可以理解了

def forward(self, x, adj):
	# 拥有节点特征x和对称邻接矩阵输入
	# 给第一层GCN后，接激活函数ReLU
	x = F.relu(self.gc1(x, adj))
	# 输出进行dropout，防止过拟合
    x = F.dropout(x, self.dropout, training=self.training)
    # 经过第二层GCN
    x = self.gc2(x, adj)
    # 通过softmax回归得到最终的输出，维度为1
    # （对于分类任务通常会使用softmax函数将输出转化为概率分布）
    return F.log_softmax(x, dim=1)

以上属于本文的核心代码，在train.py中完成对函数的调用
还可以看到train.py中定义了训练和测试过程
直接写上代码注释，不单列叙述

# 对某epoch进行训练
def train(epoch):
    # 返回当前时间
    t = time.time()
    # 将模型设置为训练模式。在训练模式下，框架会自动跟踪参数的梯度
    model.train()
    # 优化器梯度置为零。因为梯度在每个迭代中都会累积
    optimizer.zero_grad()
    # 将特征值和邻接矩阵输入模型，得到输出
    output = model(features, adj)
    # 计算损失，在output计算就是我们的模型中已经使用了softmax损失(可回顾前面的叙述）
    # 可以理解为CrossEntropLoss()=log_softmax()+NLLLoss() cite from [5]
    loss_train = F.nll_loss(output[idx_train], labels[idx_train])
    # 计算accuracy
    acc_train = accuracy(output[idx_train], labels[idx_train])
    # 反向传播
    loss_train.backward()
    # 更新所有参数
    # 由反向传播计算的模型参数的梯度指导更新模型的权重
    optimizer.step()

    # 如果不执行验证操作
    if not args.fastmode:
        # 单独评估验证集的性能,不使用dropout
        # 将模型设置为测试模式：不更新梯度
        model.eval()
        output = model(features, adj)

    # 对验证集计算loss和accuracy
    # 验证集的反馈可以影响模型的选择，调整和训练过程，以改进模型的性能
    loss_val = F.nll_loss(output[idx_val], labels[idx_val])
    acc_val = accuracy(output[idx_val], labels[idx_val])
    # 打印训练、验证的信息
    print('Epoch: {:04d}'.format(epoch+1),
          'loss_train: {:.4f}'.format(loss_train.item()),
          'acc_train: {:.4f}'.format(acc_train.item()),
          'loss_val: {:.4f}'.format(loss_val.item()),
          'acc_val: {:.4f}'.format(acc_val.item()),
          'time: {:.4f}s'.format(time.time() - t))


# 定义测试函数
# 测试集是用来最终评估模型在实际应用中的性能
def test():
    model.eval()
    output = model(features, adj)
    loss_test = F.nll_loss(output[idx_test], labels[idx_test])
    acc_test = accuracy(output[idx_test], labels[idx_test])
    print("Test set results:",
          "loss= {:.4f}".format(loss_test.item()),
          "accuracy= {:.4f}".format(acc_test.item()))


# Train model
t_total = time.time()
# 逐个epoch进行训练
for epoch in range(args.epochs):
    train(epoch)
print("Optimization Finished!")
# 打印总运行时长
print("Total time elapsed: {:.4f}s".format(time.time() - t_total))

# Testing
test()

utils.py

独热码处理
也称为一位有效编码，是一种用于将分类数据转换为数值数据的编码方法。
在很多分类任务中，特征标签通常都是不连续的内容（如本文中的特征是离散的字符串类型），为了便于后续计算、处理，需要将所有标签提取并映射到一个独热码向量中。[5]

def encode_onehot(labels):
    # 将所有标签整合成一个不重复的列表，可以知道标签中有多少不同的类别
    classes = set(labels)  # set()函数创建一个无序不重复元素集
    # 创建一个字典，索引为label，值为独热码向量
    classes_dict = {c: np.identity(len(classes))[i, :] for i, c in  # 创建一个len(classes)行的单位矩阵，选取矩阵中的第i行表示c
                    enumerate(classes)}    # 迭代classed集合中不同类别，获取他们的索引i和值c
    # 将标签转换为独热编码
    labels_onehot = np.array(list(map(classes_dict.get, labels)),
                             dtype=np.int32)  # map()会根据提供的函数对指定序列做映射,list()将映射结果转换为列表,再到numpy数组
    return labels_onehot # 包含了独热编码后的标签的numpy数组

特征归一化函数
对于本文使用的cora的数据集来说，每一行是一个样本，每一个样本是1433个特征，但又大多数为0，所以使用稀疏矩阵的方式进行存储。

def normalize(mx):
    """Row-normalize sparse matrix"""
    rowsum = np.array(mx.sum(1))
    r_inv = np.power(rowsum, -1).flatten()
    # 在计算倒数的时候存在一个问题:如果原来的值为0，则其倒数为无穷大
    # 因此需要对r_inv中无穷大的值进行修正，更改为0
    r_inv[np.isinf(r_inv)] = 0.
    r_mat_inv = sp.diags(r_inv)
    mx = r_mat_inv.dot(mx)
    return mx

scipy稀疏矩阵转换为torch稀疏向量
这种转换确保了稀疏数据可以与深度学习模型无缝集成，同时充分利用了稀疏性质带来的内存和计算效益。

def sparse_mx_to_torch_sparse_tensor(sparse_mx):
    """Convert a scipy sparse matrix to a torch sparse tensor."""
    sparse_mx = sparse_mx.tocoo().astype(np.float32)
    indices = torch.from_numpy(
        np.vstack((sparse_mx.row, sparse_mx.col)).astype(np.int64))
    values = torch.from_numpy(sparse_mx.data)
    shape = torch.Size(sparse_mx.shape)
    return torch.sparse.FloatTensor(indices, values, shape)

加载数据

def load_data(path="../data/cora/", dataset="cora"):
    """Load citation network dataset (cora only for now)"""
    print('Loading {} dataset...'.format(dataset))

    # 读出cora文件中的内容，以二维数组的形式存储
    idx_features_labels = np.genfromtxt("{}{}.content".format(path, dataset),
                                        dtype=np.dtype(str))
    # 以稀疏矩阵（采用CSR格式压缩）存储数据中的特征
    features = sp.csr_matrix(idx_features_labels[:, 1:-1], dtype=np.float32)
    labels = encode_onehot(idx_features_labels[:, -1])

    # build graph

    # 将每篇文献的编号提取出来
    idx = np.array(idx_features_labels[:, 0], dtype=np.int32)
    # 对文献的编号构建字典
    idx_map = {j: i for i, j in enumerate(idx)}
    # 读取cite文件
    edges_unordered = np.genfromtxt("{}{}.cites".format(path, dataset),
                                    dtype=np.int32)
    # 生成图的边
    edges = np.array(list(map(idx_map.get, edges_unordered.flatten())),
                     dtype=np.int32).reshape(edges_unordered.shape)
    # 生成邻接矩阵
    adj = sp.coo_matrix((np.ones(edges.shape[0]), (edges[:, 0], edges[:, 1])),
                        shape=(labels.shape[0], labels.shape[0]),
                        dtype=np.float32)

    # build symmetric adjacency matrix
    # 无向图的领接矩阵是对称的，因此需要将上面得到的矩阵转换为对称的矩阵，从而得到无向图的领接矩阵
    adj = adj + adj.T.multiply(adj.T > adj) - adj.multiply(adj.T > adj)

    features = normalize(features)
    # A^ = A + I
    adj = normalize(adj + sp.eye(adj.shape[0]))  # sp.eye(adj.shape[0])创建了一个大小与邻接矩阵相同的单位矩阵

    idx_train = range(140)
    idx_val = range(200, 500)
    idx_test = range(500, 1500)
    
    # 转换为tensor
    features = torch.FloatTensor(np.array(features.todense()))
    labels = torch.LongTensor(np.where(labels)[1])
    adj = sparse_mx_to_torch_sparse_tensor(adj)

    idx_train = torch.LongTensor(idx_train)
    idx_val = torch.LongTensor(idx_val)
    idx_test = torch.LongTensor(idx_test)

    return adj, features, labels, idx_train, idx_val, idx_test

GCN的不足[6]

GCN的优势：

权值共享，参数共享
局部连接，参数少
感受野正比于卷积层层数，也就是随着卷积层的增加，远处邻居的信息也会逐渐聚集
复杂度大大降低，不用计算拉普拉斯矩阵和特征分解

后续改进针对不足：

扩展性差：需要已知所有节点来计算邻接矩阵
局限于浅层：文中表明目前GCN只局限于浅层，实验中使用两层GCN效果最好，为了加深，需要使用残差连接等trick，但是即使使用了这些trick，也只能勉强保存性能不下降，并没有提高
不能处理有向图：因为推导过程中用到拉普拉斯矩阵的特征分解需要满足拉普拉斯矩阵是对称矩阵的条件（也就是只能处理无向图）

Reference

[1] 图卷积神经网络(GCN)详解：包括了数学基础(傅里叶，拉普拉斯)
[2] Graph Convolution Network图卷积网络（二）数据加载与网络结构定义
[3] 马耀, 汤继良.图深度学习
[4] Laplacian Matrices
[5] pytorch框架下—GCN代码详细解读
[6] 图卷积网络 GCN Graph Convolutional Network（谱域GCN）的理解和详细推导

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Leetcode 3604. Minimum Time to Reach Destination in Directed Graph Espresso Macchiato leetcode笔记 leetcode 3604 leetcode medium leetcode双周赛160 BFS 广度优先遍历最优路径
Leetcode3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路2.代码实现题目链接：3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路这一题思路上就是一个广度优先遍历，我们不断考察当前时间点以及位置的情况下，下一个点可行的位置，然后考察最近的时间点能够到达的位置，遍历全部可能
面试官：Spring 如何控制 Bean 的加载顺序？
在大多数情况下，我们不需要手动控制Bean的加载顺序，因为Spring的IoC容器足够智能。核心原则：依赖驱动加载SpringIoC容器会构建一个依赖关系图（DependencyGraph）。如果BeanA依赖于BeanB（例如，A的构造函数需要一个B类型的参数），Spring会保证在创建BeanA之前，BeanB已经被完全创建和初始化好了。@ServicepublicclassServiceA{
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
关于香橙派系统烧录，1.1.8或者1.1.10两个版本都无法启动Orangepi5 lindsayshuo ubuntu
先执行gitclonehttps://github.com/orangepi-xunlong/orangepi-build.gitgitlog默认会显示较新的提交记录。如果你需要查看更多的提交记录，可以使用以下方法：gitlog--oneline--graph--all这会以简洁的方式显示所有分支的提交记录，并以图形化的方式展示提交历史。输出如下：*7ebb9a0(HEAD->next,origi
LeetCode第317题_离建筑物最近的距离 @蓝莓果粒茶算法 leetcode linux 算法 c#学习 python c++
LeetCode第317题：离建筑物最近的距离文章摘要本文详细解析LeetCode第317题"离建筑物最近的距离"，这是一道图论和广度优先搜索的问题。文章提供了基于多源BFS的解法，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合想要提升图论算法能力的程序员。核心知识点：广度优先搜索、图论、矩阵遍历难度等级：困难推荐人群：具有图论基础，想要提升算法能力的程序员题目描述
【前端】接口日志追踪毕业茄前端
1.问题描述场景：前端提交数据后，接口回调再次添加参数，但页面跳转/刷新导致之前的console.log数据丢失。影响：无法追踪完整的请求流程，调试困难。2.环境信息项目说明浏览器GoogleChrome120+开发者工具ChromeDevTools技术栈前端：Vue/React/其他接口类型RESTfulAPI/GraphQL3.解决方案3.1保留控制台日志（推荐）步骤：打开Chrome开发者工
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
pycharm无法识别conda环境（已解决） Reborker pycharm conda ide
文章目录前言研究过程解决办法前言好久不用pycharm了，打开后提示更新，更新到了2023.1版本。安装conda后在新建了一个虚拟环境pytorch，但是无论是基础环境还是虚拟环境，pycharm都识别不出conda里的python.exe(如图)。如果不想看啰嗦直接看后面的解决办法，比较闲的话可以看看我的研究过程。研究过程看了很多博客，尝试了以下解决办法：加载conda.bat文件，虽然出现了
编写文生视频提示词，制作抖音爆款视频才华横溢caozy 提示词生成人工智能 deepseek 文生视频
编写文生视频提示词，制作抖音爆款视频一、理解文生视频提示词1.1定义提示词1.1.1提示词与创作工具的关系1.1.2文生视频的功能1.2提示词的组成1.2.1主体（Subject）1.2.2动作（Action）1.2.3场景（Scene）1.2.4镜头语言（Cinematography）1.2.5光影效果（LightingandShadows）1.2.6氛围（MoodandAtmosphere）1
jetson agx orin 刷机、cuda、pytorch配置指南【亲测有效】
jetsonagxorin刷机指南注意事项刷机具体指南cuda环境配置指南Anconda、Pytorch配置注意事项1.使用设备自带usbtoc的传输线时，注意c口插到orin左侧的口，右侧的口不支持数据传输；2.刷机时需准备ubuntu系统，可以是虚拟机，注意安装SDKManager刷机时，JetPack版本要选对，JetPack6.0的对应ubuntu22，cuda12版本，对应pytorch
FFmpeg滤镜相关的重要结构体 melonbo FFMPEG ffmpeg
核心结构体概览FFmpeg滤镜系统由多个关键结构体组成，构成了完整的滤镜处理框架。以下是滤镜系统中最重要的结构体及其相互关系：AVFilterGraph┬─AVFilterContext┬─AVFilter│├─AVFilterLink│└─AVFilterPad└─AVFilterInOut详细结构体分析1.AVFilterGraph（滤镜图容器）功能：管理整个滤镜图的所有组件和状态重要成员：t
Yolov5-obb(旋转目标poly_nms_cuda.cu编译bug记录及解决方案)
关于在执行pythonsetup.pydevelop#or"pipinstall-v-e."时poly_nms_cuda.cu报错问题。前面步骤严格按照install.md环境1.pytorch版本较低时（我的是1.10）：poly_nms_cuda.cu文件添加”#defineeps1e-8“，删除“constdoubleeps=1E-8;”这句2.pytorch版本较高时（我用的是1.27）h
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
工业日志AI大模型智能分析系统-后端实现
目录项目主要架构完整系统架构主要系统架构解析图思路解析模板json示例主要核心代码示例LangGraph工作流(backend/ai/workflows.py)LangChainAgents(backend/ai/agents.py)Django视图(backend/core/views.py)配置(config.py)响应示例关键优势项目主要架构LangGraph、LangChain、Djang
前端高频面试题深度解析（JavaScript + Vue + jQuery）
前端高频面试题深度解析（JavaScript+Vue+jQuery）一、JavaScript核心问题解析事件冒泡与捕获机制对比：graphLRA[捕获阶段]-->|Window→父元素|B[目标元素]B-->|子元素→父元素|C[冒泡阶段]阻止方法：//阻止冒泡（常用）event.stopPropagation();//阻止捕获+冒泡+默认行为（慎用）event.stopImmediateProp
langgraph的ReAct应用 fishjar100 langgraph 人工智能 ai
一、什么是langgraph的ReActLangGraph中的ReAct（Reasoning+Acting）代理是一种结合推理与行动能力的AI代理架构，通过动态决策链实现复杂任务处理。以下是其核心要点及实践指南。1、ReAct代理的核心原理1.1工作流程：ReAct代理通过循环迭代完成任务：推理（Reason）：模型分析输入和历史上下文，生成思考步骤。行动（Act）：选择工具并调用，或直接响应用户
3D Gaussian Spaltting代码复现全流程与代码结构解读
一、代码复现流程以下部分将详细介绍3DGaussiansplatting的代码复现流程（在ubuntu18.04上训练模型，在windows10上使用SIBR_viewers查看）1、首先在GitHub-graphdeco-inria/gaussian-splatting:Originalreferenceimplementationof"3DGaussianSplattingforReal-Ti
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
Text2Reward学习笔记
1.提示词请问，“glew”是一个RL工程师常用的工具库吗？请问,thiscodebase主要是做什么用的呀？1.1解释代码是否可以请您根据thiscodebase的主要功能，参考PyTorch的文档格式和文档风格，使用Markdown格式为选中的代码行编写一段相应的文档说明呢？2.项目环境配置2.1新建环境[official]2.1.1Featurizecondacreate-p~/work/d
少样本图学习（few-shot learning on graph）知识背景 so.far_away 网络空间安全学习机器学习人工智能
Few-ShotLearningonGraph少样本学习简介少样本图学习简介1.SupportSet和QuerySet（针对单个任务）（1）SupportSet（支持集）（2）QuerySet（查询集）2.BaseData和NovelData（针对整个数据集）（1）BaseData/Classes（基类数据）（2）NovelData/Classes（新类数据）少样本学习简介少样本学习（FSL）旨在
聚合分销系统开发实战：覆盖短剧/小说/外卖/电商/网盘/APP拉新的CPS+CPA双模式技术架构解析 v_qutudy 聚合分销聚合cps+cpa app拉新项目
一、系统架构设计：微服务与中台化双引擎1.1分布式微服务架构采用SpringCloudAlibaba框架构建，将系统拆分为8大核心服务：mermaidgraphTDA[用户中心]-->B[订单服务]A-->C[结算服务]D[内容中台]-->E[短剧服务]D-->F[小说服务]G[生活服务]-->H[外卖接口]G-->I[电商接口]J[网盘服务]-->K[拉新模块]关键技术选型：注册中心：Nacos
C++基础之std::map 羊狗狗一只2022年 c++基础 c++
Cartographer中要用到这里，之前都是直接用，了解不深，现在补,这里是纯搬的，手写一遍加深印象，源地址如下：参考std::map容器使用详细说明_学之之博未若知之之要知之之要未若行之之实的博客-CSDN博客_std::map使用概述：Map是STL的一个关联容器，它提供一对一（其中第一个可以称为关键字，每个关键字只能在map中出现一次，第二个可能称为该关键字的值）的数据处理能力，由于这个特
Swift 图论实战：DFS 算法解锁 LeetCode 323 连通分量个数网罗开发 Swift 算法 swift 图论
文章目录摘要描述示例题解答案DFS遍历每个连通区域Union-Find（并查集）题解代码分析（Swift实现：DFS）题解代码详解构建邻接表DFS深度优先搜索遍历所有节点示例测试及结果示例1示例2示例3时间复杂度分析空间复杂度分析总结摘要图是算法中最具挑战性的结构之一，而“连通分量”这个词听起来也有点像社交网络里的“圈子”概念。给你一张无向图，节点编号从0到n-1，现在请你找出这个图中到底有多少个
Embabel：下一代企业级JVM AI智能体框架的革命引言：AI时代的Java生态新机遇 DZSpace 软件开发 jvm 人工智能 java
在生成式AI（如ChatGPT、Claude、Gemini）席卷全球的背景下，Python凭借其丰富的AI工具链（如PyTorch、LangChain）成为主流开发语言。然而，在企业级软件开发领域，Java和JVM生态（如Kotlin、Scala）长期以来占据主导地位，尤其是在金融、电信、电商等对稳定性、可扩展性、事务管理要求极高的场景。RodJohnson（Spring框架创始人）敏锐地发现了这
Chromium 引擎启用 Skia Graphite后性能飙升罗光记百度 facebook 数据库经验分享 oneapi
在一项被许多开发者关注的性能优化进展中，Chromium项目正逐步将其图形渲染后台从经典的Ganesh迁移至Skia新一代图形后端Graphite，而最新测试结果显示，这一举措带来了显著的性能提升。Skia是谷歌主导的跨平台2D图形库，长期以来一直是Chromium浏览器的核心组成部分。Ganesh是Skia的传统渲染后端，而Graphite是为现代GPU和图形API（如Vulkan和Metal）
【第三章:神经网络原理详解与Pytorch入门】02.深度学习框架PyTorch入门-(4)Pytorch实战 IT古董人工智能课程深度学习神经网络 pytorch
第三章:神经网络原理详解与Pytorch入门第二部分：深度学习框架PyTorch入门第四节：Pytorch模型构建内容：如何搭建复杂网络以及如何修改模型与保存一、构建复杂神经网络结构在PyTorch中，构建复杂模型通常通过继承nn.Module类，分模块组织层与前向传播逻辑。示例：自定义一个卷积神经网络（CNN）importtorch.nnasnnimporttorch.nn.functional
jetson orin nano安装GPU版本的pytorch过程小鲈鱼- pytorch 人工智能 python
一、安装jetpack组件和安装CUDA/cuDNN可以参考下面这个博客「解析」JetsonOrinNX安装CUDA/cuDNN_jetsoncuda-CSDN博客二、安装Pytorch和torchaudio可以直接看官方给的步骤https://pytorch.org/audio/main/build.jetson.html
lstm 输入数据维度_[mcj]pytorch中LSTM的输入输出解释||LSTM输入输出详解萬重 lstm 输入数据维度
最近想了解一些关于LSTM的相关知识，在进行代码测试的时候，有个地方一直比较疑惑，关于LSTM的输入和输出问题。一直不清楚在pytorch里面该如何定义LSTM的输入和输出。首先看个pytorch官方的例子：#首先导入LSTM需要的相关模块importtorchimporttorch.nnasnn#神经网络模块#数据向量维数10,隐藏元维度20,2个LSTM层串联(如果是1，可以省略，默认为1)r
pytorch 自动微分 this_show_time pytorch 人工智能 python 机器学习
自动微分1.基础概念1.1.**张量**1.2.**计算图**：1.3.**反向传播**1.4.**梯度**2.计算梯度2.1标量梯度计算2.2向量梯度计算2.3多标量梯度计算2.4多向量梯度计算3.梯度上下文控制3.1控制梯度计算（withtorch.no_grad()）3.2累计梯度3.3梯度清零(torch.zero_())自动微分模块torch.autograd负责自动计算张量操作的梯度，
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。