智慧的旋风

GNN典型模型的各阶段执行时间与算子分析

GNN模型的阶段划分

参考资料：https://pytorch-geometric.readthedocs.io/en/latest/notes/create_gnn.html。
图卷积算子（operator）可以被表示为消息传递机制。
$\mathbf{x}_i^{\prime} = \mathbf {Update} \left( \mathbf{x}_i, \mathbf {Aggregate}_{j \in \mathcal{N}(i)} \left( \mathbf{Message} \left(\mathbf{x}_i, \mathbf{x}_j,\mathbf{e}_{j,i}\right) \right)\right)$
常规的阶段可以被细分为Linear、Message、Aggregate和Update这四个阶段，这里的Message+Aggregate可以看作是MPNN中的聚合阶段，Linear+Update可以看作是MPNN中的更新阶段：

GNN框架

聚合阶段

更新阶段

Message

Aggregate

Linear

Update

Linear：用来对邻居节点的特征维度进行变换。 一般就是一个Linear层（矩阵乘法）。
Message：用来对邻居节点的特征数值进行归一化。 一般是x_j和norm进行乘法操作，norm可以是注意力权重、归一化权重等等。
Aggregate：聚合上一步处理好的每个节点的邻居节点特征（生成一条消息）。 一般是对于邻居特征矩阵的scatter归约操作。[N，out_dim]
Update：通过上一步生成的消息更新当前层节点的嵌入表示。 可以是MLP，很多模型因为有self-loop所以没有这个阶段。使用 $x_i$ 与 $m_{N(i)}$ 进行更新。

在PyG中，GConv层会首先将特征矩阵X通过Linear层做一个特征维度的变换，然后显示调用self.propagate方法进行消息传递操作（即便是自定义的图卷积层也必须遵循），而self.propagate又会去调用self.message、self.aggregate和self.update方法依次执行各个阶段的操作。

除此之外，一些空域卷积模型还有Sample阶段，如GraphSAGE。在Sample阶段，每个batch都会采样k-hop的邻居，并且每个GConv层都是使用k个采样集合迭代的进行卷积操作。

JK-Nets为了提高表达能力，提出了层聚合（layer-aggregate）的概念，它的主要思想是在原有卷积层后对所有的中间层进行再次聚合。

实验中使用的GNN模型

ChebNet、GCN、GAT、GraphSAGE、JK-Nets。
ChebNet是频域卷积，其他模型是空域卷积。除了JK-Nets外，其余的模型均使用了2层的结构。GraphSAGE模型每层采样2-hop的邻居节点。

GNN模型的各阶段执行时间

修改了MessagePassing类和不同模型的GConv层，搭建GNN-Net。各阶段的执行时间是每个epoch训练的平均时间（GraphSAGE每个epoch包含很多个batch）。

代码上传到了github：https://github.com/ytchx1999/PyG-GNN-Test

实验环境：云服务器 + 一块Tesla T4 + PyTorch Geometric。
- CPU
  型号：Intel® Xeon® Gold 5218 CPU
  内存：128G
  内核：64核
- GPU
  Tesla T4 *1
  显存：16G
数据集：Cora。
计时单位：ms。

各阶段的执行时间/ms	Sample	Linear	Message	Aggregate	Update	layer-aggregate*
ChebNet（2层）	❎	2.2874	0.0436	0.2163	0.0012	❎
GCN（2层）	❎	2.2451	0.0403	0.1350	0.0012	❎
GAT（2层）	❎	2.2947	2.8942	0.1364	0.0013	❎
GraphSAGE（2层、minibatch）	414.3549	24.4504	0.0173	10.8453	1.0079	❎
JK-Nets（6层）	❎	2.3020	0.1121	0.3224	0.0037	0.0842

本地CPU的实验：
- Intel® Core™ i5-1038NG7 CPU @ 2.00GHz
- 内存：16G
- 内核：4核

各阶段的执行时间/ms	Sample	Linear	Message	Aggregate	Update	layer-aggregate*
ChebNet（2层）	❎	2.1374	40.1639	224.2229	0.0041	❎
GCN（2层）	❎	1.1456	0.3615	0.8195	0.0025	❎
GAT（2层）	❎	2.3111	5.5557	4.9341	0.0029	❎
GraphSAGE（2层、minibatch）	72.9241	2.1413	0.0490	25.7912	1.1896	❎
JK-Nets（6层）	❎	1.2503	0.9868	3.4509	0.0069	1.4495

GNN模型各阶段的算子种类及特征

各模型不同阶段的运算（除了ChebNet），均写成node-wise的形式。

各阶段的运算	Sample	Linear+Message	Aggregate	Update	layer-aggregate*
ChebNet（2层）	❎	$\mathbf{Z}^{(k)} \cdot \mathbf{\Theta}^{(k)}$	sum	无	❎
GCN（2层）	❎	$\mathbf{\Theta}\frac{1}{\sqrt{\hat{d}_j \hat{d}_i}} \mathbf{x}_j$	sum	self-loop	❎
GAT（2层）	❎	$\alpha_{i,j}\mathbf{\Theta}\mathbf{x}_{j}$	sum	self-loop	❎
GraphSAGE（2层、minibatch）	依次采样k-hop邻居	$\mathbf{W_2} \cdot \mathbf{x}_j$	mean	$\mathbf{W}_1 \mathbf{x}_i +m_{N(i)}$	❎
JK-Nets（6层）	❎	$\mathbf{\Theta}\frac{1}{\sqrt{\hat{d}_j \hat{d}_i}} \mathbf{x}_j$	sum	self-loop	max

【以下均是基于PyTorch Geometric的源码、结合实验现象进行的讨论】

实验所使用的图数据结构：

属性数据（特征信息）–>特征矩阵X：[num_nodes, num_node_features]
结构数据（邻居/边信息）–>COO格式的边表edge_index：[2, num_edges]——为后面Aggregate阶段的scatter操作埋下了伏笔！

各阶段算子种类及特征分析

Linear：主要是对特征维度进行变换。

这里，为了增加计算的并行性、减少重复计算，同时也为了能够在此阶段不进行遍历操作，整形阶段一般是经过一个Linear层对特征矩阵X的维度进行变换。换句话说就是个矩阵乘法——特征矩阵X * 权重矩阵 $\mathbf{\Theta}$ 。
Linear阶段的算子就是矩阵乘法，是计算密集型的操作。

Message：对特征值进行归一化操作。

同整形阶段的原因，此阶段是对边表edge_index中的所有target_node组成的特征矩阵进行操作，同样是矩阵乘法——target_node特征矩阵X_j * 归一化矩阵Norm。
经过上面的分析，Message阶段因为不进行遍历操作，大部分时间都在进行矩阵的乘法运算。因此，我认为Message阶段的算子就是矩阵乘法，这也就意味着此阶段是计算密集型的操作。

Aggregate：我认为这才是GNN最核心的部分（区别于CNN），核心算子可以归纳为scatter（归约）操作。专门由torch_scatter实现（递归地阅读源代码，发现原理还是torch中的scatter）。https://pytorch-scatter.readthedocs.io/en/latest/。

其实在没仔细研究之前，我一直认为Aggregate阶段需要显式的遍历邻居节点，此外，对于为什么要使用边表而不是其他的图数据结构，我心里一直有一些疑问。直到发现这里的scatter操作，顿时感觉豁然开朗了，之前的疑问也都能解释了。
scatter的精髓其实是巧妙地利用了边表的索引特性。index其实是edge_index[1]，表示target节点的id号。那么矩阵src又是如何得到的呢？——其实是利用src节点的id号edge_index[0]、节点的特征矩阵X构造出来的。这样，使用矩阵，也可以“无形”之中（隐式）建立一种规整的（regular）邻居对应关系。如图所示，将index中相同id号所对应矩阵src的行进行聚合（add/max/mean），就可以得到此id号的节点的邻域聚合结果（有点绕）。
我将整个scatter过程概括为以下的伪代码表示：

# sum
out[ index[i] ][j] += src[i][j]
# max
out[ index[i] ][j] = max(src[i][j])

稍微观察一下就能发现，由于每个节点的邻居聚合互不干扰，scatter操作具有很高的计算并行性。为了加速，部分代码使用C++和CUDA编写。
虽然设计的十分巧妙，scatter操作也不可避免的需要频繁地访问节点的特征信息（而非对矩阵进行整体操作），造成细粒度访存。考虑到涉及到运算的地方都是比较简单的element-wise比较操作，所以Aggregate阶段的scatter是访存密集型的操作。
这和图计算编程模型（VCPM）中的Scatter阶段遥相呼应。

Update：可以分为组合阶段和整形变换。

「注意：具有self-loop的模型没有Update阶段。很多模型为了简化也会省略Update阶段。」
组合阶段：将当前节点的嵌入表示和Aggregate阶段生成的消息进行组合，得到新的节点表示。具有代表性的一类方法是使用skip-connection（拼接，求和，加权求和，max等）进行组合。这个阶段主要是进行element-wise的比较操作。
整形变换：将组合阶段产生的新的节点表示经过Linear层进行整形（维数和任务相关），得到更新后的节点嵌入表示，送入下一层进行训练。这个阶段主要是矩阵乘法运算。
综上，Update阶段（如果有的话）的主要算子还是矩阵乘法，属于计算密集型操作。

Sample：主要进行k-hop邻居的采样操作（GraphSAGE）。

Sample一般在Message之前进行，为了保证适配性和迁移性，Sample阶段除了要计算k个邻居集合（k-hop），还要计算子图的edge_index等图数据结构并返回，以达到Message阶段的无缝衔接。
为每个batch中的节点采样k-hop邻居需要频繁地访存，这一点显而易见；构造子图的数据结构又需要花费额外的空间和访存时间。相比于前面的两点，构造集合的并集操作花的时间就不值一提了。因此，Sample阶段是访存密集型的操作。

layer-aggregate*：对每个节点所有的中间层节点表示进行聚合（JK-Nets）。

简单的矩阵拼接或取max的操作，没什么新鲜玩意。后面一般会加一个Linear层整形，此阶段的分析和Update差不太多。

实验结果的分析（根据上面的讨论）

ChebNet、GCN、GAT、JK-Nets都没有Sample阶段，它们在Message阶段花费的时间最长。这是因为Message阶段有矩阵乘法、归一化等操作，GAT甚至还有额外的NN用来得到注意力权重 $\alpha_{i,j}$ 。除此之外，Aggregate阶段执行scatter操作，虽然是访存密集型，但因为其很好的并行性+CUDA加速+数据集不大，并没有花费很多的时间。这几个模型由于使用了self-loop，所以Update阶段约等于没有。
GraphSAGE模型有Sample阶段。由于Sample阶段不仅需要访问1阶邻居，而是需要一直采样到k阶邻居，再加上需要重新构造子图，花费的时间最长。此外，在一个SAGEConv层中需要迭代地聚合k阶邻居（其他4个模型每层只聚合1阶邻居），所以Message、Aggregate和Update阶段所花费的时间也比其他几个模型要长。

GraphSAGE出现的问题

GraphSAGE在GPU中dataloader速度比CPU慢了很多，目前正在查找原因。
通过查看源代码和资料，初步认为出现这种情况的原因是dataloader使用CPU进行采样处理，然后得到的采样结果再送往GPU进行训练，这种数据传输导致了每个batch都需要花费一定的时间。
知乎：pytorch dataloader数据加载占用了大部分时间，各位大佬都是怎么解决的？

GraphSAGE采样结果记录

采样之前的情况：

采样之后的情况

for batch_size, n_id, adjs in train_loader:
    print('batch_size:',batch_size)
    print('n_id shape:',n_id.shape)
    print('adjs length:',len(adjs))
    
    for i,(edge_index, e_id, size) in enumerate(adjs):
        print('edge_index_shape:{} e_id_shape:{} size:{}'.format(edge_index.shape,e_id.shape,size))
    
    print('---------------')

batch是需要训练的节点数量。训练节点一共140个，每个batch取16个节点，因此共分为9组，前8组batch大小为16，最后一组为12。

n_id是2-hop总共采样的节点数量。

adjs是元祖，包括(edge_index, e_id, size)，长度为跳数2。

edge_index：采样后构造的子图的边表
e_id：子图边表中的边在全图中的边id号
size：采样之后和之前集合中的节点数

batch_size: 16
n_id shape: torch.Size([237])
adjs length: 2
edge_index_shape:torch.Size([2, 336]) e_id_shape:torch.Size([336]) size:(237, 68)
edge_index_shape:torch.Size([2, 53]) e_id_shape:torch.Size([53]) size:(68, 16)
---------------
batch_size: 16
n_id shape: torch.Size([240])
adjs length: 2
edge_index_shape:torch.Size([2, 333]) e_id_shape:torch.Size([333]) size:(240, 68)
edge_index_shape:torch.Size([2, 56]) e_id_shape:torch.Size([56]) size:(68, 16)
---------------
batch_size: 16
n_id shape: torch.Size([271])
adjs length: 2
edge_index_shape:torch.Size([2, 429]) e_id_shape:torch.Size([429]) size:(271, 88)
edge_index_shape:torch.Size([2, 73]) e_id_shape:torch.Size([73]) size:(88, 16)
---------------
batch_size: 16
n_id shape: torch.Size([275])
adjs length: 2
edge_index_shape:torch.Size([2, 417]) e_id_shape:torch.Size([417]) size:(275, 76)
edge_index_shape:torch.Size([2, 67]) e_id_shape:torch.Size([67]) size:(76, 16)
---------------
batch_size: 16
n_id shape: torch.Size([202])
adjs length: 2
edge_index_shape:torch.Size([2, 351]) e_id_shape:torch.Size([351]) size:(202, 75)
edge_index_shape:torch.Size([2, 64]) e_id_shape:torch.Size([64]) size:(75, 16)
---------------
batch_size: 16
n_id shape: torch.Size([221])
adjs length: 2
edge_index_shape:torch.Size([2, 317]) e_id_shape:torch.Size([317]) size:(221, 64)
edge_index_shape:torch.Size([2, 51]) e_id_shape:torch.Size([51]) size:(64, 16)
---------------
batch_size: 16
n_id shape: torch.Size([273])
adjs length: 2
edge_index_shape:torch.Size([2, 475]) e_id_shape:torch.Size([475]) size:(273, 93)
edge_index_shape:torch.Size([2, 78]) e_id_shape:torch.Size([78]) size:(93, 16)
---------------
batch_size: 16
n_id shape: torch.Size([255])
adjs length: 2
edge_index_shape:torch.Size([2, 383]) e_id_shape:torch.Size([383]) size:(255, 77)
edge_index_shape:torch.Size([2, 63]) e_id_shape:torch.Size([63]) size:(77, 16)
---------------
batch_size: 12
n_id shape: torch.Size([240])
adjs length: 2
edge_index_shape:torch.Size([2, 333]) e_id_shape:torch.Size([333]) size:(240, 72)
edge_index_shape:torch.Size([2, 60]) e_id_shape:torch.Size([60]) size:(72, 12)
---------------

思考

https://pytorch-geometric.readthedocs.io/en/latest/notes/sparse_tensor.html
在图比较大或比较稠密的时候，使用边表edge_index这种图结构数据，需要在Aggregate阶段显式的矩阵化src（x_j），这会导致很高的内存占用，反而不如使用稀疏矩阵（SparseTensor）进行存储和运算了。

实验附录

### 各模型的网络结构
# ChebNet
ChebNet(
  (conv1): ChebConv(1433, 16, K=2, normalization=sym)
  (conv2): ChebConv(16, 7, K=2, normalization=sym)
)
# GCN
GCNNet(
  (conv1): GCNConv(1433, 16)
  (conv2): GCNConv(16, 7)
)
# GAT
GATNet(
  (conv1): GATConv(1433, 8, heads=8)
  (conv2): GATConv(64, 7, heads=1)
)
# GraphSAGE
SAGENet(
  (convs): ModuleList(
    (0): SAGEConv(1433, 16)
    (1): SAGEConv(16, 7)
  )
)
# JK-Nets
JKNet(
  (conv0): GCNConv(1433, 16)
  (conv1): GCNConv(16, 16)
  (conv2): GCNConv(16, 16)
  (conv3): GCNConv(16, 16)
  (conv4): GCNConv(16, 16)
  (conv5): GCNConv(16, 16)
  (jk): JumpingKnowledge(max)
  (fc): Linear(in_features=16, out_features=7, bias=True)
)

Python 爬虫实战：从图片网站抓取图片并进行特征提取（2025 最新版） Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 github chrome 数据库
一、引言在当今的数字时代，图像数据在各个领域中扮演着至关重要的角色。无论是计算机视觉、机器学习，还是数据分析，图像数据的获取和处理都是基础。然而，获取大量高质量的图像数据并非易事。幸运的是，互联网上充斥着丰富的图像资源，只需借助合适的工具和技术，我们就能高效地从中获取所需的图像数据。本文将详细介绍如何使用Python构建一个完整的爬虫系统，从图片网站抓取图像，并对其进行特征提取。我们将涵盖从网页分
解决web服务中在线查看minio上文件提示CORS的问题 Hong.1948 前端网络 javascript
web页面访问excel、word之类的文件时，由于浏览器的安全机制，如果目标地址和源地址不同源，就会报CORS，即跨域访问的问题。解决跨域的问题，主要有2个思路：方案1：修改目标服务的CORS策略，允许跨域访问方案2：强行同源，然后使用nginx转发请求。此前使用s3服务的时候，使用方案1解决了跨域访问的问题。s3服务，不管是客户端还是pythonsdk，都可以直接修改指定桶的CORS策略，配置
【Python】Synonyms 宅男很神经 python 开发语言
当然，我完全理解您的需求，并且将竭尽全力为您提供一个前所未有的、极其深入和全面的关于“Python库Synonyms，用于中文词性分析和相似度计算”的专属学习指南。我将从最底层、最核心的原理开始，逐步向上构建知识体系，确保每一个细节都被剖析得淋漓尽致，不放过任何一个学习角度。所有内容都将是原创生成，绝无抄袭，并辅以大量我独立设计的实战代码示例，每行代码都将附带详尽的中文解释。由于您要求极高的字数（
Python包管理工具UV：告别龟速pip，体验秒级安装，你的生产力引擎即将升级 wylee python uv pip
摘要：还在为Python包的龟速安装和复杂的依赖管理而抓狂吗？还在苦苦等待CI/CD流水线中漫长的pipinstall完成吗？今天，我要向你隆重介绍一个划时代的Python包管理工具——UV！它由Python生态巨头Astral团队倾力打造，采用Rust编写，旨在彻底颠覆你对Python包安装、虚拟环境管理和依赖解析的认知。UV不仅是pip和virtualenv的闪电替代品，更是pip-tools
【免费试用】NXP S32K312 核心板测评活动第二弹来袭！ 15片开发板开放申领~ WPG大大通 NXP产线大大通开发板测评核心板试用
免费试用的机会又来啦！NXPS32K312是一颗车规通用型MCU，可广泛应用于汽车和工业等领域，包括车身、域控制器以及电气化等领域。现大大通联合世平集团开启NXPS32K312系列核心板第二波免费试用活动。鉴于首次活动的热烈反响，本次特别扩大招募至15位试用者，让更多人能够参与其中！活动期间，我们还将结合NXPCloudLab云实验室的Hands-on实操环节，普及线上与线下EVB深度体验，让您在
python拷贝文件到指定路径不存在_Python实现文件夹递归拷贝 weixin_39717825
维护一个网站，数据库可以自动备份，但用户上传的文件很多，手动备份很麻烦，所以想用Python实现自动备份目标：1.多层文件夹嵌套，在要备份的文件夹中嵌套多个文件夹2.增量备份，因为文件较多，且之前已有部分备份，所以只需对新增的文件进行备份，提升效率Python安装：1.下载安装包，http://www.python.org/getit/，可以选择Python2或3，2的兼容性更好2.添加Pytho
Python 单例模式与魔法方法深度剖析：从原理到实践女码农的重启开发语言单例模式
在Python面向对象编程领域，单例模式和魔法方法是极具特色且功能强大的技术。单例模式确保一个类在程序运行过程中仅有一个实例，常用于资源管理、全局状态维护等场景；魔法方法则是Python类中以双下划线__开头和结尾的特殊方法，赋予类丰富的行为定制能力。本文将深入探讨二者的原理、实现方式、应用场景，以及它们之间的紧密联系。一、单例模式：实例唯一性的保障1.1单例模式的核心概念单例模式（Singlet
Gradio全解3——Gradio三种客户端：python、javascript与curl（三）——curl 龙焰智能 Gradio全解教程 gradio client curl awk/read post/get 嵌入式url
Gradio全解3——Gradio三种客户端：python、javascript与curl（三）——curl前言3.3Curl查询GradioApps3.3.1安装3.3.2获取Gradio程序的URL3.3.3HF_TOKEN和身份认证1.POST/GET示例2.整合命令：awk和read3.HF_TOKEN4.身份认证3.3.4POST：请求预测1.基本语法2.常用示例3.3.5GET：获取结
Ubuntu18.04/Mysql 5.7 建立主备模式Mysql集群武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js layui 毕业设计
一、数据库的安装详见https://www.jianshu.com/p/5073177eedf2本文实验环境为阿里云的两台ubuntu18.04服务器：masterip:172.26.138.7slaveip:172.26.0.209二、修改Master的配置(#的行是我后增加的部分)：编辑/etc/mysql/mysql.conf.d/mysqld.cnf[mysqld]user=mysqlpi
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
【软件工程】Waitress + Nginx 部署 Python Web 服务 meisongqing nginx python WEB
下面是完整的Windows系统部署方案，使用Waitress作为WSGI服务器运行Python后端，Nginx作为反向代理同时提供前端服务：项目结构text复制下载myapp/├──backend/#Python后端│├──app.py#Flask应用入口│├──requirements.txt#Python依赖│└──api/#API模块├──frontend/#前端文件│├──index.ht
基于python的药品后台销售管理系统 sudo-ikun python django javascript mysql
摘要人类生活的水平不断提高是因为依靠着不断发展变革的信息化科技，从头到尾没有一件事情是可以脱离现代化的发展。科技改变了生活，同时也造就了多种多样的生活方式，有了“美团”我们可以足不出户吃便天下美食；有了“京东”我们可以享受到各种各样电子科技产品第一时间带来的快感；有了“淘宝”每逢四季我们可以第一时间感受到潮流的服装，这些都是科技的力量，也是科技给我们的生活带来的一种方式。中药销售一直是我们社会大家
【华为OD机试真题 2025B卷】767、寻找最大价值的矿堆 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KJ.JK OJ+最新华为OD机试 (C++Java Py C JS)华为od c++java 华为OD机试真题 2025B卷 javascript c语言寻找最大价值的矿堆
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++语言思路C++代码Java语言思路Java代码Python语言思路Python代码C语言思路C代码JS语言思路JS代码作者：KJ.JK订阅本专栏后即可解锁在线OJ刷题权限专栏介绍：最新的华为OD机试题目总结，使用C++、Java、Python、C语言、JS五种语言进行解答，每个题目的思路分析都非常详细，支持在线OJ评测刷题！！！！订阅后
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）神经网络15044 深度学习算法神经网络 python 深度学习 django 机器学习人工智能算法目标检测
基于深度学习的线上问诊系统设计与实现（Python+Django+MySQL）一、系统概述本系统结合YOLOv8目标检测和ResNet50图像分类算法，构建了一个智能线上问诊平台。系统支持用户上传医学影像（皮肤照片/X光片），自动分析并生成诊断报告，同时提供医生审核功能。二、技术栈后端框架：Django4.2数据库：MySQL8.0深度学习：YOLOv8：皮肤病变区域检测ResNet50：肺炎X光
Python,Go开发穷游宝典APP Geeker-2025 python golang
以下是为使用**Python和Go开发"穷游宝典APP"**设计的创新技术方案，结合两种语言优势实现低成本、高智能的旅行体验：---###**技术栈分工**|**技术**|**核心优势**|**在穷游APP中的应用**||----------|--------------------------|------------------------------------------||**Pytho
Python,Go开发数据流量分配查询APP Geeker-2025 python golang
#数据流量分配查询应用我将设计一个基于Python和Go开发的数据流量分配查询应用，帮助用户监控和分析网络流量分配情况。##设计思路这个应用将实现以下核心功能：-实时监控网络流量分配情况-多维度流量数据分析（设备、应用、时间段）-流量分配策略设置与管理-异常流量告警系统-直观的数据可视化展示##技术架构```前端(Python+Streamlit)后端(Go)┌──────────────────
《48小时极速开发：Python+MySQL 学生信息管理系统架构实战揭秘》 Cyber4K Python 项目实践及实战 python mysql 架构
Python项目实践：学生信息管理系统1.项目概述1.1项目背景开发周期：2天（需求分析0.5天+开发1天+测试0.5天）技术栈：Python3.9+MySQL+面向对象编程核心价值：实现学生信息的全生命周期管理采用分层架构设计（表示层/业务层/数据层）数据库驱动的高效数据持久化方案1.2系统架构系统架构调用CRUD操作连接池业务逻辑层命令行界面数据访问层MySQL数据库2.核心模块实现2.1数据
python里面的全局变量和局部变量的区别（很好的一篇文章，找不到出处，原作者看到请联系，我会署上名字） scuter_yu 全局变量与局部变量的区别 python
python中，对于变量作用域的规定有些不一样。在诸如C/C++、java等编程语言中，默认在函数的内部是可以直接访问在函数外定义的全局变量的，但是这一点在python中就会有问题，下面是一个例子。[plain]viewplaincopy在CODE上查看代码片派生到我的代码片test.py:#!/usr/bin/pythonCOUNT=1deffunc():COUNT=COUNT+1func()P
LeetCode第300题_最长递增子序列 @蓝莓果粒茶算法 leetcode 算法职场和发展学习 c#游戏 python
LeetCode第300题：最长递增子序列文章摘要本文详细解析LeetCode第300题"最长递增子序列"，这是一道考察动态规划和二分查找的中等难度题目。文章提供了动态规划和贪心+二分查找两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习动态规划和二分查找的读者。核心知识点：动态规划、二分查找、贪心算法难度等级：中等推荐人群：具备基础算法知识，想要提升
LeetCode第301题_删除无效括号 @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习 python c++
LeetCode第301题：删除无效括号文章摘要本文详细解析LeetCode第301题"删除无效括号"，这是一道考察DFS和括号匹配的困难难度题目。文章提供了DFS和BFS两种实现方案，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合学习深度优先搜索和字符串处理的读者。核心知识点：DFS、BFS、括号匹配、字符串处理难度等级：困难推荐人群：具备基础算法知识，想要提升搜
第九章：LeRobot自定义硬件集成指南贾全实战具身智能机器人算法机器人学习人工智能机器学习
引言在前面的章节中，我们学习了如何使用LeRobot进行模仿学习、仿真实验以及摄像头配置。然而，真正的机器人研究往往需要使用自定义的硬件平台。每个研究团队或开发者可能都有自己独特的机器人设计，如何将这些自定义硬件无缝集成到LeRobot生态系统中，是实现高效机器人学习的关键。本章将详细介绍LeRobot的硬件集成框架，帮助读者掌握如何将自己的机器人硬件接入LeRobot系统。通过学习本章内容，你将
Python复制方法“=/copy/deepcopy”的区别 superlitong 笔记经验 python list 列表机器学习人工智能
1、当复制的值是不可变对象（数值，字符串，元组）时，=/copy/deepcopy三者没有区别。测试代码：importcopya='abcdefgh'b=ac=copy.copy(a)d=copy.deepcopy(a)print(a,b,c,d)print(id(a),id(b),id(c),id(d))a+='x'#相当于重新赋值，把a这个标签重新贴到了一个新的箱子print(a,b,c,d)
深度学习中常见激活函数总结向左转,　向右走ˉ 深度学习人工智能 pytorch python
以下是一份深度学习激活函数的系统总结，涵盖定义、类型、作用、应用及选择影响，便于你快速掌握核心知识：一、激活函数的定义在神经网络中，激活函数（ActivationFunction）是神经元计算输出的非线性变换函数，作用于加权输入和偏置之和：输出=f(加权和+偏置)核心价值：引入非线性，使神经网络能够拟合任意复杂函数（无激活函数的深度网络等价于单层线性模型）。二、常见激活函数类型1.线性函数（Lin
Python binary search二分查找算法详解及源码猿来如此yyy Python算法详解及源码算法 python 排序算法开发语言数据库人工智能数据结构
二分查找算法是一种在有序数组中查找特定元素的常用算法。它的基本思想是将要查找的元素与数组的中间元素进行比较，如果相等，则返回该元素的索引；如果要查找的元素比中间元素小，则在数组的左半部分继续查找；如果要查找的元素比中间元素大，则在数组的右半部分继续查找。通过不断缩小查找范围，最终可以找到要查找的元素或确定该元素不存在于数组中。二分查找算法的优点是时间复杂度为O(logn)，效率较高。这是因为每一次
python中copy和deepcopy详细区别 jialun0116 python 列表 python
python中copy和deepcopy在python中，标识一个对象唯一身份的是：对象的id(内存地址)，对象类型，对象值。deepcopy是真正意义上的复制，深拷贝，被复制对象完全复制一遍作为独立的新个体，新开辟一块空间。等于赋值，浅拷贝，不会产生独立对象，只是对原有数据块打上新标签，其中一个标签改变，数据块就会变化。copy仅拷贝对象本身，浅拷贝不会对其中的子对象进行拷贝，对子对象进行修改也
python 几种排序方法与二分查找愤怒的玉米棒 python学习小结 python
#选择排序defselectionSort(arr):#-1虽然有n个数字但是没有第n轮最多n-1轮foriinrange(0,len(arr)-1):forjinrange(i+1,len(arr)):ifarr[i]>arr[j]:arr[i],arr[j]=arr[j],arr[i]print(arr)#冒泡排序defbubbleSort(arr):#-1虽然有n个数字但是没有第n轮最多n-
Python二分查找库bisect 来个大包的二重积分编程基础 python 算法排序算法
找暑期实习的时候做到某厂的笔试题里面用到这个，就总结一下。。。1.bisect_left(a,x,lo=0,hi=len(a))功能：在已排序序列a中查找元素x应该插入的位置，并返回最左侧的插入位置（index啊）。区别：如果有多个相同元素，bisect_left返回最左侧的插入位置。默认情况下，查找范围是整个序列a，但可以通过lo和hi参数来限制查找范围。2.bisect_right(a,x,l
【python】赋值操作（=）、切片、copy()、deepcopy()经常分不清。叶阿猪 python python 数据结构开发语言
切片（Slicing）、copy()（浅拷贝）和deepcopy()在Python中都涉及复制操作，但复制的深度和方式有所不同。而赋值操作不涉及复制，只是改变变量与对象之间的绑定关系。本文将详细讲解这几种方式的区别。一、赋值操作（=）定义：将值或引用绑定到变量名上。特性：赋值操作不会创建值的副本，它只是将变量名与现有的值或引用关联起来。如果赋值的值是可变对象（如列表、字典等），则变量名将引用该对象
【Python】第一弹：对 Python 的认知敖云岚 python 开发语言
目录一、Python的背景1.1.Python的由来1.2Python的作用1.3Python的优缺点1.4Python的开发工具一、Python的背景1.1.Python的由来Python由荷兰数学和计算机科学研究学会的吉多・范罗苏姆（GuidovanRossum）在20世纪80年代末至90年代初开发，并于1991年正式发布。当时，计算机领域正朝着更高效、更便捷的编程方向发展，吉多希望创造一门语
2025B卷最新华为OD机试,独家整理总结上岸技巧,考试题库清单(Python/JS/C/C++/JAVA/GO)持续收录中无限码力华为od 华为OD机试华为OD2025B卷华为机试2025B卷华为OD机考2025B卷华为OD2025B卷题库
2025华为OD机试2025B卷华为OD上机考试由5月9号统一切换至华为OD2025B卷，现在刷2025B卷，刷得越多，通过率越高。题库链接最新华为OD机试(C++/C/Python/JavaScript/GO)目录提供在线OJ环境刷题:(私信联系开通)在线OJ私信联系开通OJ环境+使用介绍：私信联系开通2025最新华为OD真题目录华为OD面试手撕代码高频题华为OD机试2025B卷题单下面精心为大
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl