AaronJiang395

沈华伟老师图卷积神经网络教学视频笔记

图卷积神经网络

感谢
0. 背景介绍
- 基于图的应用
- - node-level
  - graph-level
  - singal-level
- 数据集介绍
- - - 1. Cora数据集：
    - 2. CiteSeer
    - 3. Pubmed
1. CNN
- - 1.1 CNN有效的原因
2. 从基于欧式数据的网络迁移到非欧数据上
- 2.1 主要困难
- 2.2 目标
3. 卷积
- 数学中的卷积（信号处理中的卷积）
- - 连续量卷积
  - image上的卷积
  - 总结：卷积是一种对信号的处理方式
图卷积的两种方法：
- - Spectral method （谱方法）
  - - 特点：
    - 问题：
  - Spatial method （空间方法）
  - - 特点：
    - 基本思想：
  - 挑战：
- 图卷积神经网络的输入输出
- - - - 基本知识：图，邻居，度矩阵，邻接矩阵
- Spectral method （谱方法）的实现
- - I: 工具 $\rightarrow$ Graph Laplacian（图上的拉普拉斯变换）
  - - 意义：
  - II: Graph Fourier Transform
  - Define Convolution in spectral domian
  - Spectral Graph CNN
  - - 但这个方法实际不可用：
- ChebyNet: parameterizing filter
- - Parameterizing convolution filter via polynomial approximation
- Graph Wavelet Neural Network
- - - 存在问题：
    - 实验结果：
    - 小波基有很好的图可解释性
  - 补充介绍数据集
Spatial methods for graph convolutional neural networks
- Learning Convolutional Neural Networks for Graphs. ICML, 2016
- - - By analogy（使用类比的方法，将CNN迁移到Graph上）
- Inductive Respresentation Learning on Large Graphs. NeuralPS 2017
- - GraphSAGE
- Semi-supervised classification with graph convolutional networks, ICLR2017
- - GCN(Graph Convolutional Network)
- Graph Attention Network, ICLR2018
- - GAT(Graph Attention Network)（简写GAN已经被生成对抗网络占了...）
- Geometric deep learning on graphs and manifolds using mixture model CNNs (2016)
- - MoNet: A general framework for spatial methods
- 2019 IJCAI graph convolution networks using heat kernal for Semi-supervised Learning
- - - 谱方法是空间方法的一个特例:
  - Graph signal processing: filter
  - - 对信号 $x$ 在某图上的平滑程度进行测量
    - Basic filters
    - Combine filters
    - GCN 只考虑k=0, k=1 的情况
    - 低通滤波器
  - Compared with baseline methods
  - - Neighborhood
Graph pooling
- 讨论
- - 1
  - - 2. 上下文表示学习的体现
    - 3. 未来应用
    - 回答问题：

感谢

非常感谢沈华伟老师在B站的教学视频，讲得真棒，这里是对该视频的学习笔记。整理出来，如有侵权请及时联系我。
教学视频链接： https://www.bilibili.com/video/BV1ta4y1t7EK
ps. 评论区上传视频的小伙伴留下了讲义的网盘链接

0. 背景介绍

基于图的应用

node-level

节点预测：根据若干已有标签的节点和图结构预测目标节点的标签(社交网络用户分类，节点异常检测)
链路预测：预测节点对之间的链路的存在或者出现

graph-level

图分类：通过图卷积网络学习一个图的表达对图进行分类（子图分类生物信息领域，分蛋白质网络，基因网络；诈骗软件识别）

singal-level

信息分类：类似image,认为image是一个网络结构从来不变的栅格图，变化的是信息。（交通方面，交通流量是signal）

数据集介绍

1. Cora数据集：

样本特征，标签，邻接矩阵
该数据集共2708个样本点，每个样本点都是一篇科学论文，所有样本点被分为8个类别，类别分别是1）基于案例；2）遗传算法；3）神经网络；4）概率方法；5）强化学习；6）规则学习；7）理论

每篇论文都由一个1433维的词向量表示，所以，每个样本点具有1433个特征。词向量的每个元素都对应一个词，且该元素只有0或1两个取值。取0表示该元素对应的词不在论文中，取1表示在论文中。所有的词来源于一个具有1433个词的字典。

每篇论文都至少引用了一篇其他论文，或者被其他论文引用，也就是样本点之间存在联系，没有任何一个样本点与其他样本点完全没联系。如果将样本点看做图中的点，则这是一个连通的图，不存在孤立点。

2. CiteSeer

在CiteSeer数据集中，论文分为六类：Agents、AI（人工智能）、DB（数据库）、IR（信息检索）、ML（机器语言）和HCI，共包含3312篇论文，记录了论文之间引用或被引用信息。去除停用词和在文档中出现频率小于10次的词，整理得到3703个唯一词。CiteSeer数据集包含两个文件：.content文件和.cites文件，其中.content文件描述论文信息的格式为： +；.cites文件描述了论文之间的引用信息，格式为：。例如，一行内容为：paper1 paper2，那么引用关系为paper2引用paper1，即：paper2->paper1。
但是，Citeseer数据集中的分类太笼统。

3. Pubmed

PubChem是美国国立卫生研究院（NIH）的开放化学数据库，是世界上最大的免费化学物信息集合。
PubChem的数据由数百个数据源提供，包括：政府机构，化学品供应商，期刊出版商等。

21世纪的毒理学（Tox21）计划是NIH，环境保护局和食品药品管理局的联邦合作计划，旨在开发更好的毒性评估方法。目标是快速有效地测试某些化合物是否有可能破坏人体中可能导致不良健康影响的过程。Tox21数据集是其中一个比赛用到的数据集，包含了12个毒理试验测定的化学合成物质的结构信息

雌激素受体α，LBD（ER，LBD）
雌激素受体α，full（ER，full）
芳香
芳烃受体（AhR）
雄激素受体，full（AR，full）
雄激素受体，LBD（AR，LBD）
过氧化物酶体增殖物激活受体γ（PPAR-γ）
核因子（红细胞衍生的2）样2 /抗氧化反应元件（Nrf2 / ARE）
热休克因子反应元件（HSE）
ATAD5
线粒体膜电位（MMP）
P53
每个毒理实验测试的都是PUBCHEM_SID从144203552-144214049共10486个化合物，包括环保化合物、一些上市药物等物质的活性结果。

1. CNN

CNN与TCN在image, text, audio, video广泛应用。

1.1 CNN有效的原因

通过 localized convolution filter 学习到 local stationary structures
multi-scale hierarchical patterns (层级堆叠)
参数共享
具有 平移不变性 的数学特征

当年 GNN -> CNN 重要一步就是 参数共享

2. 从基于欧式数据的网络迁移到非欧数据上

2.1 主要困难

非欧数据的非规则结构

格子数据：可以使用小pattern (3x3, 5x5等filter)
非规则数据：度非常大（~幂律分布，例如e-mail）

2.2 目标

定义图上的卷积
定义图上的pooling

3. 卷积

数学中的卷积（信号处理中的卷积）

连续量卷积

$\overset{def}{=}\int f(t)g(t-\tau)d\tau$

说明：使用一个单周期方波进行卷积，输出为重叠面积，g(t)成为卷积核。
该过程从信号处理角度称之为：使用g(t-tao)处理f(tao)。
效果：信号变得平滑，（调制解调中的调制过程，实现模拟信号的通信）
作用：处理时域上的信号，是一种积分。

image上的卷积

$\\=(f*g)(x,y) \\ \overset {def}{=}\sum_{m,n}{f(x-m,y-n)g(m,n)}$

总结：卷积是一种对信号的处理方式

图卷积的两种方法：

Spectral method （谱方法）

特点：

在谱域中定义。而非在节点域定义子模板
将图上的信号变换到谱域上。
在谱域上实现卷积的定义
根据卷积的性质，变回到空间域

问题：

谱域上的卷积核在节点域上并非localized.

Spatial method （空间方法）

特点：

在节点域直接定义子模板

基本思想：

定义在一个目标节点的所有领域节点的加权平均

挑战：

每个节点的邻居度不同，如何定义一个大小一样的邻域，来实现参数共享（之后的GCN,GAT都在解决这个问题）

图卷积神经网络的输入输出

基本知识：图，邻居，度矩阵，邻接矩阵

Given a graph $G = (V, E, W)$

$V$ : 节点集合，个数为 n = $\vert V\vert$
$E$ : 边的集合
$W$ : 边上的权重集合, $\in R^{n \times n}$
$d$ : 每个节点有一个d维的特征,
$X$ ：输入的特征矩阵为 $\in R^{n \times d}$ ，可看作是一种信号

Spectral method （谱方法）的实现

I: 工具 $\rightarrow$ Graph Laplacian（图上的拉普拉斯变换）

Graph Laplacian详细说明：

https://zhuanlan.zhihu.com/p/56568843

意义：

定义了图上的导数，刻画图上信号的平滑程度
公式：
$L = D - W$
$D_{ii} =\sum_{j} W_{i,j}$
解释：对角线的度矩阵 $D$ 减去带权的邻接矩阵 $W$
标准化的 $L$
$L=I-D^{-\frac{1}{2}} WD^{-\frac{1}{2}}$

II: Graph Fourier Transform

Fourier basis of graph G
根据谱方法的目标，需要将信息投影到谱域上，使用拉普拉斯矩阵来构造这组基。
$L=U\Lambda U^T$
where $U=[u_1,...,u_n]$ , $\Lambda=diag([\lambda_1,...,\lambda_n])$
$L^{n\times n}$ 的n个特征向量是正交的，对应n个基 $\{u\}^{n}_{l=1}$ ， $l$ ：表示第几层。
Graph Fourier Transform
所以现在目标是将 $X$ 投影到这组基上。
这里先以 $d = 1$ 为例，此时输入的信息 $x$ 可以简单看作是一个n维向量 $x\in{R^{n}}$ 。
Graph Fourier transform：
$\hat{x}=u^T\cdot x$
Graph Fourier inverse transform:
$x=u\cdot \hat{x}$

Define Convolution in spectral domian

在信号处理中，有个定理：两个信号的卷积的傅里叶变换=它们傅里叶变换后的点积，此处也是如此定义：
$x*_Gy=U((U^Tx)\odot (U^Ty))$
$x$ 是输入信号， $y$ 是节点域上的卷积核， $U^Ty$ 是谱域上的卷积核。
令:
$U^Ty=[\theta_1,...,\theta n]^T$
$g_\theta=diag([\theta_1,...,\theta n])$
则：
$x*_Gy=U((U^Tx)\odot (U^Ty))$
$\Downarrow$
$x*_Gy=Ug_\theta U^Tx$
公式中看作走了三步：
图傅里叶变换： $U^Tx$
使用 $g_\theta$ 作为filter，在谱域上进行卷积： $g_\theta U^Tx$
图傅里叶逆变换回到节点域： $Ug_\theta U^Tx$
完成了图上的，基于谱方法的图卷积神经网络（2014提出，谱方法的奠基性作用）

Spectral Graph CNN

$x_{k_1, j} = h\biggl(\sum_{i=1}^{f_k} UF_{k,i,j}U^Tx_{k,i}\biggr)$

$x_k,i$ : Signals in k-thlayer
$F_{k,i,j}$ : Filter in the k-th layer

但这个方法实际不可用：

Laplacian matrix 的 eigen-decomposition(特征值分解) 复杂度很高为 $O(n^3)$
使用Fourier basis $U$ ( $U$ 十分稠密) 对信号 $x$ 做变换的时候，复杂度为 $O(n^2)$ ，（使用在社交网络上无法承受）
在节点域上并非localized

ChebyNet: parameterizing filter

(2016 nips)

Parameterizing convolution filter via polynomial approximation

通过多项式近似的方法，将谱域上的自由的卷积核 $g_\theta$ 进行参数化

$g_\theta=diag([\theta_1,...,\theta n])$
$\Downarrow$

$g_\beta(\Lambda)=\sum_{k=0}^{K-1}\beta_k \Lambda^k\ \ \ \ \ \ \ \ \Lambda=diag(\lambda_1,...,\lambda_n)$

ChebyNet ：
$x*_Gy=Ug_\beta(\Lambda)U^Tx=\sum_{k=0}^{K-1}{\beta_k L^k x}$
谱域上的filter $g_\theta$ 自由参数量从 $\rightarrow K$
优点：

不用计算 $U$
$L$ 是一个稀疏矩阵
复杂度降低： $O(n^3)$ $\rightarrow$ $O(\vert E\vert )$ ， $\vert E\vert=$ 边的个数。
由 $L$ 的 $k$ 次幂， $L$ 具有localized特性：对于一个中心节点，其卷积只受K跳邻域的影响。
补：大于K跳的位置的矩阵元素为0

Graph Wavelet Neural Network

不同于ChebyNet着眼于 $g_\theta$ ，该种方法着眼于 $U$ ， $U$ 有很多上述说明的缺点（稠密，not localized，计算复杂度高）
使用wavelet bisis 替代Fourier bisis

替换后：

存在问题：

参数复杂度太大（比如1亿人的社交网络）

实验结果：

小波基有很好的图可解释性

数据集	来源	#图	#节点特征	#边	#特征	#标签(y)
Cora	“Collective classification in network data,” AI magazine,2008	1	2708	5429	1433	7
Citeseer	“Collective classification in network data,” AI magazine,2008	1	3327	4732	3703	6
Pubmed	“Collective classification in network data,” AI magazine,2008	1	19717	44338	500	3

补充介绍数据集

Spatial methods for graph convolutional neural networks

谱方法是空间方法的一个特例。

Learning Convolutional Neural Networks for Graphs. ICML, 2016

By analogy（使用类比的方法，将CNN迁移到Graph上）

对于每一个节点，选择固定个数的节点进行，定义一个网络上邻近度的度量，可以使用W-L test的方式，或者其他方式进行选择
根据度量关系进行编号
参数共享

该使用的不多，很快出现其他想法，后来主要是用GCN和GAT等方法。

Inductive Respresentation Learning on Large Graphs. NeuralPS 2017

GraphSAGE

采用随机行走（restart type）的方式采样固定个数邻居节点，距离越近的节点，被选择的概率越大
$a_v^{(k)} = AGGERGATE^{(k)} (h_u^{(k-1)} :u \in {\mathcal{N}(v)} )$
聚合所选的邻居节点
$h_v^{(k)} = COMBINE^{(k)}( h_v^{(k-1)}, a_v^{(k)} )$

此时Graph卷积已经没有卷积的形式了，变成了GNN，已经没有图卷积的最初目标，而是一种Aggreagtion聚合过程。
使用聚合的方式，用这个节点的邻域节点的信息聚合后表达这个节点。

Semi-supervised classification with graph convolutional networks, ICLR2017

GCN(Graph Convolutional Network)

作者声明该方法是ChebyNet谱方法的简化版（其一阶近似），但也被认为是空间方法，并且把’GCN’这个名字给占了（占热搜）。

把目标节点的邻居节点进行聚合，将节点的特征变换之后进行加权平均，权重由Laplacian Matrix直接定义，非可变参数。不存在可学的卷积核，所以这里沈认为不能称之为卷积，更像是一种平滑操作/半监督学习。
共享参数来与特征变换
ChebyNet谱方法的简化版（其一阶近似）
$Z=f(X,A)=softmax(\hat{A}ReLU(\hat AXW^{(0)})W^{(1)})$
其中 $W^{(0)}$ , $W^{(1)}$ 是特征变换的参数

Graph Attention Network, ICLR2018

GAT(Graph Attention Network)（简写GAN已经被生成对抗网络占了…）

该作者认为GCN 只是学习聚合矩阵，参数传递依靠 Laplacian Matrix ，是使用 $W^{(0)}$ , $W^{(1)}$ 的特征变换，算不上卷积。
本文的参数共享来源于两个部分：
I. 特征变换
II. attition 的参数

$\hat a^T$ ：一个节点在聚合自己邻域节点时共享的参数，self-attition的参数

Geometric deep learning on graphs and manifolds using mixture model CNNs (2016)

MoNet: A general framework for spatial methods

定义一个图上的核函数，参数化或者非参数化都可，可以度量图上任意两个节点相似度。
卷积核就是这些核函数的权重
$(f*g)(x)=\sum_{j=1}^{J}g_jD_j(x)f$

核函数：谱方法里就是普遍换的基，空间方法中就是要选的邻居节点的相似度表达
哪个定义更加深刻？

2019 IJCAI graph convolution networks using heat kernal for Semi-supervised Learning

沈自己的论文：

谱方法是空间方法的一个特例:

谱方法需要显式地定义卷积核，定义的时候我们已知将目标节点投影到了哪个空间（傅里叶变换：投影到L矩阵特征向量张开的空间，小波变换：小波基张开的空间）
2 . 空间方法不需要知道投影到了哪个空间，只需定义核函数和核矩阵
可以类比SVM，在SVM提出之前，都需要显式的做特征变换（基变换），SVM只需要定义一个核矩阵，空间未知。

解释：都可以认为定义了不同的核矩阵与核参数
补：这里提出一个问题：为何GCN比ChebNet率高？

Graph signal processing: filter

对信号 $x$ 在某图上的平滑程度进行测量

对于节点分类任务，对特征平滑的要求是一致的。

特征值刻画了特征向量关于这个图的平滑程度

Basic filters

$u_i^TLu_i$ 是一组基础滤波器
每一个滤波器 $u_i^TLu_i$ 仅让频率= $\lambda _i$ 的信号通过，图上的卷积操作是这组基础滤波器的线性组合。所以卷积又被称为过滤器。
$\alpha_1 u_1+\alpha_2 u_2+...+\alpha_n u_n$
$u_iu_i^Tx=\alpha_i u_i$

Combine filters

基础滤波器的线性组合
$L^k$ （ChebNet）是线性组合的特殊系数， $\{\lambda_i^k\}_{i=1}^n$
$L^k$ 决定频率越高的信号其权重越大，所以影响越大 ,是个高通滤波器。加强高频信号并不利于像分类任务。（认为是ChebNet不如GCN的原因）

GCN 只考虑k=0, k=1 的情况

过滤了高频信号

沈认为直接设计一个低通滤波器

低通滤波器

Compared with baseline methods

Neighborhood

Graph pooling

讨论

1

2. 上下文表示学习的体现

3. 未来应用

回答问题：

图上的高频信号有什么可以应用的？
图上的高频信号和做的任务有关：
1. 如果做的是节点分类的任务，它需要利用网络的平滑性，主要利用低频信号，
2. 如果做得是异常节点检测，比如对于人造的graph或者iamge，想要区分出来是否为fake，这时候想要检测的异常信号通常是高频信号，因为人为很难将高频信号控制得精准。比如DeepFake的人脸生成。高频上会有很多震荡。
不同信号的小波基提取不同，如何定义？
沈等人使用指数衰减，其实就是刻画一个节点和周围邻域节点的影响关系。标准形式 $e^{-L}$ (Laplacian Matrix的标准形式)，其实可以使用不同的函数形式： $t a n (x)$ ,只要具有局部性就可以了。定义和常见的激活函数类似。
如何定义网络的相似性，如何寻找多个网络的子结构？
有人说称之为寻找网络的“词”，类似nlp里面的词。网络中比如：三角形、正方形等，用来实现图的迁移。上文中提到的匿名化的随机行走就是网络的结构，比如三角形就像“的”、“了”这类结构次，冗余的。
和应用领域相关，在生物领域，子结构更加具象化：一个CH2、苯环（C6H6）
和领域无关的有两种：
1. 叫WL的方式，带根的子图，
2. 匿名化随机行走，Pathbase方法
3. Motivebase
在Graph generation 方向有什么突出的研究和研究思路？
以前考虑的是：统计指标是否合适：度分布、三角形分布、小世界保持（注明的6人联系定律（非严谨）），像Scale Free Networks, 没听清、
现在已经在使用深度学习网络生成graph，在医药设计方面，比如给出一个新冠病毒，生成疫苗（很不成熟），更多的是特征分类，比如给出一类图（都是带硝基的），学习后生成这类图，目前还没啥生产领域。
为什么图神经网络学不到结构信息？
卷积设计有关，近两年有学者尝试将结构影响设计进去（Ego-discriminated GCN (EGCN)），但原来的GCN做邻居节点聚合的方式只是平滑，没有结构信息的体现，学习到的pattern是feature的各种组合方式。
近两年大家尝试如何把GCN做大做深，像CNN一样上千层。

目前整理到这，有写还没细化整理，抽空再整。

VSCode使用Jupyter完整指南配置机器学习环境 z日火校招学习日记 vscode jupyter 机器学习
接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
如何调整优化器的参数来优化神经网络性能？ Idividuals 深度学习神经网络机器学习 python scikit-learn
不同优化器有不同的可调整参数，下面以常见的优化器为例，讲解如何调整其参数来优化神经网络性能：Adam优化器Adam优化器有几个关键参数：learning_rate（学习率）、beta_1、beta_2和epsilon。1.学习率(learning_rate)-作用：控制每次参数更新的步长。学习率过大，模型可能无法收敛，在最优解附近振荡甚至发散；学习率过小，训练速度会非常缓慢。-调整方法：通常初始值
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
大数据处理技术：分布式文件系统HDFS 茜茜西西CeCe hdfs hadoop 大数据 HDFS-JAVA接口文件头歌 Java
目录1实验名称：2实验目的3实验内容4实验原理5实验过程或源代码5.1HDFS的基本操作5.2HDFS-JAVA接口之读取文件5.3HDFS-JAVA接口之上传文件5.4HDFS-JAVA接口之删除文件6实验结果6.1HDFS的基本操作6.2HDFS-JAVA接口之读取文件6.3HDFS-JAVA接口之上传文件6.4HDFS-JAVA接口之删除文件1实验名称：分布式文件系统HDFS2实验目的1.理
GPT-4o mini TTS：领先的文本转语音技术桂花饼 AIGC GPT-4o o4-mini 语音识别人工智能 GPT-4o
什么是GPT-4ominiTTS？GPT-4ominiTTS是OpenAI推出的全新一代文本转语音（TTS）技术，能够以自然、流畅的方式将普通文本转换为语音。依托先进的神经网络架构，GPT-4ominiTTS在语音合成中避免了传统TTS的生硬与机械感，能够生成富有情感和个性化表达的高质量语音。该技术支持多语言与多口音，是视频、播客、电子学习等场景的理想选择。核心特点自然流畅，接近真人GPT-4om
AI产品经理成长记《零号列车》第一集邂逅0XAI列车黑客思维者 AI产品经理养成人工智能 AI产品经理大模型智能体
《零号列车》绝非传统意义上的AI产品经理教程——它是我沉淀二十多年跨行业数字化转型与工业4.0实战经验后，首创的100集大型小说体培养指南。那些曾在千行百业验证过的知识与经验，不再是枯燥的文字堆砌，而是化作一场沉浸式的学习旅程。这里没有生硬的理论灌输，而是用跌宕起伏的故事情节，串联起AI技术的底层逻辑。你会跟着角色的脚步推进剧情，在不知不觉中吃透机器学习、大模型应用等专业概念；更有深入浅出的技术拆
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
Java与机器学习的邂逅：Weka框架入门指南墨夶 Java学习资料1 java 机器学习数据挖掘
在这个数据驱动的时代，机器学习已经成为各行业创新和优化的关键技术。而Java，作为一门成熟且广泛应用的编程语言，在企业级应用开发中占据着重要地位。将二者结合起来，利用Java实现机器学习算法，不仅可以充分发挥其强大的生态系统优势，还能为开发者提供一个高效、稳定的开发环境。今天，我们将带您走进Java与机器学习的世界，探索如何使用Weka这一著名的机器学习库来开启您的智能之旅。Weka简介及其优势什
机器学习基础：从数据到智能的入门指南
一、何谓机器学习在我们的日常生活中，机器学习的身影无处不在。当你打开购物软件，它总能精准推荐你可能喜欢的商品；当你解锁手机，人脸识别瞬间完成；当你使用语音助手，它能准确理解你的指令。这些背后，都离不开机器学习的支撑。机器学习是一门让计算机能够从数据中学习并改进的学科。随着传感器技术的飞速发展，我们身边充满了各种传感器，如手机中的摄像头、麦克风，交通监控中的传感器等，它们收集了海量的数据。这些数据就
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
Unet源码实现（pytorch） wyn20001128 pytorch 人工智能 python
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它通过引入一种新颖的网络结构和训练策略解决了传统方法在数据量不足时面临的挑战。U-Net的主要思想是利用数据增强技术来高效利用有限的标注样本，并通过独特的网络设计来提高分割精度。主要贡献U-Net的主要贡献包括：1、数据增强策略：使用随机弹性变形和其他形式的数据增强来增加训练数据的多样性，从而在有限的数据集上训练出更强大的模型。2、U形网络结
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解文章目录基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解1.RELM原理2.分类问题求解3.基于探路者算法优化的RELM4.实验结果5.Matlab代码1.RELM原理极限学习机(ELM)具有训练速度快、泛化性能好的优点。极限学习机的结构是一种典型的单隐层前馈神经网络(SLFN)。极限学习机的结构见图RELM算法：若NNN
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
【DL经典回顾】激活函数大汇总（四）（Softmax & Softplus附代码和详细公式）夺命猪头 python 机器学习人工智能神经网络 numpy
激活函数大汇总（四）（Softmax&Softplus附代码和详细公式）更多激活函数见激活函数大汇总列表一、引言欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里，激活函数扮演着不可或缺的角色，它们决定着神经元的输出，并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，本篇详细介绍两种激活函数，旨在帮助读者深入了解各种激活函数的
神经网络项目--基于FPGA的AI简易项目（1-9图片数字识别）霖12 深度学习 pytorch 神经网络 fpga开发人工智能机器学习
1.训练MNIST模型importtorch#导入pytorch核心库importtorch.nnasnn#神经网络模块，如卷积层importtorch.optimasoptim#优化器fromtorchvisionimportdatasets,transforms#数据集与图像预处理工具#定义CNN模型classSimpleCNN(nn.Module):#PyTorch库中所有神经网络的“基础模
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Go与Python在数据管道与分析项目中的抉择：性能与灵活性的较量真智AI 人工智能 python go
你正在设计一个全新数据管道或启动一个分析项目，此时你或许正在思考该选择Python还是Go。五年前，这甚至不是个值得讨论的问题——你会毫不犹豫地选择Python，故事到此为止。然而，近年来Go在数据领域，尤其是在数据基础设施和实时处理方面，正逐渐被更多人采用。实际上，这两种语言都已在现代数据技术栈中找到了各自的定位。Python依然非常适合机器学习和数据分析，而Go则逐步成为高性能数据基础设施的首
Python爬虫实战：从新浪财经爬取股票新闻的完整实现 Python爬虫项目 python 爬虫开发语言数据分析 php
第一部分：爬虫概述1.1什么是爬虫？爬虫是指通过程序模拟浏览器的行为，自动化地抓取网络上的数据。通过爬虫技术，能够从各种网站上提取信息，广泛应用于数据采集、数据分析、机器学习等领域。1.2新浪财经简介新浪财经是中国最大的财经信息平台之一，提供股票、基金、债券、外汇等多方面的财经新闻和数据。在股票领域，新浪财经提供了大量的股票行情、实时数据、新闻报道等信息，因此爬取新浪财经的股票新闻对于投资分析和决
神经网络常见激活函数 13-Softplus函数亲持红叶神经网络常见激活函数神经网络人工智能深度学习
文章目录Softplus函数+导函数函数和导函数图像优缺点PyTorch中的Softplus函数TensorFlow中的Softplus函数Softplus函数+导函数Softplus函数Softplus⁡(x)=ln⁡(1+e x)\begin{aligned}\operatorname{Softplus}(x)&=\ln\bigl(1+e^{\,x}\bigr)\end{aligned}Sof
AI 智能运维，重塑大型企业软件运维：从自动化到智能化的进阶实践 AI、少年郎人工智能运维自动化
一、引言：企业软件运维的智能化转型浪潮在数字化转型加速的背景下，大型企业软件架构日益复杂，微服务、多云环境、分布式系统的普及导致传统运维模式面临效率瓶颈。AI技术的渗透催生了智能运维（AIOps）的落地，通过机器学习、大模型、智能Agent等技术，实现从"人工救火"到"智能预防"的范式转变。本文结合头部企业实践，解析AI在运维领域的核心应用场景、技术架构及未来趋势，特别针对基础运维中流程重构、技术
Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(