囚生CY

【学习笔记】CS224W速记（图模型专题）

序言

本文是对2021年秋季CS224W课程slides的速记，没有作业的解答。

CS224W其实看下来更偏向于是理论计算机方向的研究（比如图论），而非重点在图神经网络，因此很多内容理论性很强，本文是笔者花两天时间速过了一遍记录的一些对自己有用的要点，更偏向于图神经网络应用方面的摘要，一些没看懂的部分暂时没有深入研讨，仅先留个印象。

课程链接：http://web.stanford.edu/class/cs224w/

文章目录

序言
- 节点中心度
- 图基元
- 计算两个节点之间路径总数的巧解
- 图核
- 节点嵌入之随机游走
- 整图嵌入
- PageRank算法
- 二分图推荐
- 节点分类之消息传递
- 置换等变异性
- GCN（mean-pool）
- 消息计算与消息聚合
- GraphSage（max-pool）
- GAT
- GNN使用技巧
- GIN
- 异构图
- RGCN
- 知识表示学习
- 知识图谱与多级推理
- 子图与Motif
- 神经子图匹配（没有看懂）
- 推荐系统
- Louvain算法
- GraphRNN
- 一些前沿研究
- LightGCN概述

节点中心度

给定无向图 $G = (V, E)$ ，节点 $v$ 的中心度（centrality） $c_v$ 用于衡量节点 $v$ 的重要性，具体有如下几种计算方式：

特征向量中心度（eigenvector centrality）：节点重要性由与它相邻节点的重要性决定
$c_v=\frac1\lambda\sum_{u\in N(v)}c_u\in\R$
其中 $N (v)$ 表示节点 $v$ 的邻接点， $\lambda>0$ 为标准化系数。

求解上式等价于求解 $\lambda{\bf c}=A{\bf c}$ ，其中 $A$ 为无向图 $G$ 的邻接矩阵，因此等价于求解 $A$ 的特征值与特征向量，根据Perron-Fronbenius定理可知， $\lambda_{\max}$ 必然为正，则通常使用最大特征值 $\lambda_{\max}$ 对应的特征向量 ${\bf c}_{\max}$ 作为式 $(1)$ 的解。
中介中心度（betweenness centrality）：节点重要性由它中转多少对节点之间的最短路径决定
$c_v=\sum_{s\neq v\neq t}\frac{\text{count(shortest paths between } s\text{ and }t\text{ that contain }v)}{\text{count(shortest paths between } s\text{ and }t)}\tag{2}$
如在无向图 $(A, C), (B, C), (C, D), (B, D), (D, E)$ 中， $c_A=c_B=c_E=0,c_C=c_D=3$
紧密中心度（closeness centrality）：节点重要性由它与所有其他节点的距离之和决定
$c_v=\frac1{\sum_{u\neq v}\text{shortest path length between } u\text{ and }v}$
如在无向图 $(A, C), (B, C), (C, D), (B, D), (D, E)$ 中， $c_A=1/8,c_D=1/5$

图基元

首先定义图的同形（isomorphism）：称两个节点数相等的图 $G_1=(V_1,E_1)$ 与 $G_2=(V_2,E_2)$ 是同形的，若存在一一映射 $f:V_1\rightarrow V_2$ ，使得 $E_1=E_2$ （比如五角星和五边形就是同形图）。

判断两个图是否同形是NP-hard

图基元（graphlets）：非同形的图构成的集合。

比如上图中陈列节点数不超过 $5$ 的所有图基元，节点上标号记录不同类型的图基元节点（如 $G_8$ 中的 $4$ 个节点本质上是同类）。

节点数	图基元数量	累积不同图基元节点数量
$2$	$1$	$1$
$3$	$2$	$4$
$4$	$6$	$15$
$5$	$21$	$73$

事实上图基元未必一定是连通图，但是上图和上表中统计的都是连通情况下的计数。

图基元度向量（graphlet degree vectors，GDV）：

节点 $u$ 的GDV由它所在的子图中不同图基元节点出现频率构成。

如上图所示，只考察节点数不超过 $3$ 的图基元，共计 $4$ 种不同的图基元节点 $a, b, c, d$ ，考察节点 $u$ 分别作为这四类节点出现的次数，得到的GDV为 $[2, 1, 0, 2]$

计算两个节点之间路径总数的巧解

定义无向图 $G = (U, V)$ 邻接矩阵 $A$ ：
$A_{uv}=\left\{\begin{aligned} &1&&\text{if }u\in N(v)\\ &0&&\text{if }u\notin N(v) \end{aligned}\right.$
定义路径计数矩阵 $P^{(n)}$ ：
$P^{(n)}_{uv}=\text{count(paths of length }n\text{ between} u\text{ and }v)$
则可以证明 $P^{(n)}=A^n$ ，这里的路径可以不是简单路径（即路径重可以存在环或重复边）。

可以通过数学归纳法证明：
$P_{uv}^{(n+1)}=\sum_{w\in V}A_{uw}P_{wv}^{(n)}=\sum_{w\in V}A_{uw}(A^{n})_{wv}=A^{n+1}$
结论在有向图上同样适用，得到的 $P^{(1)},P^{(2)},...$ 称为Katz索引。

图核

图核（graph kernels）用于衡量图的相似性。

举个最简单的例子，对于两个图 $G_1=(V_1,E_1)$ 与 $G_2=(V_2,E_2)$ ，执行某种图分解算法 $\mathcal{F}$ ：
$\mathcal{F}(G_1)=\{S_{11},S_{12},...,S_{1n_1}\}\\ \mathcal{F}(G_2)=\{S_{21},S_{22},...,S_{1n_2}\}\\$
基于分解得到的子图，定义核值（kernel value）：
$k_R(G_1,G_2)=\sum_{i=1}^{n_1}\sum_{j=1}^{n_2}\delta(S_{1i},S_{2j})$
其中 $\delta$ 函数在两子图同构时取 $1$ ，否则取 $0$ ，这样就将大的图同构问题转化为小的图同构问题，不同的分解算法 $\mathcal{F}$ 和不同的同构定义 $\delta$ 可以得到不同的图核计算方式。

此外还可以使用一些其他的图特征向量表示手段：

统计图中不同度数的节点数量，构成一个特征向量；
统计图中不同图基元的数量，构成一个特征向量；

笔者注：图基元的统计是非常复杂的，若图节点度数不超过 $d$ ，则统计节点数不超过 $k$ 的图基元的时间复杂度为 $O(|V|d^{k-1})$ ；

然后计算特征向量之间的相似度。

最后一种经典的算法是重染色（color refinement）：

首先给全图每一个节点都染上初始颜色 $c^{(0)}(v)$
然后进行 $n$ 轮迭代染色（ $n$ 为超参数）：
$c^{(k+1)}(v)=\text{Hash}(\{c^{(k)}(v),\{c^{(k)}(u)\}_{u\in N(v)}\})$
其中 $\rm Hash$ 函数将不同的输入映射成不同的数值；
最后将具有同样染色序列（即 ${c^{(0)}(v),c^{(1)}(v),...,c^{(n)}(v)\}$ ）的节点定义为同类型的节点，统计各类型节点的数量构成特征向量；

这种算法运行速度要远远快于统计图基元的做法。

节点嵌入之随机游走

随机游走（random walks）的思想源于如果从 $u$ 出发大概率能走到 $v$ ，那么这表明两个节点是相似的。

首先定义几个标记：

$z_u$ ：表示节点 $u$ 的嵌入；
$P(v|z_u)$ ：从节点 $u$ 出发，随机游走到节点 $v$ 的（预测）概率；

那么我们认为 $z^\top_u z_v$ 近似等于 $u$ 和 $v$ 将会同时出现在一条随机游走路径中的概率。通常我们会固定随机游走的长度为一个固定值且不会太大，长度为 $1$ 时退化为邻接点搜索。

具体而言，从节点 $u$ 出发，根据某种随机游走的策略进行序列生成，然后优化各个节点的嵌入表示以拟合上述概率：
$\text{maximize}_{f:u\rightarrow \R^d}\sum_{u\in V}\log P(N_R(u)|z_u)$
其中 $f$ 是节点嵌入映射， $N_R(u)$ 表示从节点 $u$ 出发，在策略 $R$ 下随机游走能够抵达的所有近邻（neighborhood），实际仿真中 $N_R(u)$ 就等于从节点 $u$ 出发抵达的节点集合。

上式中的目标函数本质上就是最大似然，即给定节点 $u$ 的情况下，预测它的近邻节点：
$\mathcal{L}=\sum_{u\in V}\sum_{v\in N_R(u)}-\log(P(v|z_u))$
我们可以使用softmax函数来计算上式中的概率值：
$P(v|z_u)=\frac{\exp(z_u^\top z_v)}{\sum_{n\in V}\exp(z_u^\top z_n)}$
这里又提到计算softmax函数的复杂度很高（主要是分母的计算太复杂），因此需要做负采样：
$\log\left(\frac{\exp(z_u^\top z_v)}{\sum_{n\in V}\exp(z_u^\top z_n)}\right)\approx\log(\sigma(z_u^\top z_v))-\sum_{i=1}^k\log(\sigma(z_u^\top z_{n_i}))$
其中 $\sigma(\cdot)$ 是sigmoid激活函数， $n_i\sim P_V$ 是随机采样得到的节点，此时无需计算softmax分母上所有节点的点积，只需要对采样得到的 $k$ 个随机负样本 $n_i$ 进行计算即可。负样本量 $k$ 的取值通常在 $5$ 到 $20$ ，采样概率分布与节点的度数成正比。

最后说明随机游走策略 $R$ 的选取，这里只介绍一种偏差随机游走（biased random walks）方法：

每次定义往回走（即回到前一个节点）的概率 $1 / p$ 和不往回走的概率 $1 / q$
对于偏向于广度优先搜索的随机游走，赋予 $p$ 以较低的值（即大概率往回走）；
对于偏向于深度优先搜索的随机游走，赋予 $q$ 以较低的值（即大概率往下走）；

这里的概率都是未经标准化过的概率，一般来说会在往下走的节点里面找到一个节点编号最小的（即深度优先搜索默认的下一个节点）来赋予它的概率权重为 $1$ （同样是未经标准化的），然后将一大堆 $1 / q$ 和 $1, 1 / p$ 进行标准化后得到最终的概率值。

一些其他随机游走方法的相关研究：

不同种类的偏差随机游走：

基于节点属性：参考文献

基于学习到的权重：参考文献
其他优化方法：

直接基于一级（one-hop）和二级（two-hop）的随机游走概率：参考文献
网络处理技术：

在各种原始网络变体上运行随机游走：参考文献，参考文献

整图嵌入

方法一：计算每个节点的嵌入并累和。
$z_G=\sum_{v\in V}z_v$
这个方法在参考文献中有使用。
方法二：引入一个虚拟节点来表示整图（或子图），然后计算虚拟节点的嵌入。

这个方法似乎只能用于子图嵌入的学习，整图就只有一个虚拟节点无法学习。在参考文献首次提出。

方法三：匿名游走嵌入（anonymous walk embeddings）。

参考文献首次提出，具体操作如下所示：

首先还是若干次随机游走采样，只不过这次记录随机游走的节点序列的方式稍有变化，一般情况下我们记录的是ABCBC，这里因为是匿名，所以记录为 $12312$ ，注意到在匿名的情况下ABCBC与DEFEF是完全没有区别的。

在匿名的条件下，不同长度的随机游走序列的数量如下图所示：

随机游走序列长度	不同随机游走序列数量
$2$	$2$
$3$	$5$
$4$	$15$
$5$	$52$
$6$	$203$
$7$	$877$
$8$	$3\times 10^3$
$9$	$2.1\times 10^4$
$10$	$1.16\times 10^5$
$11$	$6.79\times 10^5$
$12$	$4\times 10^6$

以长度为 $3$ 为例，不同的序列有 $111, 112, 121, 122, 123$

然后以匿名的方式，采样 $m$ 条随机游走路径（用于刻画图的一个概率分布）：
$m=\left\lceil\frac2{\epsilon^2}(\log(2^\eta-2)-\log(\delta))\right\rceil$
其中 $\eta$ 是上表中给定长度的匿名随机游走序列的种类数（如采样长度为 $7$ 时 $\eta=877$ ），并期望有不超过 $\delta$ 的概率得到的分布误差超过 $\epsilon$
接着直接学习每一条匿名随机游走序列的嵌入表示 $z_i,i=1,...,\eta$
最后将学习得到的所有 $z_i$ 通过某种运算得到整图嵌入 $z_G$ ：
$\text{maximize}_{z_G}\sum_{t=\Delta+1}^T\log P(w_t|w_{t-\Delta},...,w_{t-1},z_G)$
上式中目标函数的含义是来预测在一个大小为 $\Delta$ 的窗口内，同一个匿名随机游走序列同时出现的概率， $T$ 表示采样得到的随机游走序列的数量。

举个例子，采样得到 $w_1=1232,w_2=1234,w_3=1232,w_4=1212$ ，固定 $\Delta=2$ ，则预测 $w_3$ 在给定 $w_1,w_2$ 下出现的概率。
但是提出文里的操作稍有区别，这里的采样通常是从一个固定节点 $u$ 出发，采样 $T$ 条长度为 $l$ 的随机游走序列：
$N_R(u)=\{w_1^u,w_2^u...,w_T^u\}$
然后预测随机游走序列同时出现在大小为 $\Delta$ 的窗口内的概率， $w_i$ 的嵌入为 $z_i$ ：
$\text{maximize}_{z_i,z_G}\frac1T\sum_{t=\Delta}^T\log P(w_t|w_{t-\Delta},...,w_{t-1},z_G)$
其中：
$P(w_t|w_{t-\Delta},...,w_{t-1},z_G)=\frac{\exp(y(w_t))}{\sum_{i=1}^\eta \exp(y(w_i))}\\ y(w_t)=b+U\cdot\left(\text{concat}\left(\frac1\Delta\sum_{i=1}^\Delta z_i,z_G\right)\right)$
同理上式softmax概率的计算依然需要使用负采样来简化， $\text{concat}$ 部分的意思是先将各个随机游走序列的嵌入取均值，再和整图嵌入 $z_G$ 拼接起来， $b\in \R,U\in\R^D$ 是需要学习的参数，其实就是一个全连接层。
最终我们得到了整图嵌入 $z_G$ ，有人可能以为 $z_G$ 就是各个 $z_i$ 加权求和或者拼接得到的，提出文里说得很明确， $z_G$ 和 $z_i$ 一样，都是独立的决策变量。

PageRank算法

计算PageRank的方法有点类似计算马尔可夫链中的稳态概率，原始的PageRank做了一个很强的假定，即一个页面指出去的所有链接都是等权重的，这构成了一个特殊的马尔克夫矩阵 $M$ 。然后计算 $r = M r$ 即可得到所有页面的权重构成的权重向量 $r$

求解 $r = M r$ 有很多近似迭代算法，最简单的方法就是初始化 $r$ 是等权重的，然后每次迭代 $r\leftarrow Mr$ 即可收敛。

但是PageRank算法存在两个问题：

页面是死胡同（没有指出链接），就会造成页面重要性泄漏；

解决方案：让死胡同节点以等概率指向所有其他页面。
页面所有的指出链接都属于同一个group，即存在一大堆页面构成的孤岛区域，此时页面重要性就会被这个孤岛吸收掉，这称为蛛网陷阱（spider traps）。

解决方案：每次随机游走以小概率跳到随机页面中。
$r_j=\sum_{i\rightarrow j}\frac{r_i^{(t)}}{d_i}\longrightarrow r_j=\sum_{i\rightarrow j}\beta\cdot\frac{r_i^{(t)}}{d_i}+(1-\beta)\cdot\frac1 N\\ r=Mr\longrightarrow\beta M+(1-\beta)\left[\frac1N\right]_{N\times N}$
一般 $\beta=0.8,0.9$

非常简单的例子，两个页面， $a\rightarrow b$ ，此时就会发生死胡同问题；如果是 $a\rightarrow b,b\rightarrow b$ ，则会发生蛛网陷阱问题。

二分图推荐

常见的商品和用户（购买与评分）会构成二分图的关系，根据这样的关系可以对用户进行商品推荐，如查询与某个商品关联度最高的另一个商品。

从路径的角度来看，可以计算两个商品之间的距离，但是只看距离肯定是不够的，比如两个商品被同一个人购买，与两个商品被同一群人购买，这两个商品的相似度肯定是不一样的。

因此类似PageRank，我们认为每个商品都有一个重要性，可以通过随机游走来衡量这种重要性，算法代码如下：

item = QUERY_NODES.sample_by_weight()
for i in range(N_STEPS):
    user = item.get_random_neighbor()
    item = user.get_random_neighbor()
    item.visit_count += 1
    if random() < ALPHA:	# 跳转
        item = QUERY_NODES.sample_by_weight()

比如上面代码从 $QUEY_NODES = { Q } \text{QUEY\_NODES}=\{Q\}$ 出发，设定 $\text{ALPHA}=0.5$ ，我们可以统计每个商品被访问的次数，然后即可得到与 $Q$ 相似度最高的商品集合。

这种算法考虑到了商品和用户之间的多重联系、多重路径，直接与间接联系，因此是具有很高可信度的。

节点分类之消息传递

场景：图中一些节点已有标签，如何给其他节点赋上标签？
算法：
$P(Y_v=c)=\frac{1}{\sum_{(v,u)\in E}A_{v,u}}\sum_{(v,u)\in E}A_{v,u}P(Y_u=c)$
其中 $Y_v$ 表示节点 $v$ 的标签， $A$ 是邻接矩阵（值可以是边的权重）。

这样就将每个节点的标签信息进行了传播。

注意上式的收敛性不能得到保证。
具体而言，首先将每个节点的标签概率赋好，有标签的直接给对应标签赋确定概率，没有标签的给每个标签赋等概率值。然后通过上面的消息传递算法进行迭代。

当然节点分类也可以直接用节点的特征向量来表示（用 $z_v$ 来预测 $Y_c$ ），有一个经典算法是迭代分类器（iterative classifier），在迭代过程中不断修正 $z_v$ 和 $Y_c$ ，不过个人觉得直接用机器学习来得容易些。

后面还有一个Correct & Smooth的分类器，重点是预测分类完之后做的后处理算法，看起来很高端，但是我觉得好像没有什么用，感觉很像是对训练残差做二次训练。找到一篇论文精读和实现的博客，可以参考，不一定有用。

置换等变异性

置换等变异性（permutation equivariance）是说图节点本身没有次序可言，定义一个图 $G = (A, X)$ ，其中 $A$ 是邻接矩阵， $X$ 是所有节点特征向量拼成的特征矩阵，对于不同次序的节点编号， $A, X$ 的行列可能是需要置换的，那么如果存在一个函数 $f$ ，使得对于任意两个不同次序的节点编号得到的 $A_i,X_i$ 和 $A_j,X_j$ ，都有 $f(A_i,X_i)=f(A_j,X_j)$ 成立，则称 $f$ 是置换等变异性函数。

GCN（mean-pool）

[Kipf & Welling, ICLR 2017]

思想：节点的近邻定义了一个计算图（computational graph），即每个节点可以根据近邻的边来聚合近邻的信息。
基本方法：对近邻节点的信息取平均实现消息传递。
$h_v^{(k+1)}=\sigma\left(W_k\sum_{u\in N(v)}\frac{h_u^{(k)}}{|N(v)|}+B_kh_v^{(k)}\right)\quad k=0,1,...,K-1$
其中 $h_v^{(n)}$ 是节点 $v$ 在网络第 $n$ 层的信息， $K$ 是总网络层数， $W_k$ 和 $B_k$ 是可学习的参数。

通过某种方法初始化 $h_v^{(0)}$ ，最后一层的输出作为节点嵌入 $z_v=h_v^{(K)}$

可以改写为矩阵形式：
$H^{(k+1)}=\sigma(\tilde AH^{(k)}W_k^\top+H^{(k)}B_k^\top)$
其中 $H^{(k)}=[h_1^{(k)},...,h_{|V|}^{(k)}]^\top,\tilde A=D^{-1}A$ ， $D$ 是节点度数对角矩阵。
图卷积层是置换等变异性函数
一般损失函数可以定义为：
$\mathcal{L}=\sum_{z_u,z_v}\text{CE}(y_{u,v},\text{DEC}(z_u,z_v))$
其中 $y_{u,v}$ 是标签值，在 $u, v$ 相似时标注为 $1$ ，否则为 $0$ （其实一般只有 $u = v$ 才标注为 $1$ ）， $\text{DEC}$ 可以理解为向量内积，外面套着的是交叉熵。
与CNN的对比：显然CNN就是一种特殊的GNN。
与Transformer的对比：事实上Transformer也可以看作是一种特殊的GNN，它的计算图就是一个完全图（所有输入分词看作节点，节点之间相互有边相连）。

消息计算与消息聚合

广义上的GNN网络层的逻辑由消息计算和消息聚合两步组成，合在一起就是消息传递。

消息计算：
$m_u^{(l)}=\text{MSG}^{(l)}(h_u^{(l-1)})\quad u\in\{N(v)\cup v\}$
每个节点生成信息，用于传递给其他节点，最简单的形式如 $m_u^{(l)}=W^{(l)}h_u^{(l-1)}$
消息聚合：
$h_v^{(l)}=\text{AGG}(\{m_u^{(l)},u\in N(v)\})$
简单的聚合函数 $\text{AGG}$ 可以是求和、取平均、取最大值等。

这里有一个问题就是我们可能担心节点 $v$ 自己的信息发生丢失，因此常见的改进可以是：
$h_v^{(l)}=\text{CONCAT}(\text{AGG}(\{m_u^{(l)},u\in N(v)\}),m_v^{(l)})$
即直接把上一层节点 $v$ 产生的消息拼接进来。

通常来说GNN中进行BatchNorm和Dropout（随机丢弃图中节点，剩下节点构成子图）也是很必要的。

GraphSage（max-pool）

[NeurIPS 2017]

GCN显然可以套用上面的形式，记录一个常用的GraphSAGE层：
$h_v^{(l)}=\sigma(W^{(l)}\cdot\text{CONCAT}(h_v^{(l-1)},\text{AGG}(\{h_u^{(l-1)},\forall u\in N(v)\})))$
常用的聚合方法有：

平均：
$\text{AGG}=\sum_{u\in N(v)}\frac{h_u^{(l-1)}}{|N(v)|}$
池化：
$\text{AGG}=\text{MEAN}(\{\text{MLP}(h_u^{(l-1)},\forall u\in N(v))\})$
LSTM：
$\text{AGG}=\text{LSTM}([h_u^{(l-1)},\forall u\in \pi(N(v))])$
$\pi$ 表示对近邻进行打乱顺序。

此外GraphSage中对隐层状态进行正则化：
$h_v^{(l)}\leftarrow \frac{h_v^{(l)}}{\|h_v^{(l)}\|_2}$
否则生成的节点嵌入的尺度会不一样。

GAT

图注意力网络（Graph Attention Networks，GAT）：
$h_v^{(l)}=\sigma\left(\sum_{u\in N(v)}\alpha_{vu}W^{(l)}h_u^{(l-1)}\right)$
在GCN或GraphSage中， $\alpha_{vu}=1/|N(v)|$ 是等权重的，这里会类似注意力机制，根据节点相似性一个注意力权重。

一些常见的做法：

定义注意力函数 $a$ ，得到一个得分值：
$e_{vu}=a(W^{(l)}h_u^{(l-1)},W^{(l)}h_v^{(l-1)})$
比如可以是：
$e_{vu}=\text{Linear}(\text{Concat}(W^{(l)}h_u^{(l-1)},W^{(l)}h_v^{(l-1)}))$
使用softmax函数计算得分值的权重分布：
$\alpha_{vu}=\frac{\exp(e_{vu})}{\sum_{w\in N(v)}\exp(e_{vw})}$

此外还可以是多头注意力，即多用几个不同的注意力函数 $a$ ，生成不同的权重 $\alpha_{vu}$ ，然后对结果取聚合：
$\left.\begin{aligned} h_{v1}^{(l)}=\sigma\left(\sum_{u\in N(v)}\alpha_{vu}^{1}W^{(l)}h_u^{(l-1)}\right)\\ h_{v2}^{(l)}=\sigma\left(\sum_{u\in N(v)}\alpha_{vu}^{2}W^{(l)}h_u^{(l-1)}\right)\\ h_{v3}^{(l)}=\sigma\left(\sum_{u\in N(v)}\alpha_{vu}^{3}W^{(l)}h_u^{(l-1)}\right) \end{aligned}\right\}\Rightarrow h_v^{(l)}=\text{AGG}(h_{v1}^{(l)},h_{v2}^{(l)},h_{v3}^{(l)})$
比如 $\text{AGG}$ 函数可以直接就是拼接，这样信息损失得最少。

GNN使用技巧

图结构增强：

① 图太稀疏，则添加虚拟节点或虚拟边（比如将二级近邻之间也连上边，或者直接 $A+A^2$ ）。

② 图太稠密，则消息传递时选择对近邻进行采样。

③ 图太庞大，则采样子图计算子图的嵌入，如可以通过重复的随机游走来采样，但要尽可能保持原始图的连通性（从消息传递的角度来说是这样的）。
图特征增强：比如使用节点的度数、聚类稀疏、PageRank、中心度等。
GNN训练管道：输入图 $\rightarrow$ GNN网络层迭代 $\rightarrow$ 得到节点嵌入（或每个节点的隐层表示） $\rightarrow$ 得到预测头（prediction head，节点级别、边级别、图级别的任务涉及不同的预测头，通常都由节点嵌入通过运算得到） $\rightarrow$ 得到预测结果 $\rightarrow$ 评估指标与损失函数。
节点级别的预测头：直接 $\text{Head}(z_u)=Wz_u$ （节点嵌入输入到一个全连接层）
边级别的预测头： $\text{Head}(z_u,z_v)$ ，简单的方法就是拼起来然后输入到全连接层，即 $\text{Linear}(\text{Concat}(\cdot,\cdot))$ ，也可以取点积 $z_u^\top z_v$ （这个只能输出一个标量），或是二次型 $z_u^\top Wz_v$ （这个可以多用几个不同的 $W$ ，将得到的标量结果拼起来，得到的是一个向量）
图级别的预测头：这个就与GNN网络层中的 $\text{AGG}$ 函数没什么两样了，取均值，最大值，求和等等。
层级图池化（hierarchical global pooling）：

直接对所有节点嵌入的每一维进行池化是不合理的，这样嵌入的每一维都容易损失很多信息，因此可以两个两个进行池化，这样就少损失一些。

举个例子，对所有数字进行求和池化： $\text{Sum}(\{-1,-2,0,1,2\})=0$ ， $\text{Sum}(\{-10,-20,0,10,20\})=0$ ，这两个就没有区别了，但是两个两个使用 $\text{ReLU}(\text{Sum}(\cdot,\cdot))$ 来池化，就很不一样了。
图划分：用于划分训练集，验证集和测试集，对于那种很大的图上的分类问题，一般就是随机采样节点得到子图作为验证集和测试集，剩下的大部分节点构成的子图作为训练集（注意这种做法要多随机划分几次，报告不同随机种子下的训练情况），这种配置称为是Inductive的。

注意只用子图可能也会影响图结构，因此有时候会选择Transductive的配置，即训练、验证都用全图，只不过训练时只计算训练集中节点或边的计算损失函数，验证时用验证集中节点或边的标签计算评估指标。

GIN

[ICLR 2019]

图同形网络（graph isomorphsim network）：
$\text{MLP}_{\Phi}\left(\sum_{x\in S}\text{MLP}_f(x)\right)$
GIN的近邻聚合函数是单射（injective），GIN是目前最具有区分度的GNN（消息传递类型的GNN）！

GCN和GraphSAGE的聚合函数可能会将不同的multi-set输入映射成同样的输出，因此不是那么具有区分度，理想的那种将multi-set输入进行单射的函数应当形如：
$\Phi\left(\sum_{x\in S}f(x)\right)$
其中 $\Phi$ 和 $f$ 都是非线性函数， $S$ 是multi-set输入（比如所有近邻的信息）。

记得前文提过的那个重染色法的 $\text{Hash}$ 函数就是一个单射，GIN相当于是用神经网络来模拟单射的 $\text{Hash}$ 函数：
$c^{(k+1)}(v)=\text{Hash}(c^{(k)}(v),\{c^{(k)}(u)\}_{u\in N(v)})$
建模即为：
$\text{MLP}_{\Phi}\left((1+\epsilon)\cdot\text{MLP}_f(c^{(k)}(v))+\sum_{u\in N(v)}\text{MLP}_f(c^{(k)}(u))\right)$
上面这种单射提升的是GNN的expressive power

异构图

异构 $G = (V, E, R, T)$ ：

$v_i\in V$
$(v_i,r,v_j)\in E$ ，带关系的边
节点类型： $T(v_i)$
关系类型 $r\in R$

RGCN

即关系型图卷积网络（Relational GCN），图的边上带有关系标签：
$h_v^{(l+1)}=\sigma\left(\sum_{r\in R}\sum_{u\in N_v^r}\frac1{c_{v,r}}W_r^{(l)}h_u^{(l)}+W_o^{(l)}h_v^{(l)}\right)$
其中 $c_{v,r}=|N_v^r|$ ，即以关系 $r$ 连接的邻接点数量。同样上式符合消息生成与消息聚合的形式。

每个关系 $r$ 对应 $L$ 个矩阵（网络共有 $L$ 层）： $W_r^{(1)},...,W_r^{(L)}$ ，其中 $W_r^{(l)}\in d^{(l+1)}\times d^{(l)}$

一般来说，需要对 $W_r^{(l)}$ 进行贵正则化，比如令 $W_r^{(l)}$ 是对角块矩阵，或是令 $W_r=\sum_{b=1}^Ba_{rb}\cdot V_b$ ，其中 $V_b$ 是所有关系共用的一个矩阵（基础矩阵）。

RGCN用于链接预测：

① 首先RGCN对训练监督的边 $E,r_3,A)$ 进行评分

② 构建一个负边（negative edge，即加一条假边） $E,r_3,B)$

③ RGCN对负边进行评分

④ 目标函数包括最大化训练监督的边的得分和最小化负边的得分：
$l=-\log\sigma(f_{r_3}(h_E,h_A))-\log(1-\sigma(f_{r_3}(h_E,h_B)))$

知识表示学习

知识图谱中关系类型：

对称关系（家人，室友）：来回的关系一样；
互逆关系（导师，学生）：来回的关系不一样；
复合关系（妈妈的爸爸是公公）：关系叠加；
一对多关系（老师有多个学生）： $(h, r)$ 指向多个 $t$
反对称（antisymmetric）关系：上位词（hypernym）和下位词， $r(h,t)\Rightarrow\text{not }r(t,h)$ ，注意TransE可以建模反对称关系，即 $h+r=t,t+r\neq h$

得分函数：

翻译类型的得分函数： $f_r(h,r)=-\|h+r-t\|_*$
TransE：

TransE可以建模互逆关系，复合关系，反对称关系，但无法建模对称关系和一对多关系。

训练的损失函数：
$\mathcal{L}=\sum_{(h,r,t)\in G,(h,r,t')\notin G}[\gamma+f_r(h,t)-f_r(h,t')]_+$
TransR：建模实体在空间 $R^d$ 中，关系在空间 $R^k$ 中，再来一个投影矩阵 $M_r\in\R^{k\times d}$ （从实体空间映射到关系空间）。

① $h_{\perp}=M_rh,t_{\perp}=M_rt$ ，

② $f_r(h,r)=-\|h_{\perp}+r-t_{\perp}\|_*$

此时TransR可以建模对称关系，反对称关系，一对多关系互逆关系，复合关系。
DistMult： $f_r(h,t)=\sum_ih_ir_it_i$ ，即为连乘求和。

可以建模一对多关系，对称关系，不能建模反对称关系，互逆关系，复合关系。
ComplEx： $f_r(h,t)=\text{Re}(\sum_ih_ir_i\bar t_i)$ ， $\text{Re}$ 表示取实部。

其中向量是在 $\mathcal{C}^{k}$ 中建模，即是复数嵌入向量， $\bar t_i$ 是共轭复数。

可以建模一对多关系，对称关系，反对称关系（使用），互逆关系，但不能建模复合关系。

关于对称关系的推导：
$f_r(h,t)=\text{Re}\left(\sum_ih_ir_i\bar t_i\right)=\sum_i\text{Re}(r_ih_i\bar t_i)=\sum_ir_i\cdot\text{Re}(h_i\cdot \bar t_i)=\sum_ir_i\cdot \text{Re}(\bar h_i t_i)=\sum_{i}\text{Re}(r_i\bar h_it_i)=f_r(t,h)$

知识图谱与多级推理

知识图谱中的查询类型：

① 一级（one-hop）查询： $A\overset r\rightarrow B$

② 路径查询： $A\overset {r_1}\rightarrow B\overset{r_2}\rightarrow C$ （这种就是多级推理）

③ 联合（conjunctive）查询： $A\overset{r_1}\rightarrow C\overset{r_2}\leftarrow B$

举个联合查询的例子：什么药物能够治疗乳腺癌并且引发头痛？

理想情况下，如果知识图谱足够完备，那么直接通过逻辑搜索即可解决查询问题，然而实际上知识图谱永远不可能是完整的（随着时间需要更新，人工编纂也必然遗漏信息）。
知识图谱补全（KGC）：

遍历知识图谱中长度为 $L$ 路径的时间复杂度为 $O(d_{\max}^L)$ ，其中 $d_{\max}$ 为节点最大度数。

但是我们可以在向量空间中遍历知识图谱的所有关系和节点！

比如给定一级查询 $(h, r)$ ，预测目标为 $q = h + r$ ，然后找个与 $q$ 最相近的 $t$ 即可。

多级查询 $h,r_1,r_2,...)$ 同理，联合查询等价于 $h_1,r_1,h_2,r_2)$ ，那就是要找一个 $t$ 与 $h_1+r_1$ 和 $h_2+r_2$ 都接近（下面会告诉你具体怎么做）。

这种查询的思想也可以用于KGC。
盒嵌入（box embeddings）：

可能有人注意到联合查询其实是不容易处理的，如果节点嵌入和关系嵌入学得不好，可能 $h_1+r_1$ 与 $h_2+r_2$ 差的很远，而且理论上 $h_1+r_1$ 应该对应很多实体， $h_2+r_2$ 也对应很多实体，我们要做的是在这两个集合的实体取交集。

因此可以考虑使用盒嵌入，即一类实体的嵌入（在超空间中就是一个超矩形的区域）：
${\bf q}=(\text{center}(q),\text{offset}(q))$
记录这块超矩形区域的中心和边界即可，然后联合查询就化简为超矩形取交集（应该也是一块超矩形），最后的目标就是找一个实体 $t$ ，使得它与这块超矩形交集距离最近（需要定义点到空间的距离）。

具体而言，关于盒嵌入有很多不同的做法，这里只举一种可行的做法：

① 实体嵌入都是向量，但关系嵌入是盒嵌入

② 那么 $h + r$ 就映射到了一块盒空间：
$\text{center}(q')=\text{center}(q)+\text{center}(r)\\ \text{offset}(q')=\text{offset}(q)+\text{offset}(r)$
③ 然后若干盒子的交集还是一个盒子（具体需要用神经网络训练这种映射）：
$\text{center}(q_{\rm intersection})=\sum_i w_i\odot \text{center}(q_i)\\ w_i=\frac{\exp(f_{\rm cen}(\text{center}(q_i)))}{\sum_j\exp(f_{\text{cen}}(\text{center}(q_j)))}\\ \text{center}(q_i)\in\R^d,w_i\in\R^d\\ \text{offset}(q_{\rm intersection})=\min(\text{offset}(q_1),...,\text{offset}(q_n))\odot\sigma(f_{\rm off})(\text{offset}(q_1),...\text{offset}(q_n)))\\ \begin{aligned} \text{where}:&\odot\text{ is hadamard product(element-wise product)}\\ &f_{cen}\text{ and }f_{\rm off} \text{ is neural networks}\\ &w_i\text{ is self-attention score} \end{aligned}$
④ 关于点到盒子的距离：
$d_{\text{box}}({\bf q},v)=d_{\rm out}({\bf q}, v)+\alpha d_{\rm in}({\bf q},v)$
其中 $d_{\rm out}$ 是点 $v$ 到盒子 $\bf q$ 边界的最短距离，然后 $d_{\rm in}$ 是从边界位置到盒子 $\bf q$ 中心的最短距离。 $0<\alpha<1$ 是正则系数。
与或查询（AND-OR queries）：

上面这种联合查询是交集，即是与查询，那么还可能有取并集，即或查询。

注意在二维平面上，三个节点 $v_1,v_2,v_3$ 构成锐角三角形时，我们总是可以两两画出盒子将两个点框起来而不框进第三个点，但是如果是钝角三角形，就无法满足这种情况了，推广到高维空间亦是如此。因此或查询要更加复杂。

结论是：对于任意 $M$ 个联合查询 $q_1,...,q_M$ 以及互不覆盖（non-overlapping）的答案，我们需要 $\Theta(M)$ 维的空间才能处理所有的或查询。

那么既然做与或查询这么困难，实际方法是先分别查询，然后在最后一步再取并集。
查询到盒子（query2box）的训练方法：

① 从训练图 $G_{\text{train}}$ 中随机采样一个查询 $q$ ，以及答案 $v\in[q]_{G_{\rm train}}$ ，以及一个负样本 $v'\notin[q]_{G_{\rm train}}$

② 嵌入查询 $q$

③ 计算 $f_q(v)$ 与 $f_q(v')$

④ 最优化损失函数 $l$ （最大化 $f_q(v)$ 并最小化 $f_q(v')$ ）：
$l=-\log\sigma(f_q(v))-\log(1-\sigma(f_q(v')))$

子图与Motif

motif好像就是节点导出子图（induced subgraph），主要是用于刻画图的局部特征，motif可以视为图的一个子结构，这种子结构可能在图中有多次出现。

关于motif的几个指标

$Z\text{-score}$ ： $Z_i$ 用于刻画motif i的统计显著性
$Z_i=\frac{N_i^{\rm real}-\bar N_i^{\rm rand}}{\text{std}(N_i^{\rm rand})}$
其中 $N_i^{\rm real}$ 是图中motif i出现的次数， $\bar N_i^{\rm rand}$ 是在随机生成的图中motif i出现的平均次数
网络显著性（network significance profile）：
$SP_i=\frac{Z_i}{\sqrt{\sum_{j}Z_j^2}}$

总的来说，图越大， $Z\text{-score}$ 越高。

我们很多时候是想要在图中挖掘出出现频次很高的motif，有点类似数据挖掘里的频繁项集，但是寻找频繁motif是一个NP-hard的问题。

跟下面的神经子图匹配一样，也有通过神经方法来解决这个频繁motif挖掘的问题（但是我还是每太看懂，这两个的方法其实是很接近的，但是就是看不明白）。

神经子图匹配（没有看懂）

神经子图匹配（Neural subgraph matching）问题定义：给一个整图 $G$ 和一个小图 $g$ ，判断 $g$ 是否是 $G$ 的子图？

这个问题其实很复杂（要逐点逐边进行对比，显然是NP-hard），但我们可以使用神经网络的方法来解决（这倒是很新奇）。

思想是通过节点嵌入进行对比，但是原理每太看明白，感觉有点奇特。

推荐一篇其他人写的这章slide的博客，里面稍微记了一些笔记内容，但是不多，还是不太搞得明白。

Louvain算法

Louvain算法是基于模块度的社区发现算法，该算法在效率和效果上都表现较好，并且能够发现层次性的社区结构，其优化目标是最大化整个社区网络的模块度。

GraphRNN

转载自https://zhuanlan.zhihu.com/p/272854914

图由若干个点和边构成，一个很自然的想法是，逐个生成这些点和边，也就是生成节点和连边的序列，这正是RNN擅长的事，所以有了GraphRNN模型。

下图是一个GraphRNN的示意图， $S_i^\pi$ 表示序列每一步生成的元素，与传统RNN不同的是，GraphRNN每一步不仅要生成节点，还要生成这个节点与其他节点之间的连边，而要生成若干个连边，需要另一个序列生成模型，所以GraphRNN生成的序列S是一个Seq of Seq，即，序列的序列，这也正是GraphRNN复杂的地方。

下面来看一个GraphRNN的示例，第一个unit是序列的其实状态，第二个unit生成了1号节点，然后生成了下一个节点与1号节点的连边关系，值是1，因此第三个unit生成了节点2，并且节点2与节点1相连，然后生成下一个节点与节点1和2的连边，即图中的 $S_3^\pi$ ，节点3和节点1连接，与节点2不连接，由此到下一个unit，生成了节点3，剩余unit可以以此类推。这里，Node-level的RNN只负责生成Edge-level RNN的初始状态，Edge-level RNN负责生成连边关系。

课程中还提到，训练时采用Teacher Forcing方式，即，下一个unit的输入不来自上一个unit的输出，而是上一个unit的label，这就保证了GraphRNN一定可以生成一张一模一样的图，但是这种过拟合的方法在实践中是否管用，笔者持保留意见。

一些前沿研究

位置感知（position-aware）的GNN：

相对概念的结构感知的图，结构感知的图会将图中的等价节点标注为一类（可以看Graphlet的那个图里，只标注的同类节点，未标注的其他节点在结构上都有同等的对应），位置感知的图则有点类似聚类的标注，比如同属于一个三角形的三个顶点会标为一类，另一个三角形的三个节点标为另一类。

GNN总是会在位置感知的任务上失败，因为GNN对位置并不敏感。

因此需要引入一个锚定点（Anchor），随机选取即可，以相对于锚定点的距离来判定不同节点的位置。

类似有推广到锚定集合，即选一群点作为锚定。

基于此可以训练得到带有位置信息的节点嵌入和边嵌入。
身份感知（identity-aware）的GNN：

这个考虑的问题是，在一些情况下，输入不同的图，但是它们的计算图是完全相同的。

这个问题感觉偏理论计算机研究的领域，由此衍生出的概念是ID-GNN

看到这里越来越觉得GNN真的没有看起来那么简单，相比于神经网络，GNN有更多需要发掘的理论问题，根源就是图论的复杂性，很多图论问题都可以拉到GNN里来考虑。
GNN的鲁棒性（robustness）：即对图做微扰，预测结果发生的变化。

LightGCN概述

[Wu et al. ICML 2019]，从原先的GCN模型中去除了非线性激活层。

数学标记定义：

邻接矩阵 $A$ ，这里做了一个自循环处理，即 $A\leftarrow A+I$ ，这个在GCN里也是这么处理的；
节点度数矩阵 $D$
正则化的邻接矩阵 $\tilde A=D^{-1/2}AD^{-1/2}$
$E^{(k)}$ 表示第 $k$ 层的嵌入矩阵；
$E$ 表示输入的嵌入矩阵；
$E^{(k+1)}=\text{ReLU}(\tilde AE^{(k)}W^{(k)})$ ， $W^{(k)}$ 为可学习得到参数；

你可能感兴趣的:(CS224W课程系列,学习,图论,算法,知识图谱,人工智能)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
2019-08-08 65454
东莞家庭聚会出行旅游去哪里玩住？想起来有很久没有和家里人聚会啦，这次组织家人来到威廉古堡别墅轰趴，一大家子27个人，在别墅订了一天办，玩的非常的开心，小孩子玩游戏机，也很放心不会丢，我们就在唱歌、打麻将、打桌球一系列的活动，还准备小次等小孩生日在别墅举办，还可以给孩子做一个生日的策划
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
阶段总结反思轻争
马上就要进入10月份了，今天做一下前段时间的总结和反思。前段时间，日更、英语、健身、护肤坚持的比较好。阅读、书法坚持的不好。1.中间被迫停更半个多月，其余时间一直在坚持日更挑战。偶尔也有不想写的时候，就做一下摘抄。因为阅读（输入）没跟上来，所以写作（输出）质量有待进一步加强。2.英语做到了一周至少学习5天，每次不少于30分钟，但是小班课没有跟上更新速度，下一步要争取利用零碎时间补听小班课。3.减肥
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修