Ricardo1998

【菲尔兹学院夏令营】复杂网络4-高级操作

高级操作

图嵌入（Graph Embedding）

图半监督学习（SSL）

超图

图嵌入

Graph Embedding，也叫图表示学习(Network Representation Learning)

图嵌入的快速概述
一些算法：node2vec、LINE、Verse
比较嵌入算法的框架
示例

概述

目标：

将网络（节点）映射到向量（特征）空间
将相似节点映射到向量空间中的附近位置。“相似”可能有不同含义：
- 图拓扑上较近
- 图中相似的角色（例如：度相似）
- 相似的节点属性

应用实例：

特征学习（不是特征工程）
可视化
链接预测
社区检测
异常检测
网络演化（动力学）

形式化描述：

输入：G = (V , E)
输出：特征向量 $z_v ∈ \mathbb{R}^k, ∀v ∈ V$

算法

——大部分算法基于随机游走和用于词嵌入的 SkipGram 方法

词的语义由其上下文决定(A word can be characterized by the company it keeps)
相似上下文中的词（相近的词）具有相似的含义
考虑每个单词周围的窗口；构建“词向量”（例如：word2vec）
使用这些作为训练数据

SkipGram：

使用滑动窗口邻域对每个词上下文的相关词进行组合，构建“词向量”

DeepWalk（深度游走）：

单词——对应于节点 $v \in V$
句子——对应于图 G 上的随机游走
句子中的词频呈现幂律分布——游走中的顶点也呈现幂律分布

node2vec：

定义了有偏随机游走（biased random walks）混合了广度和深度优先搜索
关键参数：
- p：控制重新访问同一节点的概率（留在附近）
- q：控制探索更远的概率

参数允许在以下之间进行权衡：
- 低 p：在本地探索；这将侧重于图形拓扑结构中的社区结构（同质性）；
- 低q：探索更远；这允许捕获节点之间的一些结构相似性（例如：集线器hubs，网桥bridges）；

其他算法：

统计表见课件

在我们的测试中使用了：

node2vec：q=1，p各不相同
VERSE：来自相似性度量（具有个性化page rank）的多功能图嵌入算法：使用默认参数
LINE：Large-scale Information Network Embedding（大规模信息网络嵌入），它使用邻接矩阵的近似分解来尝试保留一阶和二阶邻近度

比较框架

我应该使用哪种嵌入算法？

如何选择参数？

我怎么知道这种嵌入算法对图的表示就好？

GIGO：向量空间中的错误表示会导致错误的结果…

算法之间的结果可能会有很大差异，并且随着参数的选择也会有很大不同

核心：使用嵌入后的向量构建同分布随机图，比较随机图和原图的JS散度，若很小，说明相近，进而说明嵌入效果良好

概述

框架模型：

给定具有度分布 $w = (w_1, . . . , w_n)$ 的 n 个顶点上图 G = (V , E) 及其顶点到 k 维空间的嵌入，$ ε : V → \mathbb R^k$。

我们的目标是为这个嵌入分配一个“分歧分数”(divergence score)。
分数越低，嵌入越好。这将使我们能够在不同的维度上比较多个嵌入的结果

总述：

非随机图表现出类似社区的结构，所以我们一般：
1. 将节点分组为集群
2. 测量簇之间和簇内的边缘密度
3. 通过计算散度分数将其与嵌入（矢量）空间中空间模型的预测密度进行比较
4. 选择得分最高的嵌入
我们的框架中有两个主要部分：
1. 图拓扑视图：一个好的、稳定的图聚类算法；我们默认使用 ECG，但我们也尝试使用 Louvain 和 InfoMap
2. 空间视图：我们引入了基于度分布 w 和嵌入 ε 的几何 Chung-Lu (GCL) 模型。

几何Chung-Lu(GCL) 模型

Chung-Lu 模型：（引子）

在原始的 Chung-Lu 模型中，每个集合 $e = {v_i, v_j}, v_i, v_j ∈ V$ 被独立采样为边，概率为：

$p_{i, j}= \begin{cases}\frac{\operatorname{deg}_G\left(v_i\right) \operatorname{deg}_G\left(v_j\right)}{2|E|}, & i \neq j \\ \frac{\operatorname{deg}_G^2\left(v_i\right)}{4|E|}, & i=j\end{cases}$
它产生的分布保留了每个顶点的预期度数

几何Chung-Lu(GCL) 模型：

考虑预期的度分布：

$w = (w_1, . . . , w_n) = (deg_G(v_1), . . . , deg_G(v_n))$

以及节点$ ε : V → \mathbb R^k$ 的嵌入，以便我们知道所有距离：

$d_{i,j} = dist(ε(v_i), ε(v_j))$

模型应该满足 $p_{i,j} ∝ g(d_{i,j})$ ，g为递减函数，因此长边的出现频率应该低于短边

我们使用以下归一化函数 $g ： [0, \infty) \to [0, 1]$ 其中 $α \in [0, \infty)$ 是一个定值：
$\begin{gathered} g(d):=\left(1-\frac{d-d_{\text {min }}}{d_{\max }-d_{\min }}\right)^\alpha, \\ d_{\text {min }}=\min \{\operatorname{dist}(\mathcal{E}(v), \mathcal{E}(w)): v, w \in V\} \\ d_{\max }=\max \{\operatorname{dist}(\mathcal{E}(v), \mathcal{E}(w)): v, w \in V\} \end{gathered}$
——我们使用裁剪（clipping）来强制 $g(d_{min}) < 1$ 和/或 $g(d_{max}) > 0$
- 当 α = 0 时，此模型退化为原始的 Chung-Lu 模型，忽略了节点对的距离
- 参数 α 越大，对长边的厌恶越大
- 因此，模型的唯一参数是 α ∈ [0, ∞)
- 在实践中，我们会尝试一系列值并保持最佳拟合。
GCL模型是基于顶点集 $V = {v_1, . . . , v_n}$ 上的随机图 $\mathcal G(\mathbf W, \mathcal{E}, α)$ 其中 vi, vj, 形成一条边的概率为：
$p_{i,j} = x_ix_jg(d_{i,j})$
- 权重选择： $x_i ∈ \mathbb R_+$
顶点vi的度期望为：
$w_i=\sum_j p_{i, j}=x_i \sum_j x_j g\left(d_{i, j}\right)$

定理：当 G 中的最大度数小于所有其他顶点的度数之和时，仅有唯一的权重选择。

——由于 G 的每个连通分量都可以独立嵌入，我们可以假设 G 是连通的，因此 G 的最小度数至少为 1。因此，除非 G 是 n 个顶点上的星形，否则这个非常温和的条件是平凡的。

我们要做的，就是通过选择权重，使得度分布期望等于原图度分布。

解GCL模型

我们使用一个简单的数值近似程序

从任意向量开始 $\mathbf t_0 = (t_0^1 , . . . , t_0^n ) = (1, . . . , 1)$
给定 $\mathbf t^s = (t^s_1, . . . , t^s_n)$ ，如果我们以如下概率在 vi 和 vj 之间引入一条边：
$p^s_{i,j} = t^s_i t^s_j g(d_{i,j})$
那么 vi 的度期望将是：（这对应于上小节度期望）
$s_i^s=\sum_j p_{i, j}^s=t_i^s \sum_j t_j^s g\left(d_{i, j}\right)$
通过用 $t^s_i (w_i/s^s_i)$ 替换 $t^s_i$ 来调整权重，使 $s^s_i$ 与 $w_i$ 匹配
- 这也会影响 $\mathbf s^s$ 的其他值，并且 $\mathbf t$ 其他部分的变化也会影响 $s^s_i$ 自身。
- 因此，我们让每个顶点向正确的方向迈出一小步
- 这个过程很快收敛到理想状态：对于所有 i， $s^s_i$ 都非常接近 $w_i$ 。
迭代步骤：
- 对于每个 i，1 ≤ i ≤ n，我们定义
  $t_i^{s+1}=(1-\epsilon) t_i^s+\epsilon t_i^S\left(w_i / s_i^s\right)=t_i^s+\epsilon t_i^S\left(w_i / s_i^s-1\right)$
- 重复调整过程直到 $max_i |\mathbf W_i − s^s_i | <δ$
- 定义 ε = 0.1 、 δ = 0.001

分歧分数算法

计算嵌入分歧分数（embedding divergence score）的算法

给定 G = (V, E)，它在 V 上的度分布 w，以及它的顶点的嵌入$ \mathcal E : V → \mathbb R^k$，我们将执行接下来详述的五个步骤

通过算法，我们获得 $Δ E (G)$ ，嵌入的分歧分数
我们可以应用这个算法来比较几个嵌入算法的分歧分数指标，选出最好的（最小的）那个

第一步：

在 G 上运行一些稳定的图聚类算法以获得顶点集 V 的分区 $\mathbf C$ ，一共产生 $l$ 个社区 $C_1, . . . C_l$ 。

此教程中使用ECG，其实任何稳定的算法都可以。

第二步：

令：

$c_i$ ：两个端点都在 $C_i$ 中的边的比例
$c_{i,j}$ ：一个端点在 $C_i$ 中且另一个端点在 $C_j$ 中的边的比例

定义：
$\overline{\mathbf{c}}=\left(c_{1,2}, \ldots, c_{1, \ell}, c_{2,3}, \ldots, c_{2, \ell}, \ldots, c_{\ell-1, \ell}\right), \hat{\mathbf{c}}=\left(c_1, \ldots, c_{\ell}\right)$
——这些向量从图 G 的角度表征分区 C，嵌入 $\mathcal E$ 不影响 $\overline{\mathbf{c}}$ 和 $\hat{\mathbf{c}}$

——接下来我们在 α 的一系列值上重复步骤 3-4

第三步：

给定 $\mathbb R_+$ ，使用 $\mathcal G(\mathbf W, \mathcal{E}, α)$ 的GCL 模型。

从这个模型，我们计算：

$b_i$ ： $C_i$ 内边的比例期望
$b_{i,j}$ ： $C_i$ 中一个端点和 $C_j$ 中另一个端点的边的比例期望

定义：
$\overline{\mathbf{b}}_{\mathcal E}(\alpha)=\left(b_{1,2}, \ldots, b_{1, \ell}, b_{2,3}, \ldots, b_{2, \ell}, \ldots, b_{\ell-1, \ell}\right), \hat{\mathbf{b}}_{\mathcal E}(\alpha)=\left(b_1, \ldots, b_{\ell}\right)$
——这些向量从嵌入 $\mathcal E$ 的角度表征分区 C

第四步：

计算 $\overline{\mathbf{c}}$ 和 $\overline{\mathbf{b}}_{\mathcal E}(\alpha)$ 之间的距离，以及 $\hat{\mathbf{c}}$ 和 $\hat{\mathbf{b}}_{\mathcal E}(\alpha)$ 之间的距离

我们使用 Jensen-Shannon 散度 (JSD)：
$\Delta_\alpha=\frac{1}{2} \cdot(J S D(\overline{\mathbf{c}}, \overline{\mathbf{b}}(\alpha))+J S D(\hat{\mathbf{c}}, \hat{\mathbf{b}}(\alpha)))$
——这是给定 α 的（分歧）分数。

第五步：

从重复的步骤 3-4，我们获得了一系列 $Δ_α$

选择 $\hat α = argmin_α ∆_α$

将分歧分数定义为：
$\Delta_{\mathcal{E}}(G)=\Delta_{\hat{\alpha}}$
总结：

为了比较同一个图 G 的多个嵌入，我们重复上面的步骤 3-5 并比较分歧分数（分数越低越好）。
步骤 1-2 只执行一次，因此我们对每个嵌入使用相同的图划分算法到 $\ell$ 个社区

示例

空手道俱乐部：找到最适合嵌入的α值
足球比赛：使用分歧分数选择最合适的嵌入算法
LFR 数据集：使用此方法选出的最好和最坏embedding算法效果

关系数据上的半监督学习

简介（转导学习）

我们使用一种转导学习（transductive learning）的方法:

没有显式地构造任何模型
学习是“基于数据”的
在图上使用正则化框架，正则化包含以下两种情况：
1. 局部结构：与稀缺标记顶点一致
2. 全局结构：所有顶点的平滑

形式化描述：

设 $G = (V, E)$ ， $∣ V ∣ = n, E \subset V \times V$

设函数 $V→\mathbb R$ ，同时定义两个函数的内积： $\left\langle f, g \right\rangle = \sum_{v \in V} f (v)g(v)$

我们定义一个函数 $f^*: V→\mathbb R$ 满足：
$f^*=argmin_{f \in H(v)}(\Omega(f)+\mu ||f - y||^2)$
- $Ω (f)$ 是一个依赖于G的泛函：平滑泛函
  
  ——取决于图的类型：无向、有向、联合链接(两者都有)
- $y$ 编码先验知识(顶点标签)
  
  ——取决于要解决的问题：
  1. 二进制分类： $y∈{−1,0,1}$
  2. 排序： $y∈{0,1}$
  3. 无监督： $y∈{0}$
- $\mu$ :平滑度(smoothness)和一致性(consistency)之间的权衡

应用-示例

给出一个包含一些“有趣”实体的大型图
求解 $f^*$ 以放大附近的顶点

最终可以：

获得未知实体的排名
能可视化关键子图
网络安全环境中的几个应用
- 异常检测
- 恶意软件检测
图和超图通常太大，不适合直接分析或可视化

无向图

图模型：

设无向图为 $G = (V, E)$ $W$ 是所有 $(u, v) \in E$ 的边权 $w (u, v)$ 的矩阵。
设D为节点度的对角线矩阵： $d(v)=\sum_{u\sim v}w(u,v)$

无监督N-cut问题：（回顾）

对于一个分割 $\cup S^c$
$\operatorname{Ncut}\left(S, S^c\right)=\frac{ Vol \partial S}{VolS }+\frac{ Vol \partial S }{VolS^c}$
其中：
$\begin{aligned} & \partial S=\left\{e \in E ;|e \cap S|=\left|e \cap S^C\right|=1\right\} \\ & \operatorname{Vol}(S)=\sum_{v \in S} d(v) \\ & \operatorname{Vol}(\partial S)=\sum_{(u, v) \in \partial S} w(u, v) \end{aligned}$
这可以被视为具有转移概率 $P = D^{−1}W$ 的随机游走：
$Ncut(S, S^c) = P(S|S^c) + P(S^c|S)$
这个问题可以通过松弛实值来解决
$f^*=\underset{f \in \mathbb{R}^n}{\operatorname{argmin}} \Omega(f) ; f \perp D^{1 / 2} \cdot 1,\|f\|^2=\operatorname{vol}(V)$
其中 $\Omega(f)=\left\langle f^t, \Delta f\right\rangle$ 且：
$\Delta=I-D^{-1 / 2} W D^{-1 / 2}$
是(归一化)图拉普拉斯矩阵

——这被称为归一化谱聚类（normalized spectral clustering）

半监督问题：

概述：

拉普拉斯矩阵也出现在半监督问题中：
如果节点接近( $w (u, v)$ 很大)，那么它们应该有相似的标签( $f (u) \approx f (v)$ )，以保持 $w(u, v)(f (u)−f (v))^2$ 较小
在整个图上，这相当于保持 $Ω (f)$ 较小
这可以看作是找到一个“平滑”函数f，它在图的密集区域中变化很小，但在稀疏区域中变化更大。

形式化描述：

现在假设顶点上有一些初始(种子)值y：
将半监督问题定义为关于图拓扑的“平滑性”和关于y的一致性之间的权衡，例如:
$f^*=\underset{f \in \mathbb{R}^n}{\operatorname{argmin}}\left(\Omega(f)+\mu\|f-y\|^2\right)$
令 $\Omega(f)=\left\langle f^t, \Delta f\right\rangle$ , 则有：
$\Omega(f)=\frac{1}{2} \sum_{(u, v) \in E} w(u, v)\left(\frac{f(u)}{\sqrt{d(u)}}-\frac{f(v)}{\sqrt{d(v)}}\right)^2$
若 $\neq 0$ , 且 $\mu>0$ ,存在一个封闭式解：
$f^*=\mu(\Delta+\mu I)^{-1} y=(1-\alpha)(I-\alpha S)^{-1} y$
其中:

$\alpha=(1+\mu)^{-1}$

$\Delta=I-D^{-1 / 2} W D^{-1 / 2}$ , 归一化图拉普拉斯矩阵

$S=I-\Delta$ , 平滑矩阵

求解：

$f^*$ 可通过多种方式获得：

迭代方法:
- 从 $f (v) = y$ 开始，
- 迭代 $f (v) \leftarrow α (S f) (v) + (1 - α) y ， \forall v$
它可以写成一个 对角占优的线性问题，其反演技术存在，且复杂度为 $O(m^{1.31})$ ，其中m为非零项的个数
通过共轭梯度法
map-reduce框架具有良好的可伸缩性

其他图

有向图

形式化描述：

定义进出节点度：
$d_{-}(v)=\sum_u w(u, v), \quad d_{+}(v)=\sum_u w(v, u)$ .
$V$ 上的然随机游走的转换概率为：
$v)=\left\{\begin{array}{cc} \frac{w(u, v)}{d^{+}(u)}, & (u, v) \in E \\ 0, & \text { else. } \end{array}\right.$
设 $\pi$ 为唯一平稳分布，即：
$\pi(v)=\sum_{u \rightarrow v} \pi(u) p(u, v) .$
这需要定义一个传送随机游走（teleporting random walk）——用于描述随机游走的概率
考虑泛函：
$\Omega(f):=\frac{1}{2} \sum_{e=(u, v)} \pi(u) p(u, v)\left(\frac{f(u)}{\sqrt{\pi(u)}}-\frac{f(v)}{\sqrt{\pi(v)}}\right)^2$
正则化问题和之前一样
$\Delta=I-S, S=\frac{\Pi^{1 / 2} P \Pi^{-1 / 2}+\Pi^{-1 / 2} P^t \Pi^{1 / 2}}{2}$
其中 $P$ 是转移概率的矩阵， $\Pi$ 平稳概率的对角矩阵。（和无向图的差别在平滑矩阵S上）
和之前一样: $f^*=(1-\alpha)(I-\alpha S)^{-1} y$ .

——这是对无向情况的推广。对于无向图，随机游走的概率是固定的：
$\pi(v)=\frac{d(v)}{\sum_u d(u)}$
——此时平滑矩阵退化为无向图情况：
$S=D^{-1 / 2} W D^{-1 / 2}$

枢纽/权威型网络

Hubs&Authorities graphs

概述：

考虑顶点 $v \in V$ 的两种可能角色:

具有高“入度”的权威(authority)
具有高“出度”的枢纽(hub)

对于有向图 $e = (u, v)$ ， u是“枢纽”，v是“权威”

平滑矩阵：

权威型：

定义节点 $u$ 和 $v$ 相对于节点 $h$ 的权威距离为：
$C_h(u, v)=\frac{w(h, u) w(h, v)}{d_{+}(h)}$
由此我们建立了平滑矩阵：
$S_A(u, v)=\sum_{h \in V} \frac{C_h(u, v)}{\sqrt{d_{-}(u) d_{-}(v)}}$
枢纽型

我们同样定义相对于节点 $a$ 的枢纽距离为：
$C_a(u, v)=\frac{w(u, a) w(v, a)}{d_{-}(a)}$
平滑矩阵：
$S_H(u, v)=\sum_{a \in V} \frac{C_a(u, v)}{\sqrt{d_{+}(u) d_{+}(v)}}$

求解模型：

令 $\Omega_A(f)=\left\langle f^t, \Delta_A f\right\rangle$ ，其中 $\Delta_A=I-S_A$ , 我们可以得到：
$\Omega_A(f)=\frac{1}{2} \sum_{u, v} \sum_h C_h(u, v)\left(\frac{f(u)}{\sqrt{d_{-}(u)}}-\frac{f(v)}{\sqrt{d_{-}(v)}}\right)^2$
对于枢纽型我们可以类似地得到 $\Omega_H(f)$ .
令：
$\Delta_\gamma=\gamma \Delta_A+(1-\gamma) \Delta_H$
我们可以像以前一样解决正则化问题：（带入平滑矩阵求解即可）
$f^*=\underset{f \in H(V)}{\operatorname{argmin}}\left(\Omega_\gamma(f)+\mu\|f-y\|^2\right)$
对于一个无向图： $\Delta_H=\Delta_A=\Delta_\gamma$ .

混合图

我们可以将平滑泛函推广为
$\Omega_{\beta, \gamma}(f)=\beta \cdot \Omega(f)+(1-\beta) \cdot \Omega_\gamma(f)$
其中 $\Omega(f)$ 基于随机游走， $\Omega_\gamma(f)$ 是“枢纽&权威”平滑

这允许3种衡量顶点“接近”的方式：

存在一条短路径
指向几个公共顶点
由几个公共顶点指向

——2和3对于无向图是一样的

超图

模型

符号说明：

对于(无向)超图，定义:

$E$ ：超边集合——超边 $e$ 为节点子集 $e \subset V$
$w (e)$ ：超边权值
$\sum_{e; V∈e} w(e)$ ：节点度
$δ (e) = ∣ e ∣ \geq 2$ ：“超边度”
$\space \text{s.t.} \space h (v, e) = 1 \space \text{iff} \space v∈e$ 关联矩阵
$W = d ia g (w (e))$ 权重矩阵，
$D_v = diag(d(V))$ 节点度矩阵，
$D_e = diag(δ(E))$ 超边度矩阵。

Ncut问题可以推广到超图：

超图体积

对于一个分割 $\cup S^c$ ，令：
$\begin{aligned} & \partial S=\left\{e \in E ; e \cap S \neq \emptyset, e \cap S^c \neq \emptyset\right\} \\ & \text { VolS }=\sum_{v \in S} d(v) \\ & \text { Vol } \partial S=\sum_{e \in \partial S} w(e) \frac{|e \cap S| \cdot\left|e \cap S^c\right|}{|e|} \end{aligned}$
——对于最后一个表达式，如果e被映射到分割的两端，分子是将被切割的“边”的数量。（就是转为普通图以后的割边数）

可以再次通过随机游走来说明:
$v)=\sum_{e \in E} \frac{w(e) h(u, e)}{d(u)} \frac{h(v, e)}{|e|}$
通过定义节点转移的平稳分布 $\frac{d(v)}{VolV} .$ 得到以下结果：
$\begin{aligned} & \frac{\text { VolS }}{\text { VoIV }}=\sum_{v \in S} \pi(v) \\ & \frac{\text { Vol}\partial \text{S }}{\text { VoIV }}=\sum_{u \in S} \sum_{v \in S^c} \pi(u) p(u, v) \end{aligned}$
超图拉普拉斯矩阵

解松弛后的问题得到与用图相同的形式，但是有
$\Delta=I-D_v^{-1 / 2} H^{\top} W D_e^{-1} H D_v^{-1 / 2}$
当所有 $∣ e ∣ = 2$ 时，有:
$\Delta=\frac{1}{2}\left(I-D_v^{-1 / 2} W D_v^{-1 / 2}\right)$
也就是拉普拉斯矩阵的一半，因此 $\Delta$ 可以定义为超图拉普拉斯矩阵
问题定义

我们定义了与图相同的半监督问题:
$f^*=\underset{f \in \mathbb{R}^n}{\operatorname{argmin}}\left(\Omega(f)+\mu\|f-y\|^2\right)$
其中:
$\Omega(f)=\langle f, \triangle f\rangle=\frac{1}{2} \sum_{e \in E} \frac{1}{\delta(e)} \sum_{(u, v) \in e} w(e)\left(\frac{f(u)}{\sqrt{d(u)}}-\frac{f(v)}{\sqrt{d(v)}}\right)^2$
以上问题的解又下式给出：
$f^*=(1-\alpha)(I-\alpha S)^{-1} y, \alpha=(1+\mu)^{-1}, S=I-\Delta$
随机游走模型1
- 从顶点u，随机选取 $u \in e$ 的超边e
- 随机选取一个顶点 $v \in e$ ，然后跳转到v
我们可以将上面的超图视为一个加权邻接矩阵为 $\tilde{A}=\left(a_{i j}\right)$ 的普通图，其中：
$a_{i j}=\sum_{e ;\left(v_i, v_j\right) \in e} \frac{w(e)}{|e|}, a_{i i}=\sum_{e ; v_i \in e} \frac{w(e)}{|e|}$
行和为：
$a_{i .}=\sum_{e ; v_i \in e} w(e)=\sum_{e \in E} w(e) h\left(e, v_i\right)=d\left(v_i\right)$
- 如果所有 $∣ e ∣ = 2$ , 我们有 $a_{i i}=\sum_{e: v_i \in e} w(e) / 2=d_i / 2$
- 而对于 $e=\left(v_i, v_j\right)$ 我们有 $a_{i j}=w(e) / 2$ , 所以
$\tilde{A}=\frac{1}{2}\left(D_V+A\right)$

其中A是这个超图的图表示的(加权)邻接矩阵

因此，对于此随机游走模型，将G视为图和将G视作超图，转导学习问题的解将有所不同

——需要进一步改进
随机游走模型2（改进）

我们定义一个新的随机游走如下:
- 从顶点u，随机选取 $u \in e$ 的超边e
- 随机选取一个顶点 $v \in e$ , $\neq u$ ，然后跳转到v
我们可以将上面的图视为一个加权邻接矩阵为 $\tilde{A}=\left(a_{i j}\right)$ 的普通图，其中：
$a_{i j}=\sum_{e ;\left(v_i, v_j\right) \in e} \frac{w(e)}{|e|-1}, \quad a_{i i}=0$
行和为：
$a_{i .}=\sum_{e ; v_i \in e} w(e)=d\left(v_i\right)$
邻接矩阵表达式为: $\tilde{A}=H^{\top} W \tilde{D}_e^{-1} H-D_v$

其中 $\tilde{D}_e$ 是对角阵，其元素为： $\frac{1}{|e|-1}$ .

在这种情况下，调整后的超图Laplacian矩阵采用以下形式:
$\Delta=I-S \text { with } S=D_v^{-1 / 2} \tilde{A} D_v^{-1 / 2}-I$
- 如果所有 $∣ e ∣ = 2$ ，我们得到 $\tilde{A}=A$ ，其中A是这个超图的图表示的(加权)邻接矩阵
有向超图的情况

我们可以推广到有向超图，其中:
$e=e_t \cup e_h \forall e \in E,\left|e_t\right|>0,\left|e_h\right|>0$
表示每个超边缘的尾部(tail)和头部(head)

向多个收件人发送电子邮件是有向超边的一个例子

分类数据（应用）

超图可以用来对分类数据建模

示例：“蘑菇数据集”(UCI ML存储库):
- 22个分类属性，23个物种的8124个观察值
- 目标：二分类——可食用或可能不可食用
- 每个分类属性建模为一个超边
  - “帽形=钟形”
  - “帽形=圆锥形”

学生作业：

用Python编写超图转导学习代码
在分类数据上验证已发表的结果——与图模型进行比较
研究权衡参数α的影响
提出并探索顶点嵌入框架

说明：

转导学习
- 颜色代表蘑菇的分类：能不能吃
- 参数α对结果值的量级有较大影响
- 排序结果基本相同
嵌入
- 顶点嵌入是一个热门话题
- 尝试从不同初始值运行TL（转导学习）过程
- 生成多维顶点表示
- 和随机游走类似

超图模块度和聚类

普通图聚类：模块度和Chung-Lu模型
超图的模块度
- 超图Chung-Lu模型
- 严格超图模块度
- 其他超图模块度
超图聚类

普通图聚类（回顾）

模块度：

我们可以把图G的划分 $\mathbf A$ 的模块度写成:
$\begin{aligned} q_G(\mathbf{A}) & =\sum_{A_i \in \mathbf{A}}\left(\frac{e_G\left(A_i\right)}{|E|}-\frac{\left(v o l\left(A_i\right)\right)^2}{4|E|^2}\right) \\ & =\frac{1}{|E|} \sum_{A_i \in \mathbf{A}}\left(e_G\left(A_i\right)-\underset{G \in \mathcal{G}}{\mathbb{E}}\left(e_G\left(A_i\right)\right)\right) \end{aligned}$
$e_G\left(A_i\right)=\left|\left\{e \in E: e \subseteq A_i\right\}\right|$ 叫做边贡献（edge contribution）——社区内的边相连的数量

$\mathbb{E}_{G \in \mathcal{G}}\left(e_G\left(A_i\right)\right)$ 叫做度税（degree tax）——社区节点相关的边在随机图的数量

Chung-Lu模型：

只需要 $O (∣ E ∣)$ 的时间复杂度，更常用
在顶点V中选择 $∣ E ∣$ 条边， $e = (u_1, u_2)$
$u_i$ 根据多项式分布从V独立采样：
$p(v_i) = deg_G(v_i)/vol(V )$
边可以重复，所以我们得到的是预期的边数而不是概率
我们将 $\mathcal{C} \mathcal{L}_2(G)$ 定义为使用模型2获得的图的分布：

其中图 $G^{'}$ 为获得的新随机图： $E')\sim\mathcal{C} \mathcal{L}_2(G)$
- 新图的度期望为：
$\mathbb{E}_{G^{\prime} \sim \mathcal{C} \mathcal{L}_2(G)}\left(\operatorname{deg}_{G^{\prime}}\left(v_i\right)\right)=\operatorname{deg}_G\left(v_i\right), 1 \leq i \leq n$
- 我们总是有 $∣ E^{'} ∣ = ∣ E ∣$
- 允许存在多条边
- 也允许有自环

——引理：图G的模块度函数中的度税是图 $E')\sim\mathcal{C} \mathcal{L}_2(G)$ 上边贡献的期望值。

我们能把这个模型推广到超图吗?

超图模块度

超图表示

背景：

存在比图更复杂的关联关系——涉及多个实体
传统图经常以两两之间的关系表示——丢失信息

超图：

超图 $H = (V, E)$ 其中 $∣ V ∣ = n$ ， $∣ E ∣ = m$
超边 $e \in E$ 其中 $e \subseteq V$ ，$ |e|≥2$
边可以有权重
我们考虑无向超图

——有些数据更适合用超图建模：电子邮件交换、跟踪主机代管、分类数据建模、数值线性代数

然而在实际操作中：

数据科学中，很少有基于超图的算法
它们通常比较慢
有些有等效的普通图表示

——问题：我们能在超图上定义模块度函数吗？

超图Chung-Lu模型

符号说明：

考虑一个超图 $H = (V, E)$ 其中节点为： $V=\left\{v_1, \ldots, v_n\right\}$ .、

超边 $\in E$ 是节点数大于1的节点集合 $V$ 的子集:
$e=\left\{\left(v, m_e(v)\right): v \in V\right\}$
$m_e(v) \in \mathbb{N} \cup\{0\}$ $e$ 中顶点 $v$ 的多重性（权值）

$|e|=\sum_v m_e(v)$ 是超边 $e$ 的大小

$\operatorname{deg}(v)=\sum_{e \in E} m_e(v)$ , 是节点的度

$\operatorname{vol}(A)=\sum_{v \in A} \operatorname{deg}(v)$ 是节点集合的体积

生成概率：

设 $F_d$ 是大小为 $d$ 的节点集的集合，即：
$F_d:=\left\{\left\{\left(v_i, m_i\right): 1 \leq i \leq n\right\}: \sum_{i=1}^n m_i=d\right\} .$
随机模型中的超图是通过独立随机实验生成的。对于每个 $d$ 使 $\left|E_d\right|>0$ ，产生 $\in F_d$ 的概率为：
$P_{\mathcal{H}}(e)=\left|E_d\right| \cdot\left(\begin{array}{c} d \\ m_1, \ldots, m_n \end{array}\right) \prod_{i=1}^n\left(\frac{\operatorname{deg}\left(v_i\right)}{\operatorname{vol}(V)}\right)^{m_i} .$
其中 $m_i=m_e\left(v_i\right)$ .

度期望：
$\begin{aligned} & \qquad \mathbb{E}_{H^{\prime} \sim \mathcal{H}}\left[\operatorname{deg}_{H^{\prime}}\left(v_i\right)\right]=\sum_{d \geq 2} \frac{d \cdot\left|E_d\right| \cdot \operatorname{deg}\left(v_i\right)}{\operatorname{vol}(V)}=\operatorname{deg}\left(v_i\right), \\ & \text { with } \operatorname{vol}(V)=\sum_{d \geq 2} d \cdot\left|E_d\right| . \end{aligned}$
——我们使用Chung-Lu模型的这种泛化（超图Chung-Lu）作为零模型(度税)来定义超图模块度

超图模块度

设 $H = (V, E)$ ， $\mathbf A = {A1，…Ak}$ ，是V的一个分区方案。对于尺寸大于2的边，可以使用几个定义来量化给定A的边贡献，例如:

一条边的所有顶点都必须属于其中一个社区——这是一个严格的定义
一条边的大多数顶点属于其中的一个社区
一条边的至少2个顶点属于同一社区——当我们用超图的2段图表示代替超图时，隐式地使用了这种方法

严格超图模块度：

$A_i \subseteq V$ 的边贡献为：
$e\left(A_i\right)=\left|\left\{e \in E ; e \subseteq A_i\right\}\right| .$
$\mathbf{A}$ 在 $\mathrm{H}$ 上的严格模块度定义为标准模块度的自然延伸，如下所示：
$q_H(\mathbf{A})=\frac{1}{|E|} \sum_{A_i \in \mathbf{A}}\left(e\left(A_i\right)-\mathbb{E}_{H^{\prime} \sim \mathcal{H}}\left[e_{H^{\prime}}\left(A_i\right)\right]\right) .$
也可以写成：
$q_H(\mathbf{A})=\frac{1}{|E|}\left(\sum_{A_i \in \mathbf{A}} e\left(A_i\right)-\sum_{d \geq 2}\left|E_d\right| \sum_{A_i \in \mathbf{A}}\left(\frac{\operatorname{vol}\left(A_i\right)}{\operatorname{vol}(V)}\right)^d\right)$
和超图Chung-Lu模型的关系：

我们将Chung-Lu模型II推广到超图上：

对于每个d，选取 $E_d|$ 个边 $e = (u_1， ..， u_d)$ ，其中每个 $u_i$ 独立地从V中采样，且 $p(v_i)∝deg(v_i)$
我们将 $\mathcal{C} \mathcal{L}_2(H)$ 定义为使用上述模型获得的超图的分布：

其中超图 $H^{'}$ 为获得的新随机图： $E')\sim\mathcal{C} \mathcal{L}_2(H)$
- 新超图的度期望为：
  $\mathbb{E}_{H^{\prime} \sim \mathcal{C} \mathcal{L}_2(H)}\left(\operatorname{deg}_{H^{\prime}}\left(v_i\right)\right)=\operatorname{deg}_H\left(v_i\right), 1 \leq i \leq n$
- 我们总是有 $E_d'|=|E_d|$
- 允许存在多条边
- 在一条边内可以有重复的顶点

——引理：超图 $H$ 的模块度函数中的度税是超图 $ H’(V, E’)\sim\mathcal{C} \mathcal{L}_2(H)$ 上边贡献的期望值。

其他超图模块度：

我们可以根据边贡献的许多自然定义来调整度税，例如多数定义

在这种情况下 $(\operatorname{vol}(A) / \operatorname{vol}(V))^d$ 改成了只要大于边内节点数的一半即可

——这相当于 $\mathbb{P}(\operatorname{Bin}(d, \operatorname{vol}(A) / \operatorname{vol}(V))=d)$ 变成了 $\mathbb{P}(\operatorname{Bin}(d, \operatorname{vol}(A) / \operatorname{vol}(V))=d / 2)$

超图划分的多数模块度函数为：
$\frac{1}{|E|}\left(\sum_{A_i \in \mathbf{A}} e\left(A_i\right)-\sum_{d \geq 2}\left|E_d\right| \sum_{A_i \in \mathbf{A}} \mathbb{P}\left(\operatorname{Bin}\left(d, \frac{\operatorname{vol}\left(A_i\right)}{\operatorname{vol}(V)}\right)>d / 2\right)\right)$
将H分解为d-uniform 超图 $H_d$ ，得到如下的度无关模块度函数：
$q_H^{D I}(\mathbf{A})=\sum_{d \geq 2} \frac{\left|E_d\right|}{|E|} q_{H_d}(\mathbf{A})$
这和以前一样，但是对于每个 $E_d| > 0$ 的d，将通过 $H$ 计算的体积替换为通过 $H_d$ 计算的体积

最后，我们可以推广模块化函数，以允许加权超边

超图聚类

概述

我们在超图上寻求一个划分 $\mathbf{A}=\left\{A_1, \ldots, A_k\right\} \in \mathcal{P}(V)$ , 使严格超图模块度 $q_H()$ 最大化.

集合 $\mathcal{P}(V)$ 对于节点集 $V$ 的所有划分来说是巨大的.

令 $\mathcal{S}(H)=\left\{H^{\prime}=\left(V, E^{\prime}\right) \mid E^{\prime} \subseteq E\right\}$ 并定义：
$\mathcal{S}(H) \rightarrow \mathcal{P}(V)$
这个函数将 $H$ 的一个子超图映射到其连通分量在 $V$ 上划分的函数.

我们定义一个等价关系：
$H_1 \equiv_p H_2 \Longleftrightarrow p\left(H_1\right)=p\left(H_2\right)$
并定义一个商集 $\mathcal{S}(H) / \equiv_p$ .

商集（quotient set）是集合论的基本概念之一，指由集合和该集合上的等价关系导出的集合。设～是非空集合A的一个等价关系，若把以A关于～的全部等价类作为元素组成一个新的集合B，则把集合B叫做A关于～的商集合，简称为商集，记作B=A/～.

定义规范表示映射：
$\mathcal{S}(H) / \equiv_p \rightarrow \mathcal{S}(H)$
它将等价类映射到类中最大的成员: $f\left(\left[H^{\prime}\right]\right)=H^*$ .

设 $\mathcal{P}^*(V)$ 是 $p$ 在正则表达式 $H^*$ 上的像（也就是输入 $H^*$ 输出的值域区间）.

我们将证明最优解在 $\mathcal{P}^*(V)$ 中，它是一个子集，规模最大为 $2^{|E|}$ .

示例

上述5节点的超图，对其进行划分， $\mathcal{P}(V)$ 共有B5 = 52种可能

而 $\mathcal{P}^*(V)$ 只有7种，远小于52中——缩小了搜索范围

证明

引理1：设 $H = (V, E)$ 为超图， $\mathbf{A}=\left\{A_1, \ldots, A_k\right\}$ 是 $V$ 的分区. 如果存在 $H^{\prime} \in \mathcal{S}(H)$ 使得 $\mathbf{A}=p\left(H^{\prime}\right)$ , 则 $q_H(\mathbf{A})$ 的边贡献为 $\frac{\left|E^*\right|}{m}$ , 其中 $E^*$ 是 $\left[H^{\prime}\right]$ 的典型代表 $H^*$ 的边集。——即部分子集超边的比例。

引理2：设 $H = (V, E)$ 是一个超图， $\mathbf A$ 是 $V$ 的任意划分。如果 $\mathbf B$ 是 $\mathbf A$ 的细化， $\mathbf B$ 的度税小于等于 $\mathbf A$ 的度税，当且仅当 $\mathbf A = \mathbf B$ 时取等号。

——我们证明了对任意分区，存在某个 $H^* \in \mathcal{P}^*(V)$ 使得 $p (H^∗)$ 是该分区的一个细化，且具有相同的边贡献。

定理：设 $H = (V, E)$ 为超图，如果 $\mathbf A∈\mathcal P(V)$ 使模块度函数 $q_H(·)$ 最大化，则 $\mathbf A∈\mathcal P^*(V)$

算法

前面的结果给出了定义启发式算法的步骤:

循环遍历 $E^{\prime} \subseteq E$ ，令 $H^{\prime}=\left(V, E^{\prime}\right)$
找到 $H^*=\left[H^{\prime}\right]=\left(V, E^*\right)$ 并计算 $q_H()$ 的边贡献
找到 $\mathbf{A}=p\left(H^*\right)$ 并计算 $q_H()$ 的度税

在 $E^{\prime} \subseteq E$ 中寻找合适组合的简单方法:

贪婪随机: 把超边随机重新排列，当 $q_H()$ 增加时，将其按顺序添加到 $E^{\prime}$ ; 重复这一操作;
类CNM: 在每一步中寻找添加到 $E^{\prime}$ 的最佳边。

Hypergraph-CNM算法：

实验

——好用吗？得到的模块度是最大模块度吗？

小demo：

建立超图，有3个社区，20个顶点，50条边，大小为2≤d≤5
添加3≤k≤60条相同大小的随机边
在k值范围内多次运行随机算法(重复25次)
对于每个k，计算平均调整兰德指数;

——结果：随着添加随机边的增加，聚类结果逐渐变差，但在随机边数小于30时，聚类效果还是OK的

合成超图：

在不同坡度的平面上沿3条线生成噪声点
添加一些随机点
选择3或4个点的集合(超边)
- 都来自同一条线(“信号”)
- 不来自同一条线(“噪声”)
采样超边，其中点对齐良好，因此预期的信号与噪声的比例为2:1

我们考虑3种不同的情况：(i)主要是3-边，(ii)主要是4-边，(iii)在3和4-边之间平衡。

在(加权)普通图上通过鲁汶聚类顶点。——我们观察到相比于普通图模块度，Hcut（不相交超边的数量）和超图模块度相关性更高

DBLP超图：

——引文网络

小型合著者超图，有1637个节点和865个大小为2到7的超边。
我们比较了鲁汶(超过2-section)和超图-cnm(严格模块化)两种算法

——与Louvain算法相比，基于超图模块度 $q_H()$ 的算法倾向于切割更少的大边，代价是切割更多的2节点边

总结：

已有工作：

超图的广义Chung-Lu模型
超图的广义模块度函数
超图聚类算法的步骤
两种简单的启发式算法：贪婪随机和超图CNM

未来工作：

更直观地理解模块化函数
更好的、可伸缩的聚类算法
真实数据集实验

你可能感兴趣的:(复杂网络夏令营,网络,拓扑学,数据挖掘)

计算机网络8832号答案,2013年4月份自考试计算机网络原理04741答案.doc
2013年4月份自考试计算机网络原理04741答案全国2013年4月高等教育自学考试计算机网络原理试题课程代码：04741请考生按规定用笔将所有试题的答案涂、写在答题纸上。选择题部分1.无线应用协议WAP的特点是A.支持手机上网B.不需要基站C.基于分组交换D.无固定路由器2.智能大厦及计算机网络的信息基础设施是A.通信自动化B.楼宇自动化C.结构化综合布线D.现代通信网络3.因特网工程特别任务组
标题：2025传统制造业护网实战指南：从合规防御到智能免疫的体系化进阶上海云盾商务经理杨杨网络
引言2025年，随着《工业互联网企业网络安全》三项国家标准全面实施，护网行动已从“合规检查”升级为“能力对抗”。传统制造业在数字化转型浪潮中，面临设备老旧、人才短缺、供应链风险激增等挑战，41.5%的企业计划年内增加安全预算。本文将结合新规要求与行业最佳实践，深度解析传统制造业如何构建“技术-管理-运营”三位一体的护网防御体系。一、传统制造业的护网困境：三大核心矛盾1.设备老旧化vs安全新标准历史
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
【HCIA】TCP三次握手、4次断开详解戏精亿点点菜 tcp/ip 网络服务器
TCP（传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议。在TCP/IP协议族中，TCP负责在两个网络实体之间建立、维护和终止连接。TCP连接的建立和终止分别通过三次握手和四次断开来完成。一、三次挥手TCP三次握手是建立TCP连接的过程，它确保了通信双方都准备好进行数据传输。过程如下：客户端->服务器:SYN,ISN=x服务器->客户端:SYN,ACK,ISN=y,ACK(x+1
Python爬虫实战：使用最新技术爬取头条新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言：Python爬虫在现代数据获取中的重要性在当今信息爆炸的时代，数据已经成为最宝贵的资源之一。作为数据获取的重要手段，网络爬虫技术在各个领域发挥着越来越重要的作用。Python凭借其简洁的语法、丰富的库生态系统和强大的社区支持，已经成为网络爬虫开发的首选语言。本文将详细介绍如何使用Python及其最新的爬虫技术来爬取头条新闻数据。我们将从基础概念讲起，逐步深入到高级技巧，最后给出完整的爬虫
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
卷积神经网络架构的演进：从AlexNet到EfficientNet t0_54manong 大数据与人工智能 cnn 架构人工智能个人开发
在过去的8.5年里，深度学习取得了飞速的进步。回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。本文将聚焦于卷积神经网络（CNN）架构的演变，深入探究其背后的基本原理。一些关键术语在深入了解各种架构之前，我们需要明确几个关键术语。更宽的网络意味着卷积层中有更多的特征图（滤波器
Docker容器技术：从入门到实践 CarlowZJ AI应用开发落地 docker 容器运维
目录摘要一、引言二、Docker的基本概念（一）容器与虚拟机（二）Docker的三大核心概念（三）Docker的优势三、Docker的安装与配置（一）安装Docker（二）配置Docker四、Docker镜像管理（一）拉取镜像（二）构建镜像（三）推送镜像五、Docker容器操作（一）启动容器（二）进入容器（三）停止和删除容器六、Docker网络配置（一）默认网络模式（二）自定义网络（三）主机模式（
数据链路层 Ragef 网络 MTU ARP
目录以太网以太网帧格式MTUMTU与IP、UDP\TCP的影响IPUDPTCPARP协议ARP工作流程ARP数据报的格式以太网"以太网"不是一种具体的网络,而是一种技术标准以太网是当前应用最广泛的局域网技术;和以太网并列的还有令牌环网,无线LAN等以太网帧格式帧格式如下图所示：目的地址：接收方的MAC地址，用于标识帧的目的地。源地址：发送方的MAC地址，用于标识帧的来源。类型：这个字段指示帧中封装
语言模型 RLHF 实践指南（一）：策略网络、价值网络与 PPO 损失函数
在使用ProximalPolicyOptimization（PPO）对语言模型进行强化学习微调（如RLHF）时，大家经常会问：策略网络的动作概率是怎么来的？价值网络的得分是如何计算的？奖励从哪里来？损失函数怎么构建？微调后的旧轨迹还能用吗？这篇文章将以语言模型强化学习微调为例，结合实际实现和数学公式，深入解析PPO的关键计算流程。1️⃣策略网络：如何计算动作概率？策略网络πθ(a∣s)\pi_\t
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
突破性能瓶颈，几个高性能Python网络框架，高效实现网络应用
引言随着互联网和大数据时代的到来，高性能网络应用的需求日益增加。Python作为一种流行的编程语言，在高性能网络编程领域也具有广泛的应用。本文将深入探讨基于Python的几种高性能网络框架，分析它们各自的优势和适用场景，帮助开发者选择最适合自己需求的网络框架这里插播一条粉丝福利，如果你正在学习Python或者有计划学习Python，想要突破自我，对未来十分迷茫的，可以点击这里获取最新的Python
Fiddler中文版如何提升API调试效率：本地化优势与开发者实战体验汇总代码背锅人日志 ios 小程序 uni-app iphone android webview https
在现代软件开发中，调试网络请求是不可或缺的一环。无论是Web前端、移动App，还是后端微服务，只要涉及到API通信，就离不开高效的抓包工具。Fiddler作为全球使用最广泛的抓包调试工具之一，凭借功能强大、灵活扩展和跨平台支持，深受开发者喜爱。而对于中文用户而言，Fiddler中文版的出现，让这款专业工具变得更加亲民、高效和易于掌握。本文将结合开发者日常使用场景，解析Fiddler中文版如何通过本
开源人工神经网络库（OpenANN） deepdata_cn 人工智能神经网络
OpenANN（OpenANN，OpenArtificialNeuralNetworkLibrary）是一个开源的人工神经网络库，基于C++编写，依赖Eigen3库进行高效的矩阵运算，使用CMake进行项目构建，支持多种神经网络架构，包括前馈神经网络、卷积神经网络和循环神经网络等，适用于图像识别、自然语言处理、时间序列预测等多种场景。提供数据预处理、模型保存和加载、超参数优化等功能。支持GPU加速
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
AI人工智能遇上TensorFlow：技术融合新趋势 AI大模型应用之禅人工智能 tensorflow python ai
AI人工智能遇上TensorFlow：技术融合新趋势关键词：人工智能、TensorFlow、深度学习、神经网络、机器学习、技术融合、AI开发摘要：本文深入探讨了人工智能技术与TensorFlow框架的融合发展趋势。我们将从基础概念出发，详细分析TensorFlow在AI领域的核心优势，包括其架构设计、算法实现和实际应用。文章包含丰富的技术细节，如神经网络原理、TensorFlow核心算法实现、数学
Python 通过IP地址查询地理位置
文章目录Python通过IP地址查询地理位置一、在线API查询（简单快速，依赖网络）1.**使用`requests`+ipinfo.io**2.**使用`requests`+ip-api.com**二、本地数据库查询（离线高效，需下载数据库）1.**使用`geoip2`+GeoLite2数据库**2.**其他本地库对比**️三、结果可视化（增强展示）使用`folium`生成交互地图⚖️四、方法选择
数字化时代练歌神器：卡拉OK点唱机应用全解析
本文还有配套的精品资源，点击获取简介：卡拉OK点唱机是一款专为音乐爱好者和练歌者设计的软件，提供网络点播、音轨分离、音调调整、评分系统、回放功能和歌词同步显示等辅助功能，帮助用户随时随地进行歌唱练习，提升演唱技巧。高级版本还提供专业音效处理功能，使得卡拉OK点唱机成为业余爱好者和专业歌手的理想训练工具。1.网络点播功能的实现与应用网络点播功能改变了我们获取媒体内容的方式，赋予了用户前所未有的主动性
Unity3D 游戏在 iOS 上因为 trampolines 闪退的原因与解决办法耳朵里有只风 ios unity unity3d ios ios闪退
崩溃的情况进入游戏一会儿，神马都不要做，双手离开手机，盯着屏幕看吧，游戏会定时从服务器那儿读取一些数据，时间一长，闪退了。尼玛问题是神马呢？完全没有头绪，不过大体猜测是因为网络请求导致的，那么好，先排查服务器返回结果是否有问题，最终确认每次客户端崩溃的时候，服务器都成功的返回了格式正确的数据，没有任何异常。那么可以确定问题是出在客户端部分了。先检查代码，确认逻辑上没有任何问题之后，也倍感无力啊，问
MAXCC可编程中控集成音频处理器功能全解析 geffen1688 中控主机 3d web3 css3 avs3
格芬MAXCC可编程中控集成音频处理器功能全解析一、技术架构与核心功能格芬MAXCC可编程中控矩阵一体机（如GF-MIXCC系列）通过高度集成化设计，将中控系统、音频矩阵、视频矩阵及环境控制功能融为一体，其音频处理能力尤为突出：音频矩阵与混音功能8进8出音频矩阵：支持Dante网络音频传输，采样率达24bit/48KHz，配备高性能A/DD/A转换器和32-bit浮点DSP处理器，确保音频信号的高
建立统一网络身份认证平台，赋能用户信息安全 Authing 网络 Authing 身份云
“近年来，层出不穷的网络谣言、网络暴力事件以及网络水军、网络黑灰产犯罪屡禁不止、屡打不绝，其主要原因是网络实名制落实不到位。”全国人大代表、黑龙江省大庆市公安局网络警察分局副局长贾晓亮接受记者采访时表示，网络信息安全问题是我们必须要面对和解决的一个严峻挑战，要加强顶层设计，实施网络可信身份战略，改进网络实名认证技术。他将一份《关于建立国家统一网络身份认证平台的建议》带上了今年全国两会。“由于网络行
快速启动静态网络服务器的Run工具使用指南闫泽华
本文还有配套的精品资源，点击获取简介：本文介绍了如何使用run工具，一个通过npm全局安装的Node.js包，来启动一个简单的静态文件服务器。介绍了npm的作用，以及如何全局安装run。随后，文章解释了run工具的用途，包括从任何目录快速启动静态网站服务器的能力，并讨论了它在开发、测试和演示中的应用。还涉及了使用run工具时涉及的一些基本任务，如处理HTTP请求和返回静态资源，以及提供了源代码文件
[AXI] AXI Interconnect
AXIInterconnectIP详细介绍概述AXIInterconnect专为AXI4、AXI3和AXI4-Lite协议设计，提供多个AXI主设备（Master）和从设备（Slave）之间的灵活互联功能。它通过模块化架构实现高效的数据路由、协议转换、数据宽度转换和时钟域转换，广泛应用于FPGA和SoC系统设计，特别是在需要复杂AXI总线互联的场景，如多核处理器系统、视频处理、网络通信和硬件加速器
Vlang编写爬虫可行性分析
最近有人问V(Vlang)语言可以用来做数据采集么，那么我在这里明确告诉你，V(Vlang)完全可以用来编写网络爬虫。虽然它主打的是系统编程语言，但其设计目标包括简洁、高效和实用性，这使得它在处理像爬虫这样的网络任务时也表现出色。V的并发模型适合高并发爬虫，但实际效果待测试。最后给出一个简单例子展示基础流程，同时指出生态限制，避免用户期望过高。个人建议如果项目复杂，可能选Python更省力，毕竟p
Python爬虫实战：研究python-nameparser库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 nameparser
1.引言在当今数字化时代，姓名作为个人身份的重要标识，在许多领域都有着广泛的应用需求。例如，在客户关系管理系统中，准确解析姓名可以帮助企业更好地了解客户背景；在学术研究中，分析作者姓名分布有助于发现研究团队的地域特征；在社交网络分析中，姓名信息可以辅助进行用户画像构建。然而，由于不同文化背景下姓名结构的多样性以及书写方式的差异，准确解析姓名成为一项具有挑战性的任务。Python作为一种功能强大的编
网络安全之如何设置云服务器禁止 ping？两种设置方法教你搞定云服务器无法ping通、ping不通云主机、Linux禁止ping、ICMP屏蔽、网络安全最佳实践 sysctl.conf配置代码简单说运维宝典限时特惠服务器 web安全 linux 服务器禁止ping 云服务器禁止ping 服务器禁止ping的方法
云主机如何设置云服务器禁止ping？两种设置方法教你搞定标签：云服务器无法ping通、ping不通云主机、Linux禁止ping、ICMP屏蔽、网络安全最佳实践、sysctl.conf配置前几天上线了一个测试服务，总有安全团队扫端口，还时不时用ping探测存活，我开始思考：云服务器到底要不要禁ping？一、禁ping的好处和坏处作为一名前端转全栈开发的程序员，我越来越觉得网络安全不能忽视。“pin
内网穿透：打破局域网壁垒，本地无公网IP也能提供互联网访问，内外网络畅联互通搬码临时工网络 tcp/ip linux
在当今数字化浪潮迅猛推进的时代，互联网技术以前所未有的速度蓬勃发展。众多机构与个人为提升服务的安全性与稳定性，纷纷将各类服务部署于内网环境之中。然而，这一举措在带来安全保障的同时，也衍生出一个亟待解决的难题——内网服务在没有公网IP时无法直接被外部网络所访问。在此背景下，像nat123这样的内网穿透技术应运而生，成为解决这一困境的关键方案。一、内网穿透：原理剖析内网穿透本质上是一种技术手段，其核心
Typecho博客搭建教程 - 保姆级
很多人都想要一个属于自己的一个小博客，但是，好不容易有了一台服务器，又不懂操作，然后一些懂的人和你讲但是你又听不懂，人家也懒得叫你，这时候你往往会陷入迷茫和困境那么，我在这里就简单的教一下萌新如何初步的去了解一些建站小知识，并且搭建一个属于自己的小博客当然大佬就勿喷，我是简单化的去讲，比较的易于理解声明：本次教程基于雨云-新一代云服务器提供商进行编写SSH认识SSH按照某知的说法，就是网络中创建安
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方