zuolixiangfisher

论文笔记《Influence Maximization in Near-Linear Time: A Martingale Approach》

原文链接

文章目录

- - 摘要
  - 1、简介
  - 2、前言
  - - 2.1 问题的定义
    - 2.2 扩散模型
    - 2.3 回顾TIM,TIM+
  - 3、提出方法
  - - 3.1 RR集的鞅视图
    - 3.2 节点选择阶段
    - 3.3 采样阶段
    - 3.4 组合到一起
  - 4、扩展
  - - 4.1 IMM的泛化
    - 4.2 应用到连续时间模型
  - 5、相关工作
  - 6、实验

原TIM,TIM+在计算OPT下界时过于保守，导致 $\theta$ 很大，仍然有很大计算量。

摘要

给定一个社交网络 $G$ 和一个正整数 $k$ ，影响最大化问题会要求 $k$ 个节点(在 $G$ 中)，采用某个想法或产品可能会触发其余节点最大预期的后续采用次数。该问题已在文献中进行了广泛研究，并且最先进的技术以 $m)\log n /\epsilon^{2})$ 的预期时间运行，并返回 $-\epsilon)$ -近似解，具有至少 $1-1/n^{l}$ 的概率。
本文提出了一种影响力最大化算法，该算法可提供与现有技术相同的最坏情况保证，但可显着提高经验效率。我们算法的核心是一套基于鞅的估计技术，鞅是经典的统计工具。这些技术不仅以较小的计算开销提供了准确的结果，而且使我们的算法能够比现有方法支持更大类别的信息扩散模型。我们使用多达14亿条边的真实社交网络，在几种流行的扩散模型下针对最新技术实验性地评估了我们的算法。我们的实验结果表明，所提出的算法在计算效率方面始终优于现有技术，并且通常快几个数量级。

1、简介

给定一个社交网络 $G$ 和一个正整数 $k$ ，影响最大化问题会要求 $k$ 个节点(在 $G$ 中)，采用某个想法或产品可能会触发其余节点最大预期的后续采用次数。这个问题源于病毒式营销，公司在社交网络中向一组有影响力的个人提供产品的免费样品，旨在通过口碑效应创造一系列产品采用。 Kempe等[25]将影响最大化描述为组合优化问题，并证明它是NP难的。作为解决方案，他们提出了一种贪心方法，该方法在几种形式的信息扩散模型下产生 $e-\epsilon)$ 近似值。从那时起，许多技术被提出用于在大型社交网络中实现有效的影响最大化。

然而，大多数现有技术要么为了实际效率而牺牲近似保证，反之亦然。特别是，提供 $1 - 1 / e - ε$ 近似解的方法通常需要几天的时间来处理具有数千个节点和边的小型社交网络。另一方面，提供经验效率的技术依赖于启发式方法，因此它们无法提供任何最坏情况下的性能保证。唯一的例外是最近有两种称为 $T I M$ 和 $T I M +$ 的技术：两种技术均以 $m)\log n /\epsilon^{2})$ 的预期时间运行，并至少以 $1-1 /n^{ℓ}$ 的概率返回 $(1 - 1 - / e - ε)$ 的近似值，其中 $n$ 和 $m$ 分别是社交网络中节点和边的数量；此外，他们的经验表现与最先进的启发式解决方案相当。

尽管 $T I M$ 和 $T I M +$ 提供了有力的理论保证和良好的实践效率，但它们在计算成本方面仍留有很大的改进空间。具体而言， $T I M$ 由两个阶段组成，即参数估计和节点选择。节点选择阶段从社交网络 $G$ 采样了 $\theta$ 个节点集，然后利用它们来推导具有较大预期影响的具有 $k$ 个节点的集合。 $\theta$ 的值至关重要：为了确保 $1 - 1 / e - ε$ 近似解，表明 θ 至少应为 $\lambda/ OPT$ ，其中OPT是任意大小为 $k$ 的节点集的最大期望影响， $\lambda$ 是关于 $k,l,n,\epsilon$ 的函数。为了得出合适的 $\theta$ ， $T I M$ 的参数估计阶段首先计算OPT的下限，然后 $\theta$ 在此下界上设置为跟 $\lambda$ 相关。这种方法虽然直观，但有两个缺陷。首先， $T I M$ 得出的下限相当保守，在最坏的情况下可能比 OPT小 $n / k$ 倍。结果， $\theta$ 可能过大，导致节点选择阶段的不必要的开销。其次，下界本身的计算成本很高，如第6节所述，得出下界所需的时间可能比节点选择所需的时间长3倍以上。

$T I M +$ 通过添加一个中间步骤（在参数估计和节点选择之间）对 $T I M$ 进行了改进，该中间步骤可启发性地将 $\theta$ 细化为更严格的OPT下限，从而提高了效率。但是，在最坏的情况下，即使改进的下限可能仍然小到 $\frac{k}{n}$ OPT。此外，添加中间步骤不能解决由节点选择阶段引起的大量开销。

贡献本文提出了一种 $I M M$ 算法，它是一种影响最大化算法，可以克服 $T I M$ 和 $T I M +$ 的不足，同时保留其优越的逼近保证和预期的时间复杂度。 $I M M$ 的核心是一套基于鞅的估计技术，鞅是一种经典的统计工具。通过这些技术， $I M M$ 采用了 $T I M$ 的两阶段范例，但是合并了完全不同的参数估计阶段，该阶段能够得出渐近严格的OPT的下限。具体地，通过 $I M M$ 将以大概率获得不小于 $OPT\cdot(1-1 / e)/(1 +\epsilon')^{2}$ 的下界，其中 $\epsilon'$ 是可调参数。另外，下限的计算得到了优化，因此与 $T I M$ 和 $T I M +$ 相比，其开销要小得多。此外，使用鞅方法可以显着改善 $I M M$ 的节点选择阶段，这有助于消除大量原本无法避免的不必要的计算。通过上述优化， $I M M$ 在实际性能方面明显优于 $T I M$ 和 $T I M +$ 。特别是，我们在多达14亿条边的各种社交网络上针对 $T I M$ 和 $T I M +$ 对IMM进行了实验评估，结果表明， $I M M$ 的运行时间比 $T I M$ 和 $T I M +$ 的运行时间缩短了两个数量级。此外，当我们将 $\epsilon$ = 0.5和 $l$ = 1设置时， $I M M$ 甚至比最新的启发式解决方案产生更高的效率，同时仍然提供经验准确的结果。
此外，我们证明了 $I M M$ 可以扩展为支持任何定义了特定采样过程的扩散模型。作为应用，我们提出了一种用于连续时间独立级联（CTIC）模型[6、16、30]的 $I M M$ 变体，该模型在机器学习文献[15、17、18]中得到了广泛采用，但不受 $T I M$ 支持。我们将我们的方法与CTIC模型下最先进的方法进行了比较，并证明了 $I M M$ 在渐近性能和实际性能上都非常优越。
总结一下：

我们提出了 $I M M$ ，影响最大化算法在 $m)\log n /\epsilon^{2})$ 预期时间中运行，并在触发模型(大多数现有工作采用的通用扩散模型)下至少以 $1-1/e-\epsilon$ 的概率返回 $(1-1/e-\epsilon)$ 的近似解(第3节)
我们研究了可以将IMM扩展到更大类别的扩散模型，同时仍保持 $1-1/e-\epsilon$ 近似比的条件。作为一个应用程序，我们提出了支持CTIC模型的 IMM 的扩展版本[16] (第4节)
我们用文献中测试过的最大的社交网络对 IMM 进行了实验评估，结果表明，它比几种流行的扩散模型的最新方法要快几个数量级(第6节)

2、前言

2.1 问题的定义

令 $G = (V, E)$ 是一个社交网络，包含 $n$ 个节点(节点集 $V$ )和 $m$ 条有向边 (边集 $E$ )，对任意的两个节点 $u,v\in V$ ， $< u, v >$ 是 $E$ 中的边，我们说 $v$ 是 $u$ 的输出节点， $u$ 是 $v$ 的输入节点。我们考虑对 $G$ 进行时间标记的扩散过程，如下所示：

在初始时刻，我们激活集合 $S$ 中的节点，并且保持激活状态
当某个节点 $u$ 在某时刻被首次激活时，根据某个特定的概率分布，从它的出邻居节点中采样一个节点集，然后在下一个时刻激活他们
一旦某个节点成为激活态，那么在接下来的所有时刻始终保持激活状态。

令 $I (S)$ 是 $G$ 根据上述过程最终收敛(直到没有新的点被激活)的激活点集合。我们令 $S$ 为种子集， $I (S)$ 为该种子集的影响力结果。注意， $I (S)$ 是一个随机变量，它取决于每个节点从其邻居采样以激活的概率分布。我们将这些概率分布的集合称为扩散过程下的扩散模型。

问题陈述 给定 $G$ ，扩散模型 $M$ 和正整数 $k$ ，影响最大化问题就是要求具有最大预期影响 $E[I(S_k)]$ 的大小为 $k$ 的节点集 $S_k$ 。

2.2 扩散模型

除非另有说明，否则我们将关注触发模型[25]，这是大多数影响力最大化的现有工作采用的经典且通用的扩散模型。为了解释触发模型，为便于说明，我们首先介绍一种特殊情况，称为独立级联（IC）[25]模型。 IC模型源自市场营销，并假设每个边 $e\in E$ 与概率 $p(e)\in [0, 1]$ 相关。对于任何节点 $u$ 及其任何输出邻居 $v$ ，如果 $u$ 首先在时刻 $i$ 处被激活，则它有 $p (⟨ u, v ⟩)$ 的概率在 $i + 1$ 时刻激活 $v$ 。 $u$ 是否可以激活 $v$ 与 $u$ 激活之前的扩散历史无关，因此，节点激活的顺序不影响扩散结果。对于这种模型，种子集S的扩散过程具有如下等效公式[25]：

我们为 $G$ 中的每个边 $e$ 掷一次硬币，并以 $1 - p (e)$ 的概率将其删除。令 $g$ 为最终的社交网络。
我们激活集合 $S$ 中的节点，同时激活 $g$ 中所有可以被 $S$ 中节点触达的点

为方便起见，我们使用 $G$ 表示由随机性引起的 $g$ 的分布，该随机性来自每个节点的触发分布的采样。

2.3 回顾TIM,TIM+

如前面提到的，TIM和TIM+有参数估计阶段和节点选择阶段，后者从 $G$ 中采样了大量的节点集来计算最大化影响力，由TIM,TIM+采样得到的集合我们称为随机 RR 集，定义如下：

定义 1 (Reverse Reachable Set) 令 $v$ 是 $V$ 中的一个节点，然后在 $G$ 中采样一个子图 $g$ ，在 $g$ 中找到所有可以触达到 $v$ 的节点，构成RR集，随机RR集是从V中随机选择的节点的RR集。

直观地，如果一个节点 $u$ 出现在另一个节点 $v$ 的RR集中，则来自包含 $u$ 的种子集的扩散过程应具有一定的激活 $v$ 的可能性。RR集与节点激活之间的这种联系在以下引理中形式化。

引理 1 对于任意种子集合 $S$ 和任意节点 $v$ ，在传播过程中， $v$ 可以被种子集 $S$ 激活的概率等于种子集 $S$ 覆盖 $v$ 的一个RR集的概率
根据引理1，TIM的节点选择阶段用如下方法做到影响力最大化，

生成独立的随机RR集的可观集 $\mathcal{R}$ 。
考虑选择 $k$ 个节点以覆盖 $\mathcal{R}$ 中最大的RR集数量的最大覆盖问题。应用标准贪心算法来获得对该问题的 $1 - 1 / e$ 近似解 $S_k^{*}$ 。
返回 $S_k^{*}$ 作为影响最大化的答案

3、提出方法

这部分将展示 IMM，一个灵感来自于 TIM和TIM+的影响力最大化技巧，但是采样了一种新的算法来降低计算复杂度，整体来讲，IMM 分为两个阶段，

采样这个阶段迭代生成随机 RR 集，添加到 $\mathcal{R}$ ，直到满足停止条件
节点选择这个阶段应用标准贪心算法来获得最大覆盖率，以得出一个大小为 $k$ 的节点集 $S_k^{∗}$ ，它覆盖了 $\mathcal{R}$ 中的大量RR集。然后返回 $S_k∗$ 作为最终结果。

节点选择部分，IMM和TIM,TIM+类似，但是TIM和TIM+要求 $\mathcal{R}$ 中所有的随机 RR集是独立的，IMM中不做此要求，特别地，由IMM生成的随机RR集是互相依赖的，因为在IMM的采样阶段，是否生成第 (i + 1) RR集取决于前 $i$ 个RR集是否满足停止条件。允许RR集之间存在这种依赖性使IMM的理论保证更加难以分析，但对IMM的效率至关重要，因为它使IMM能够消除TIM和TIM +中不可避免的大量冗余计算（请参见第3.4节）。同时，IMM的采样阶段与TIM和TIM +的参数估计阶段有很大不同，因为它采用了更高级的统计方法来确定所需的RR集的数量 $\theta$ 。相比于TIM和TIM+，这个方法不仅可以提供更准确的 $\theta$ 选择，还可以降低参数估计中的计算代价。

接下来，我们引入鞅的概念，它在分析 $\mathcal{R}$ 中 RR 集的依赖性非常重要。

3.1 RR集的鞅视图

令 $R_1,R_2,...,R_{\theta}$ 是在IMM采样阶段生成的随机 RR 集序列，令 $S$ 为 $G$ 中任意的节点集合， $x_i,i\in [1,\theta]$ 是一个随机变量，满足当 $S\cap R_i=\empty$ 时为0，否则为1。由引理1 $\mathbb{E}[I(S)]=\frac{n}{\theta}\cdot E\Big[\sum_{i=1}^{\theta}x_i\Big]\tag{1}$ 在IMM的节点选择阶段，用 $\frac{n}{\theta}\cdot\sum_{i=1}^{\theta}x_i$ 来估计 $E [I (S)]$ ，为了确保估计是准确的， $\sum_{i=1}^{\theta}x_i$ 不应该明显偏离其期望值。证明这种集中结果的经典工具是chernoff bounds，但它要求所有 $x_i$ 都是独立的，这与 IMM 采样阶段的停止条件所引起的 $x_i$ 之间的依赖性相矛盾。我们通过基于鞅的分析来规避此问题，定义如下：

定义 2 (鞅) 一个随机变量序列 $Y_1,Y_2,...$ 称为鞅，当且仅当对于任意的 $i\gt 0$ ，有 $E[Y_i]\lt +\infty$ 且 $E[Y_i|Y_1,Y_2,...,Y_{i-1}]=Y_{i-1}$ 为了说明 $x_i(i\in [1,\theta])$ 和鞅的联系，我们先介绍 IMM 采样过程中的两个性质，首先，每个 $R_i(i\in [1, θ])$ 是为随机均匀选择的节点 $v$ 生成的，它包含可以从 $G$ 采样的图 $g$ 上到达 $v$ 的节点。其次 $v, g$ 的选择跟 $R_1,R_2,...R_{i-1}$ 是独立的。由于这些性质，对 $\forall i\in[1,\theta]$ , $E[x_i|x_1,x_2,...,x_{i-1}]=E[x_i]=E[I(S)]/n$ 令 $p=E[I(S)]/n,M_i=\sum_{j=1}^{i}(x_j-p)$ ，于是我们有 $E[M_i]=0$ ，且 $E[M_i|M_1,M_2,...,M_{i-1}]=M_{i-1}$ 由定义2， $M_1,M_2,..,M_{\theta}$ 是一个鞅
以下的引理表明鞅的两个浓缩结果具有与chernoff bounds相似的感觉。
引理 2 令 $Y_1,Y_2,Y_3,...$ 是一个鞅，使得 $|Y_1|\lt a$ ，对 $\forall j\in [1,i]$ ， $|Y_j-Y_{j-1}|\lt a$ ，且 $Var[Y_1]+\sum_{j=2}^{i}Var[Y_j|Y_1,Y_2,...,Y_{j-1}]\le b$ 则对任意 $\lambda\gt 0$ $\mathrm{Pr}\Big[Y_i-E[Y_i]\ge\gamma\Big]\le \exp\Big(-\frac{\gamma^{2}}{\frac{2}{3}a\gamma+2b}\Big)$

考虑鞅 $M_1,M_2,.., M_{\theta}$ 。我们有 $|M_1|\le 1$ ，且对任意 $j\in[2,\theta]，|M_j-M_{j-1}|\le1$ ，由 $R_i(\forall i\in[1,\theta])$ 的性质，我们有 $Var[M_1]+\sum_{j=2}^{\theta}Var[M_j|M_1,M_2,...,M_{j-1}]=\sum_{j=1}^{\theta}M_j=\theta p\cdot(1-p)$ 由引理2和 $M_{\theta}=\sum_{i=1}^{\theta}(x_i-p)$ ，有以下推论：

推论 1 对任意 $\epsilon\gt0$ ，有 $\mathrm{Pr}\Big[\sum_{i=1}^{\theta}x_i-\theta p\ge\epsilon\cdot\theta p\Big]\le\exp\Big(-\frac{\epsilon^{2}}{2+\frac{2}{3}\epsilon}\cdot \theta p\Big)$
同样，用引理2到鞅 $-M_1,-M_2,..,-M_{\theta}$

推论 2 对任意 $\epsilon\gt0$ ，有 $\mathrm{Pr}\Big[\sum_{i=1}^{\theta}x_i-\theta p\le-\epsilon\cdot\theta p\Big]\le\exp\Big(-\frac{\epsilon^{2}}{2}\cdot \theta p\Big)$

3.2 节点选择阶段

令 $\mathcal{R}=\{R_1,R_2,...,R_{\theta}\}$ 是 IMM 在采样阶段生成的随机 RR 集， $F_{\mathcal{R}}(S)$ 是 $\mathcal{R}$ 中 RR集被 $S$ 覆盖的占比，算法1显示了 IMM 节点选择部分的伪代码，输入 $\mathcal{R},k$ ，输出 $S_{k}^{*}$ ，这个算法对应了影响力最大化问题的标准贪心方法，可以保证 $F_{\mathcal{R}}(S^{*})$ 是任意大小为 $k$ 的节点集对随机 RR 集 $\mathcal{R}$ 覆盖率的 $1 - 1 / e$ 倍，可以看到，当集合 $\mathcal{R}$ 中 RR 集的数量 $\theta$ 足够大的时候， $S_{k}^{*}$ 将以很大的概率得到一个 $1-1/e-\epsilon$ 的近似解。

这里在节点选择阶段，和TIM也不一样，TIM中贪心算法是以最大化覆盖RR集数量，而IMM中是以种子集对 $\mathcal{R}$ 的覆盖率为准。

假设 $S_{k}^{o}$ 是期望影响力最大的 $k$ 个种子节点的集合，即 $OPT=E[I(S_{k}^{o})]$ ，由等式 (1) 知， $n\cdot F_{\mathcal{R}}(S_{k}^{o})$ 是 $O P T$ 的无偏估计，由推论 2 知，当 $\theta$ 取适当大小时， $n\cdot F_{\mathcal{R}}(S_{k}^{o})$ 应该近似 $O P T$ ，正如下面的引理所示

引理 3 令 $\delta_1\in(0,1),\epsilon_{1}\gt 0$ 且 $\theta_1=\frac{2n\cdot\log(1/\delta_1)}{OPT\cdot\epsilon_{1}^{2}}\tag{2}$ 如果 $\theta\ge\theta_1$ ，则 $n\cdot F_{\mathcal{R}}(S_{k}^{o})\ge(1-\epsilon_1) \cdot OPT$ 至少以 $1-\delta_{1}$ 的概率成立。
假设 $n\cdot F_{\mathcal{R}}(S_{k}^{o})\ge(1-\epsilon_1) \cdot OPT$ 成立，由贪心算法的性质， $n\cdot F_{\mathcal{R}}(S_{k}^{*})\ge(1-1/e)\cdot n\cdot F_{\mathcal{R}}(S_{k}^{o})\ge (1-1/e)\cdot(1-\epsilon_1)\cdot OPT\tag{3}$ 直观地，等式 (3) 表明， $S_{k}^{*}$ 的期望影响力应该比较大，因为 $n\cdot F_{\mathcal{R}}(S_{k}^{*})$ 是 $E[I(S_{k}^{*})]$ 的示性函数，我们将这个直观的感受归纳为下面的引理

引理 4 令 $\delta_2\in(0,1),\epsilon_1\lt\epsilon$ 且 $\theta_2=\frac{(2-2/e)\cdot n\cdot \log(\binom{n}{k}/\delta_2)}{OPT\cdot(\epsilon-(1-1/e)\cdot\epsilon_{1})^{2}}$ 如果等式 (3) 成立，且 $\theta\ge\theta_2$ ，则至少有 $1-\delta_2$ 的概率有 $E[I(S_{k}^{*})]\ge (1-1/e-\epsilon)\cdot OPT$

引理 3 和引理 4 得到如下定义

定理 1 给定任意 $\epsilon_1\le\epsilon, \forall \delta_1,\delta_2\in (0,1)$ 满足 $\delta_1+\delta_2\le 1/n^{l}$ ，令 $\theta\ge\max\{\theta_1,\theta_2\}$ 确保在IMM的节点选择阶段，至少以 $1-1/n^{l}$ 的概率返回一个 $(1-1/e-\epsilon)$ 近似解。

参数化 假设 $O P T$ 是已知的，那么根据定理1，我们可以以 $1-1/n^{l}$ 的概率得到一个 $(1-1/e-\epsilon)$ 近似解。首先，我们根据定理1的条件选择 $\epsilon_1,\delta_1,\delta_2$ ，然后基于等式 (2), (4)计算 $\theta_1,\theta_2$ ，然后计算 $\theta=\max\{\theta_1,\theta_2\}$ ，最终，我们确保 $\mathcal{R}$ 中至少有 $\theta$ 个RR集。

引理 5 给定 $\epsilon,l$ ，令 $\theta^{o}$ 是定理 1中条件下 $\theta$ 的最小值，我们有 $\theta^{o}\le\theta^{*}\le\theta^{o}\cdot\frac{l\log n+\log 2}{l\log n}$

推论 3 算法1运行时间复杂度为 $O(\sum_{R\in\mathcal{R}}|R|)$

3.3 采样阶段

引理 6 令 $x\in [1, n]$ ， $\epsilon',\delta_3\in(0,1)$ ，假设我们在包含 $\theta$ 个RR集的集合 $\mathcal{R}$ 上使用算法1，其中 $\theta\ge\frac{(2+\frac{2}{3}\epsilon')\cdot(\log\binom{n}{k}+\log(1/\delta_{3}))}{\epsilon'^{2}}\cdot\frac{n}{x}\tag{8}$ 令 $S_{k}^{*}$ 是算法1的输出结果，则如果 $OPT\lt x$ ， $n\cdot F_{\mathcal{R}}(S_{k}^{*})\lt(1+\epsilon')\cdot x$ 至少以 $1-\delta_3$ 的概率成立。

3.4 组合到一起

4、扩展

4.1 IMM的泛化

4.2 应用到连续时间模型

5、相关工作

6、实验

【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
【论文笔记】GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving
原文链接：https://arxiv.org/abs/2506.00034v1简介：现有的多传感器融合方法多使用基于注意力的拉直(flatten)融合或通过几何变换的BEV融合，但前者可解释性差，后者计算开销大（如下图(a)(b)所示）。本文提出GaussianFusion（下图(c)），一种基于高斯的多传感器融合框架，用于端到端自动驾驶。使用直观而紧凑的高斯表达，聚合不同传感器的信息。具体来说，
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
Llama改进之——RoPE旋转位置编码愤怒的可乐 NLP项目实战 #LLaMA RoPE 旋转位置编码
引言旋转位置编码(RotaryPositionEmbedding,RoPE)将绝对相对位置依赖纳入自注意力机制中，以增强Transformer架构的性能。目前很火的大模型LLaMA、QWen等都应用了旋转位置编码。之前在[论文笔记]ROFORMER中对旋转位置编码的原始论文进行了解析，重点推导了旋转位置编码的公式，本文侧重实现，同时尽量简化数学上的推理，详细推理可见最后的参考文章。复数与极坐标复数
Llama改进之——均方根层归一化RMSNorm 愤怒的可乐 NLP项目实战 #llama
引言在学习完GPT2之后，从本文开始进入Llama模型系列。本文介绍Llama模型的改进之RMSNorm(均方根层归一化)。它是由RootMeanSquareLayerNormalization论文提出来的，可以参阅其论文笔记1。LayerNorm层归一化(LayerNorm)对Transformer等模型来说非常重要，它可以帮助稳定训练并提升模型收敛性。LayerNorm针对一个样本所有特征计算
论文笔记＜交通灯＞＜多智能体＞CoLight管理交通灯青椒大仙KI11 论文阅读
今天看的是论文Colight:学习网络级合作进行交通信号控制论文提出的CoLight模型是一种基于强化学习和图注意力网络的交通信号灯控制方法，旨在解决城市道路网络中的交通信号的写作问题，提升车辆通行效率。问题定义为：将交通信号控制问题建模为马尔可夫博弈，每个路口由一个智能体控制，智能体通过观察部分系统状态（当前相位和各车道车辆数），选择动作（下一时间段的相位），目标是最小化路口周围车道的平均队列长
《基于超声的深度学习模型用于降低BI-RADS 4A乳腺病变的恶性率》论文笔记 MobileNet 往事随风、、论文笔记机器学习深度学习论文阅读人工智能机器学习健康医疗
《APPLICATIONOFDEEPLEARNINGTOREDUCETHERATEOFMALIGNANCYAMONGBI-RADS4ABREASTLESIONSBASEDONULTRASONOGRAPHY》《基于超声的深度学习模型用于降低BI-RADS4A乳腺病变的恶性率》原文地址：链接文章目录摘要简介方法患者图像获取与处理深度学习模型统计分析结果讨论结论摘要本研究旨在开发一个基于超声（US）图像
论文笔记--Language Models are Unsupervised Multitask Learners Isawany 论文阅读论文阅读语言模型 transformer chatgpt 自然语言处理
论文笔记GPT-2--LanguageModelsareUnsupervisedMultitaskLearners1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1数据集WebText2.2.2分词方法3.GPT-1&GPT-24.文章亮点5.原文传送门6.References1.文章简介标题：LanguageModelsareUnsupervisedMultitaskLearners
You Only Look Once Unified, Real-Time Object Detection论文笔记 __Lo__ 目标检测论文阅读深度学习
文章结构统一检测框架(UnifiledDetection)核心思想YOLO将目标检测视为一个端到端的回归问题，输入的图像经过SingleForwardPass，直接输出物体的信息（边界框的位置、边界框的置信度、类别概率）；优势在于速度快，全局理解上下文，这里全局理解上下文的意思是识别物体和背景的关系，减少误检。网络设计网格划分（GridDivision）将图像划分为一个S×S的网格，文中S=7；共
【论文笔记】UnifiedQA：新SOTA，生成模型一统问答任务 iLuz 深度学习自然语言处理
目录引言模型介绍1.输入格式2.实验结果总结引言问答任务有多种形式，常见的有抽取式问答(EX)、摘要式问答(AB)、多选题式问答(MC)、判断式问答(YN)。一般的解决方案是针对不同形式的问答任务设计不同的模型。例如，抽取式问答、多选题式问答、判断式问答可以转化为分类任务，摘要式问答可以转换为生成任务。尽管任务形式不同，但模型所需的语义理解和推理能力是共通的，或许不需要format-special
[论文笔记] [2008] [ICML] Extracting and Composing Robust Features with Denoising Autoencoders Alexzhuan DL 神经网络机器学习
在06年以前，想要去训练一个多层的神经网络是比较困难的，主要的问题是超过两层的模型，当时没有好的策略或方法使模型优化的很好，得不到预期的效果。在06年，Hinton提出的stackedautoencoders改变了当时的情况，那时候的研究者就开始关注各种自编码模型以及相应的堆叠模型。这篇的作者提出的DAE（DenoisingAutoencoders）就是当时蛮有影响力的工作。那个时候多层模型效果得
【论文笔记】SecAlign: Defending Against Prompt Injection with Preference Optimization AustinCyy 论文笔记论文阅读
论文信息论文标题：SecAlign:DefendingAgainstPromptInjectionwithPreferenceOptimization-CCS25论文作者：SizheChen-UCBerkeley；Meta,FAIR论文链接：https://arxiv.org/abs/2410.05451代码链接：https://github.com/facebookresearch/SecAli
CLIP论文笔记：Learning Transferable Visual Models From Natural Language Supervision Q同学的nlp笔记论文阅读语言模型人工智能 nlp 自然语言处理
导语会议：ICML2021链接：https://proceedings.mlr.press/v139/radford21a/radford21a.pdf当前的计算机视觉系统通常只能识别预先设定的对象类别，这限制了它们的广泛应用。为了突破这一局限，本文探索了一种新的学习方法，即直接从图像相关的原始文本中学习。本文开发了一种简单的预训练任务，通过预测图片与其对应标题的匹配关系，从而有效地从一个包含4亿
论文笔记：Large Language Models are Zero-Shot Next LocationPredictors UQI-LIUWJ 论文笔记论文阅读语言模型人工智能
1intro下一个地点预测（NL）包括基于个体历史访问位置来预测其未来的位置。NL对于应对各种社会挑战至关重要，包括交通管理和优化、疾病传播控制以及灾害响应管理NL问题已经通过使用马尔可夫模型、基于模式的方法以及最近的深度学习（DL）技术（进行了处理。然而，这些方法并不具备地理转移能力因此，一旦这些模型在某个地理区域训练完毕，如果部署到不同的地理区域，它们将面临严重的性能下降尽管已经做出努力改善地
论文笔记：LSTPrompt: Large Language Models as Zero-Shot Time Series Forecastersby Long-Short-Term Prompt UQI-LIUWJ 论文笔记论文阅读语言模型 prompt
202402arxiv1intro1.1大模型+时间序列预测一般有两种类型的方法使用海量时间序列数据重新训练一个时间序列领域的大模型论文笔记：TimeGPT-1_timegpt论文-CSDN博客直接利用现有的大模型，设计prompt，将时间序列数据转换成大模型理解的文本，实现时间序列预测代价小+有成熟的可供使用的大模型1.2本文思路之前的方法大多集中在如何将时间序列数据转换成文本上将时间序列的数字
【论文笔记】ResNet论文的全面解析浩瀚之水_csdn #论文阅读笔记人工智能
论文：DeepResidualLearningforImageRecognition发表时间：2015发表作者：(MicrosoftResearch)He-Kaiming,Ren-Shaoqing,Sun-Jian论文链接：论文链接一、ResNet论文基本信息论文标题与发表信息论文标题：《DeepResidualLearningforImageRecognition》发表时间：2015年，并在20
论文笔记：TrafficPredict: Trajectory Prediction for Heterogeneous Traffic-Agents CvBeginner 论文笔记轨迹预测计算机视觉
论文笔记：TrafficPredict:TrajectoryPredictionforHeterogeneousTraffic-Agents摘要这是百度在AAAI2019发布的一篇文章。这篇文章提出了一种基于4D-graph的方法实现复杂场景下的轨迹预测，研究对象包含行人、机动车和自行车。实现方法本文提出了一个基于LSTM的算法，名为TrafficPredict。构建了一个4DGraph，输入是轨
论文笔记：MobileNetV2: Inverted Residuals and Linear Bottlenecks 菜鸡信息技术 Deep Learning
MobileNetV2:InvertedResidualsandLinearBottlenecksMobileNetV2是MobileNetV1的改进版，Invertedresidual是个非常精妙的设计！MobileNetV1引入depthwiseseparableconvolution代替standardconvolution，减少运算量。MobileNetV1的结构其实非常简单，是类似于VG
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 深度学习人工智能计算机视觉机器学习 transformer 论文阅读
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
Meta的AIGC视频生成模型——Emu Video 好评笔记 AIGC 深度学习人工智能机器学习 transformer 校招面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
[论文笔记] 超详细解读DeepSeek v3全论文技术报告心心喵论文笔记论文阅读
DeepSeek-V3是一个强大的专家混合（Mixture-of-Experts，MoE）语言模型，总共671B参数，每个token激活37B参数（可以理解为有多个专家，但每个token只会选择一部分专家进行推理，所以一个token的预测，只会用到37B参数），DeepSeek-V3使用了多头潜在注意力（
[论文笔记] pai-megatron qwen1.5报错心心喵论文笔记 python
Qwen1.5-0.5b-chat使用example中fintune.py报错·Issue#77·QwenLM/Qwen1.5·GitHub解决方案：transformers升级到4.37.0pipinstallsetuptools==65.5.1pipinstalltransformers==4.37.0
基于不确定性感知学习的单图像自监督3D人体网格重建（论文笔记与思考） Gamma and Beta 读博笔记算法笔记学习 3d 论文阅读
文章目录论文解决的问题提出的算法以及启发点论文解决的问题首先这是Self-Supervised3DHumanmeshrecoveryfromasingleimagewithuncertainty-awarelearning（AAAI2024）的论文笔记。该文中主要提出了一个自监督的framework用于人体的姿态恢复。主要是解决了现有的方法对大型数据集的依赖。提出的算法以及启发点论文总体的框架其实
LLM论文笔记 28: Universal length generalization with Turing Programs Zhouqi_Hua 大模型论文阅读论文阅读语言模型自然语言处理笔记人工智能
Arxiv日期：2024.10.4机构：HarvardUniversity关键词图灵机CoT长度泛化核心结论TuringPrograms的提出提出TuringPrograms，一种基于图灵机计算步骤的通用CoT策略。通过将算法任务分解为逐步的“磁带更新”（类似图灵机的读写操作），允许模型通过简单的文本复制与局部修改完成复杂计算通用性：适用于任何算法任务（加法、乘法、SGD），不依赖任务特定的数据格
LLM论文笔记 27: Looped Transformers for Length Generalization Zhouqi_Hua 大模型论文阅读论文阅读语言模型人工智能论文笔记笔记
Arxiv日期：2024.9.25关键词长度泛化transformer结构优化核心结论1.RASP-L限制transformer无法处理包含循环的任务的长度泛化2.LoopTransformer显著提升了长度泛化能力InputInjection显著提升了模型的长度泛化性能，尤其在二进制加法等复杂任务上效果显著在推理中，通过输出置信度判断迭代停止点的策略能够实现接近最佳的性能主要方法Transfor
Fast-BEV：A Fast and Strong Bird’s-Eye View Perception Baseline——论文笔记 m_buddy BEV Perception 论文阅读人工智能深度学习
参考代码：Fast-BEV一稿多投的另一篇：Fast-BEV:TowardsReal-timeOn-vehicleBird’s-EyeViewPerception1.概述介绍：这篇文章提供了一种可实际部署的BEV感知方案，能够在当今车端主流计算单元上（NvidiaOrin）实现不错的帧率。从camera到BEV的转换思想来自于M2BEV，但是对这个转换方法中使用查找表和映射方法改进，使得整体视角转
读论文笔记-Flamingo：少样本视觉语言模型 joseanne_josie 论文阅读语言模型人工智能
读论文笔记-Flamingo：少样本视觉语言模型Plomblems本文拟解决多模态机器学习中，如何将训练好的模型快速适应到少量标注数据的新任务中的问题。Motivations已有的VLM虽然能在zero-shot的场景下适应于新任务，但他们只解决了有限的使用情况（如CLIP只解决了图片分类），由于主要缺乏生成语言的能力其不能应用于开放性任务。其他的一些方法虽然研究了基于视觉的语言生成但在数据量少的
论文笔记-基于多层感知器（MLP）的多变量桥式起重机自适应安全制动与距离预测 sagima_sdu 论文阅读
《IETCyber-SystemsandRobotics》出版山东大学TenglongZhang和GuoliangLiu团队的研究成果，文章题为“AdaptiveSafeBrakingandDistancePredictionforOverheadCranesWithMultivariationUsingMLP”。摘要桥式起重机的紧急制动及其制动距离预测是其安全运行中的关键难题。本文采用多层感知器
论文笔记：How Can Large Language Models Understand Spatial-Temporal Data? UQI-LIUWJ 论文笔记论文阅读语言模型人工智能
arxiv2024011introLLM在NLP和CV领域表现出色，但将它们应用于时空预测任务仍然面临挑战，主要问题包括：数据不匹配传统的LLMs设计用于处理序列文本数据，而时空数据具有复杂的结构和动态性，这两者之间存在显著差异模型设计限制现有的时空预测方法通常需要为特定领域设计专门的模型，这限制了模型的通用性和适应性数据稀缺和泛化能力传统的时空预测方法在面对数据稀缺或稀疏的情况下表现不佳，且泛化
SentiGAN: Generating Sentimental Texts via Mixture Adversarial Networks论文笔记 catbird233 深度生成模型笔记
另一篇很好的解释：https://www.itcodemonkey.com/article/6378.html摘要在自然语言生成领域,不同情感标签的生成越来越受到人们的关注。近年来,生成性对抗网(gan)在文本生成方面取得了良好的效果。然而,gan产生的文本通常存在质量差、缺乏多样性和模式崩溃的问题。本文提出了一个新的框架--sentyan,它有多个生成器和一个多类判别器,以解决上述问题。在我们的
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。