Foliciatarier

HIT 信息隐藏基础算法整理

本文是对 HIT 课程信息隐藏技术基础中出现的诸多算法的概括性总结。

若无特殊说明，仅对灰度图像进行讨论。

在此说明，因为嵌入算法和提取算法成对存在，所以本文在介绍二者时有意模糊其先后关系，相比在当初设计算法之时二者诞生并无先后，甚至有些嵌入算法会调用提取算法作为子步骤，在仅有载体和嵌入信息为先的现实面前实在是一对有趣的矛盾。

BMP 图像和 JPEG 图像隐写

BMP 图像由位图文件头（14 字节，包含文件类型，大小，偏移字节），位图信息头（40 字节，包括图像尺寸，通道，颜色位数），彩色表（即调色板，可选）和位图数据四部分组成。

JPEG 图像压缩过程如下：
第一步，分块，一般分为 8 * 8 块
第二步，对每小块进行正向 DCT 变换（为了减少直流系数表示位数，变换前所有像素值减 128，由于结果四舍五入故不可逆）
第三步，量化，即 DCT 系数除以量化表系数（不同量化表代表不同压缩率，不可逆）
第四步，熵编码（去冗余，可逆）

JPEG 图像隐写一般在量化之后，熵编码之前。

LSB 隐写

最低有效位（Least Significant Bit，简称 LSB）隐写遵循以下原理：图像的不同位平面虽然所占空间相等，但对图像视觉效果的贡献不等。高位平面贡献大，扰动后对图像影响大；而低位平面反之。LSB 隐写在维持高位平面不变的条件下，允许以嵌入信息替代载体图像的最低比特位平面，嵌入前后对于图像每个位置的灰度值不变或差值为 1。

提取算法：对于嵌入后图像的每个像素值，取其最低比特位，即可得出嵌入信息。

嵌入算法：对于载体图像的每个像素值，将其最低比特位替换成嵌入信息的对应位即可。

例如，将信息 [1 1 0 0 0] 嵌入载体 [77 78 81 79 80] 中，将载体以二进制表示为 [01001101 01001110 01010001 01001111 01010000]，以信息替换最低位得 [01001101 01001111 01010000 01001110 01010000]，转回十进制得 [77 79 80 78 80]。

单从提取算法来看，对于上面的例子，你可以给出其它不同的结果，如 [77 77 82 78 80]，这个结果与载体在每个位置的灰度值差值至多为 1，这意味着这个结果在视觉效果上与标准 LSB 隐写得出的结果不相上下，并且也可以提取出嵌入信息。关于这部分内容的讨论在下文随机翻转嵌入隐写中。

Jsteg 隐写

Jsteg 隐写是将 LSB 隐写扩展到 JPEG 格式图片的一种隐写算法。由于载体为 DCT 系数矩阵，故对于负数看作其绝对值进行处理。由于 DCT 系数矩阵中长串 0 保证压缩效率，故对于 0 及会被替换成 0 的 1 和 -1，Jsteg 隐写均跳过。其余按绝对值下的 LSB 隐写规则，并保证嵌入前后正负号相同，DCT 矩阵每个系数不变或差值为 1。

提取算法：对于嵌入后图像的每个 DCT 系数，如果不是 1, 0, -1 中的一个，则取其绝对值的最低比特位，即可得出嵌入信息。

嵌入算法：对于载体图像的每个 DCT 系数，如果是 1, 0, -1 中的一个则跳过，否则按 LSB 隐写对其绝对值嵌入，而后补上嵌入前的正负号。

例如，将信息 [0 0 1 1 0] 嵌入 DCT 系数矩阵
$\begin{bmatrix} 97 & 0 & -1 & -1 & 0 & 0 & 0 & 0 \\ -3 & -2 & 4 & 0 & 0 & 0 & 0 & 0 \\ -2 & -1 & 0 & 0 & 0 & 0 & 0 & 0 \\ -1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{bmatrix}$
具体来说就是 0 嵌入 97 得 96，0 嵌入 -3 得 -2，1 嵌入 -2 得 -3，1 嵌入 4 得 5，0 嵌入 -2 得 -2，最终结果
$\begin{bmatrix} 96 & 0 & -1 & -1 & \cdots \\ -2 & -3 & 5 & 0 & \cdots \\ -2 & -1 & 0 & 0 & \cdots \\ -1 & 0 & 0 & 0 & \cdots \\ \vdots & \vdots & \vdots & \vdots & \ddots \end{bmatrix}$
（注：JPG 格式中 DCT 系数矩阵以 Z 字形存储，故一般也以 Z 字形顺序隐写，这里为了说明方便而采用逐行顺序隐写）

将负数看作补码再以 LSB 隐写也是一种变体，这样可以对 -1 隐写增大嵌入率，在此不表。

F3 隐写

F3 隐写相对 Jsteg 隐写将 1 和 -1 也进行嵌入，增大了嵌入率，同时不再依赖传统的 LSB 隐写。嵌入后 DCT 矩阵每个系数或者不变，或者与嵌入前相比绝对值小 1。

提取算法：对于嵌入后图像的每个 DCT 系数，如果不是 0，则取其绝对值的最低比特位，即可得出嵌入信息。

嵌入算法：对于载体图像的每个 DCT 系数，如果是 0 则跳过，如果当前系数 LSB 与待嵌信息位相同则不变，不同则取绝对值减 1，而后补上嵌入前的正负号。特别的，当当前系数为 1 或 -1 且待嵌信息位为 0 时，将其归 0 并视作无效嵌入，下一位仍嵌入 0。

例如，对于上文 Jsteg 中的例子，第一位 0 嵌入 97 得 96，第二位 0 嵌入 -1 得 0 无效，第二位 0 嵌入 -1 得 0 无效，第二位 0 嵌入 -3 得 -2，第三位 1 嵌入 -2 得 -1，第四位 1 嵌入 4 得 3，第五位 0 嵌入 -2 得 -2，最终结果
$\begin{bmatrix} 96 & 0 & 0 & 0 & \cdots \\ -2 & -1 & 3 & 0 & \cdots \\ -2 & -1 & 0 & 0 & \cdots \\ -1 & 0 & 0 & 0 & \cdots \\ \vdots & \vdots & \vdots & \vdots & \ddots \end{bmatrix}$

可以发现，对载体 2 嵌入信息 1，LSB 隐写和 Jsteg 隐写的结果为 3，而 F3 隐写的结果为 1。这种不遵循 LSB 隐写规则的结果之一是使得针对 LSB 的隐写分析技术对其收效甚微。

基于视觉特性的隐写

BPCS 隐写

位平面复杂度分割（Bit-Plane Complexity Segmentation，简称 BPCS）隐写遵循以下原理：图像中各个大小相等的区域虽然所占空间相等，但人眼对其的敏感程度不同，图像像素值变化越剧烈，嵌入信息前后人眼视觉对其变化越不敏感。相对于 LSB 隐写而言，BPCS 隐写中信息不再局限于最低比特位构成的位平面，而可以嵌入多个位平面，扩大了容量。不仅是空间域，小波压缩域等变换域亦可应用。

由于其过于复杂，基本不会在大题出现。

为了衡量位平面块复杂度，定义一个位平面块复杂度为所有值不同的像素对的数量（包括上下相邻的和左右相邻的），对于 8 * 8 块，最大值 $C_{max} = 2 * 7 * 8 = 112$ 。注意这里是取某个位平面计算，所以像素值只能取 0 或 1。

提取算法：
第一步，将嵌入后图像的每个位平面分块，一般分为 8 * 8 块，计算每个位平面块的复杂度 $C^{'}$ 。
第二步，取 $a < 0.5$ ，对于每个位平面块，若其复杂度 $C' > aC_{max}$ 则提取信息；否则跳过。
第三步，提取记录经过共轭处理的块信息的位平面块信息。
第四步，对于第二步提取信息的位平面块，若记录得出经过共轭处理的则再共轭一次后提取，否则直接提取。

嵌入算法：
第一步，同提取算法第一步，得出每个位平面的复杂度 $C$ 。
第二步，取与提取算法相同的 $a$ ，对于每个位平面块，若其复杂度 $C > aC_{max}$ 则嵌入信息；否则跳过，不嵌入信息。
第三步，将嵌入信息构成同样大小的块，计算其复杂度 $C^{'}$ ，若 $C' > aC_{max}$ ，则直接替换原位平面；否则共轭处理再替换。
第四步，记录经过共轭处理的块信息（位置，位平面），将其作为信息嵌入载体中。

以 8 * 8 块为例，所谓共轭处理，即将位平面块每个元素分别与
$\begin{bmatrix} 0 & 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 & 0 & 1 & 0 & 1 \\ 1 & 0 & 1 & 0 & 1 & 0 & 1 & 0 \end{bmatrix}$
块中对应元素异或，得到位平面块的共轭块。由于在原位平面块值相同的相邻像素对，共轭后值不同，反之亦然，故若原平面块复杂度为 $C$ ，则共轭后平面块复杂度为 $C_{max} - C$ 。

其中，参数 $a$ 越大，嵌入率越低，安全性越好。若 $\geq 0.5$ ，则对于复杂度 $\in [(1 - a)C_{max}, aC_{max}]$ 的嵌入信息块，无论其本身还是共轭后复杂度都低于 $aC_{max}$ ，就算强行嵌入后提取时也会跳过，最终得到缺失的嵌入信息。不过，实际工程中 $a$ 可以取大于 $0.5$ 的值，不过需要特殊的技巧，在此不表。

PVD 隐写

像素值差异（Pixel-Value Differencing，简称 PVD）隐写不再关注像素值本身，而是着眼于相邻像素值间的差值，依赖差值嵌入信息。

提取算法：
第一步，将亮度范围 $[0, 255]$ 分为 $K$ 个区域 $R_k (k \in [0, K-1])$ ，每个区域宽度均为 2 的整数幂，记每个区域的上界，下界和宽度分别为 $l_k, u_k, w_k$ ，以下均以 $[0, 7], [8, 15], [16, 31], [32, 63], [64, 127], [128, 255]$ 六个区域的划分为例
第二步，将嵌入后图像分成不相交的像素对 $(p'_0, p'_1), \cdots, (p'_i, p'_{i+1}), \cdots$ ，对于每个像素对 $p'_i, p'_{i+1})$ ，计算灰度差值 $d' = p'_{i+1} - p'_i$
第三步，判断 $\left| d' \right|$ 所处区域 $R_k$ ，即若 $\left| d' \right| \in [l_k, u_k]$ ，则计算 $\left| d' \right| - l_k$ 的二进制形式即为嵌入信息，长度为 $log_2 w_k$

嵌入算法：
第一步，同提取算法第一步
第二步，同提取算法第二步划分方式，将载体图像分成不相交的像素对 $(p_0, p_1), \cdots, (p_i, p_{i+1}), \cdots$ ，对于每个像素对 $p_i, p_{i+1})$ ，计算灰度差值 $d = p_{i+1} - p_i$
第三步，判断 $\left| d \right|$ 所处区域 $R_k$ ，即若 $\left| d \right| \in [l_k, u_k]$ ，则将嵌入信息 $log_2 w_k$ 个比特位转化为数 $b$ ，并计算
$\begin{cases} l_k + b & d \geq 0 \\ -(l_k + b) & d < 0 \end{cases}$
第四步，计算嵌入后像素值
$r_c = \lceil \frac{d' - d}2 \rceil , r_f = \lfloor \frac{d' - d}2 \rfloor \\ (p'_i, p'_{i+1}) = f[(p_i, p_{i+1}), d'] = \begin{cases} (p_i - r_c, p_{i+1} + r_f) & d \ mod \ 2 = 1 \\ (p_i - r_f, p_{i+1} + r_c) & d \ mod \ 2 = 0 \end{cases}$
（这个公式的结果可能会不在 $[0, 255]$ 区间内，遇到这种情况要整体偏移）

例如，将信息 [1 1 1 0 1 0 1] 嵌入载体 [105 113 118 101] 中。
计算 $\left| d \right| \in [8, 15]$ ，嵌入 3 位 [1 1 1]，得 $b = 7, d' = 8 + 7 = 15, d' - d = 7, r_c = 4, r_f = 3$ ，由 $d$ 为偶数，用公式 $p_i - r_f, p_{i+1} + r_c)$ 得 (102, 117)；
计算 $\left| d \right| \in [16, 31]$ ，嵌入 4 位 [0 1 0 1]，得 $b = 5, d' = -(16 + 5) = -21, d' - d = -4, r_c = r_f = -2$ ，由 $d$ 为奇数，用公式 $p_i - r_c, p_{i+1} + r_f)$ 得 (120, 99)；
结果 [102 117 120 99]。

接下来的内容纯属笔者一家之言，读者可略过，直至调色板图像隐写部分。

上面的公式看起来十分麻烦，这里来分情况讨论。当 d 与 d’ 奇偶性相同，即 d’ - d 结果为偶数时， $r_c - r_f = 0$ ，上面两个公式结果相同。当 d 与 d’ 奇偶性相反，即 d’ - d 结果为奇数时， $r_c - r_f = 1$ ，上面两个公式结果不同。但为何要有两个公式呢？

笔者在这里给出一个数学上自洽的解释，定义像素值中点 $\frac{p_i + p_{i+1}}2, m' = \frac{p'_i + p'_{i+1}}2$ ，则无论是两个公式的任一个，都能保证 $\left| m' - m \right| \leq 0.5$ ，即保证直流系数基本不变，达到在整体灰度上令人眼无法察觉的效果。下面想象一种操作，其为重复使用 PVD 隐写对同一像素对进行嵌入（先不论该操作是否有意义），其结果自然为后嵌入的信息覆盖前嵌入的，虽然每次嵌入都能保证 $\left| m' - m \right| \leq 0.5$ ，但若只使用单一公式，如相对下方的公式 $p_i - r_f, p_{i+1} + r_c)$ ，则由 $\frac{r_c - r_f}2$ ，像素值中点必然只增不减，最终累积造成直流系数视觉上无法忽视的巨大偏移。而两个公式均使用的情况下，若某次使用了下方公式造成了中点 $0.5$ 的增大，则像素值的差 $d$ 必然由偶数变成了奇数，若中点不偏移则差 $d$ 不改变奇偶性，那么下次造成偏移时必然是上方公式造成中点 $0.5$ 的减小而且差 $d$ 由奇数变为偶数，巧妙地化解了偏移。这样无论隐写多少次，结果的像素值中点 $m$ 与最初像素值中点 $m_0$ 都满足关系 $\left| m - m_0 \right| \leq 0.5$ ，保证了直流系数一定程度的不变性。

以上的解释看似完美，实际上却忽略了两个问题。第一，由于结果可能会超出区间 $[0, 255]$ 而进行整体偏移操作无疑会不可逆地改变像素值中点，从而对直流系数产生不可估量的影响；第二，也是最本质的问题，PVD 隐写只需对每个像素对进行一次修改，不存在也不需要多次操作。下面笔者将给出个不太完美但更合理的解释。由于整个载体图像有很多个这样的像素对，只使用单一公式会使得整个图像的直流系数产生累积偏移。而从概率的角度来说，使用两个公式的概率是相等的，可以在统计学上保证约有一半偏移是加 $0.5$ ，一半偏移是减 $0.5$ ，从而保证整个图像的直流系数基本不变。至于结果超出区间引起的整体偏移，由于概率很小可以忽略不计。这个解释的问题在于，一旦引入了概率，整个问题就玄乎其玄了起来，似乎就不太像是能在这里讨论完的内容了。

调色板图像隐写

调色板图像均指彩色图像（灰度图像谈调色板无意义），反之不然（彩色图像亦可为 BMP 或 JPEG 图像）。

Gifshuffle

Gifshuffle 算法不改变图像本身，而是通过改变调色板中颜色与索引间的对应关系传递信息，类似密码本的方法。理论上，颜色数为 $M$ 的调色板图像按 Gifshuffle 算法可容纳 $\lfloor \log_2(M!) \rfloor$ 比特信息。

由于其性质特殊，基本不会在大题出现。

EZStego 隐写

提取算法：将调色板中颜色按亮度排序得到索引值，对于嵌入后图像的每个像素，取其亮度索引值的最低比特位，即可得出嵌入信息。

嵌入算法：将调色板中颜色按亮度排序得到索引值，对于载体图像按亮度索引值进行 LSB 隐写即可。

隐写分析

由于隐写分析算法计算复杂，均基本不会在大题出现。

$\chi^2$ 隐写分析

$\chi^2$ 隐写分析基于以下原理：设嵌入信息后图像灰度值为 j 的像素数为 $h_j$ ，若信息完全替代最低位平面，由于信息经过压缩去冗余，则 $h_{2i}$ 和 $h_{2i+1}$ 的值会比较接近，而未经密写的图像 $h_{2i}$ 和 $h_{2i+1}$ 的值会相差较远。由于 LSB 隐写不改变 $h_{2i} + h_{2i+1}$ ，故令
$h_{2i}^* = \frac{h_{2i} + h_{2i+1}}2$
则 $h_{2i}^*$ 值在隐写前后不变，于是：
$\sum_{i = 1}^k \frac{(h_{2i} - h_{2i}^*)^2}{h_{2i}^*}$
服从 $\chi^2$ 分布，其中 $k$ 为 $h_{2i}$ 和 $h_{2i+1}$ 所组成数对的数量。

RS 隐写分析

RS 隐写分析分以下几步：
第一步，分块，一般分为 8 * 8 块，计算每个小图像块的像素相关性。
第二步，对每个小图像块进行非负翻转和非正翻转。
第三步，计算翻转后每个小图像块的像素相关性，判断是否增大或减小。

像素相关性计算：将小图像块所有像素按 Z 字形顺序排列成向量 $(x_1, x_2, \cdots, x_n)$ ( $n$ 表示像素个数，分成 8 * 8 块时为 64， $x_i$ 表示像素值)，定义像素相关性函数
$f(x_1, x_2, \cdots, x_n) = \sum_{i = 1}^{n - 1} |x_i - x_{i-1}|$

将非负翻转后像素相关性增大的图像块比例记为 $R_m$ ，像素相关性减小的图像块比例记为 $S_m$ ；
将非正翻转后像素相关性增大的图像块比例记为 $R_{-m}$ ，像素相关性减小的图像块比例记为 $S_{-m}$ 。
若图像未经 LSB 隐写，则满足 $R_m \approx R_{-m}, S_m \approx S_{-m}$ 且 $R_m > S_m, R_{-m} > S_{-m}$ ；
随着隐写率上升， $R_{-m}$ 和 $S_m$ 增大， $R_m$ 和 $S_{-m}$ 减小，并始终满足 $R_{-m} > (R_m, S_m) > S_{-m}$ ， $R_m$ 和 $S_m$ 相比大小取决于嵌入信息和载体图像。

F3 隐写分析

简单来说，若 JPEG 图像未经 F3 隐写，则 DCT 系数分布直方图服从 Laplace 分布，否则不服从。

抗隐写分析的隐写

由于直方图补偿隐写（针对 $\chi^2$ 隐写分析）过于宏观，随机翻转嵌入隐写（针对 RS 隐写分析）本质随机化，F5 隐写（针对 F3 隐写分析）高度数学化，均基本不会在大题以实例出现。

直方图补偿隐写

直方图补偿隐写基于 LSB 隐写将载体分为隐写部分与补偿部分，补偿部分不嵌入信息，而是保证将灰度直方图恢复至嵌入前的水平，从而抗隐写分析。设 $f_i$ 为原始图像灰度值为 $i$ 的像素数目， $\alpha$ 为信息嵌入率，不妨设 $f_{2i} > f_{2i+1}$ ，由于嵌入后隐写部分灰度值为 $2 i$ 和 $2 i + 1$ 的像素值数量相等，故有不等式
$\alpha)f_{2i+1} \geq \frac{\alpha}{2}(f_{2i} - f_{2i+1})$
不等式右项表示隐写部分从灰度值 $2 i$ 变成 $2 i + 1$ 的像素数量，左项表示补偿部分从灰度值 $2 i + 1$ 变成 $2 i$ 的像素数量。整理得
$\alpha \leq \frac{2f_{2i+1}}{f_{2i} + f_{2i+1}}$

随机翻转嵌入隐写

提取算法：同 LSB 隐写的提取。

嵌入算法：基本同 LSB 隐写的嵌入，当当前位需要改变且像素值不为 0 或 255 时随机选择 +1 或 -1。

F5 隐写

F5 隐写算法使用混洗技术与矩阵编码技术，混洗技术即打乱 DCT 系数顺序，使得嵌入信息分散于整个载体中；而矩阵编码技术保证了 F5 算法在使用 $2^k-1$ 个载体数据嵌入 $k$ bit 信息时，至多改变其中一个载体数据。

提取算法：将嵌入后图像数据的最低比特位编号 $a_1, a_2, \cdots, a_{2^k-1}$ ，对于 $\in [0, k-1], y_i = \oplus_{j \ Bitwise \ AND \ 2^i = 2^i} a_j$ ，其中 $\oplus$ 表示异或，这里由于参数不定故采用前缀表示， $\ AND$ 表示按位与，条件 $j \ Bitwise \ AND \ 2^i = 2^i$ 表示 $j$ 二进制下权值为 $2^i$ 的二进制位为 1。这样得出 $y_0, y_1, \cdots, y_{k-1}$ 即为嵌入信息。

嵌入算法：将载体图像数据的最低比特位编号 $a_1, a_2, \cdots, a_{2^k-1}$ ，将嵌入信息编号 $x_0, x_1, \cdots, x_{k-1}$ ，对载体本身用提取算法得出序列 $b_0, b_1, \cdots, b_{k-1}$ ，对于 $\in [0, k-1], c_i = x_i \oplus b_i$ ，这样得出序列 $c_0, c_1, \cdots, c_{k-1}$ ，再由 $\sum_{i \in [0, k-1]} c_i * 2^i$ 得出 $c$ ，修改载体数据 $a_c$ 的值（即最低比特位取反）即嵌入完成，当 $c = 0$ 时无需修改即完成嵌入。

例如：将信息 [0 1] 嵌入载体 [123 124 125] 中，由
$c_0 = x_0 \oplus a_1 \oplus a_3 = 0 \oplus 1 \oplus 1 = 0 \\ c_1 = x_1 \oplus a_2 \oplus a_3 = 1 \oplus 0 \oplus 1 = 0$
得出 c = 0，无需修改，结果 [123 124 125]。

例如：将信息 [1 0 1] 嵌入载体 [13 17 16 16 19 21 20] 中，由
$c_0 = x_0 \oplus a_1 \oplus a_3 \oplus a_5 \oplus a_7 = 1 \oplus 1 \oplus 0 \oplus 1 \oplus 0 = 1 \\ c_1 = x_1 \oplus a_2 \oplus a_3 \oplus a_6 \oplus a_7 = 0 \oplus 1 \oplus 0 \oplus 1 \oplus 0 = 0 \\ c_2 = x_2 \oplus a_4 \oplus a_5 \oplus a_6 \oplus a_7 = 1 \oplus 0 \oplus 1 \oplus 1 \oplus 0 = 1$
得出 $c = 2 * (2 * (0 + c_2) + c_1) + c_0 = 5$ ，修改 19 为 18，结果 [13 17 16 16 18 21 20]。

数字水印

以下仅讨论基于单伪随机序列的扩频技术数字水印嵌入。

数字水印嵌入遵循以下公式
$(\alpha b - \lambda s')w \\ s' = \frac1N \sum_{i = 1}^N X_i w_i$
其中 $X^{'}$ 表示含水印图像， $X$ 表示原始图像， $\alpha$ 表示嵌入强度， $b$ 表示水印信息， $\lambda$ 一般取 1， $w$ 表示扩频序列， $s^{'}$ 表示原始图像与扩频序列的相关性， $N$ 表示扩频序列长度。以上公式保证提取水印信息时四舍五入后得到的值为 $\alpha b$ 。

由于其为本门课重点，一定会在大题出现。

提取算法：取含水印图像像素值向量与 1 的扩频序列向量点乘，结果大于 0 则水印信息为 1，否则为 -1。

嵌入算法：利用以上公式计算即可。

例如，水印信息 [-1 1 -1 1]，扩频序列 1 -> [1 -1 -1 1]，-1 -> [-1 1 1 -1]， $\alpha = 4$ ，原始图像像素值
$\begin{bmatrix} 139 & 144 & 149 & 153 & 155 & 155 & 155 & 155 \\ 144 & 151 & 153 & 156 & 159 & 156 & 156 & 156 \end{bmatrix}$
计算含水印图像像素值。

解答如下，确定 $w$ = [1 -1 -1 1]，算出相关性系数 $s^{'}$ 分别为 -1/4, 0, -1, 3/4，分别得出
[139 144 149 153] + -4 [1 -1 -1 1] = [135 148 153 149]
[155 155 155 155] + 4 [1 -1 -1 1] = [159 151 151 159]
[144 151 153 156] + -3 [1 -1 -1 1] = [141 154 156 153]
[159 156 156 156] + 3 [1 -1 -1 1] = [162 153 153 159]
结果
$\begin{bmatrix} 135 & 148 & 153 & 149 & 159 & 151 & 151 & 159 \\ 141 & 154 & 156 & 153 & 162 & 153 & 153 & 159 \end{bmatrix}$

还有另一种思路， $w$ 依据水印信息而定，如上例，在 [139 144 149 153] 中嵌入水印 -1，令 $w$ 为 -1 的扩频序列 [-1 1 1 -1]，得出相关性系数 $s^{'}$ = 1/4，于是 [139 144 149 153] + (4 * |-1| - 1/4)[-1 1 1 -1] = [135 148 153 149]。整个过程中需注意 $b$ 取绝对值再代入计算，这点与上面思路不同。如果 $b$ 不取绝对值，那么在 [155 155 155 155] 嵌入水印 -1 得 [155 155 155 155] + (4 * -1)[-1 1 1 -1] = [159 151 151 159]，与嵌入水印 1 结果相同，这显然是错误的。

不论何种思路，计算相关性时的扩频序列和计算嵌入水印后像素值向量的扩频序列一定要相同，不能出现一者固定另一者随水印信息变化的情况，否则无法保证提取水印信息时四舍五入后得到的值为 $\alpha b$ 。

直方图平移可逆水印

嵌入算法：统计图像像素灰度值得出直方图，判断峰值点 $a$ 和零点 $b$ （若不存在零点则此算法失效），不妨设 $a < b$ ，对于灰度值为 $i$ 的像素，若 $\in (a, b)$ ，将其灰度值修改为 $i + 1$ ，这样零点变成 $a + 1$ ，便可在灰度值为 $a$ 的像素中嵌入信息（选峰值点是为了嵌入更多信息），若最低比特位不同则改为 $a + 1$ 即可。这样保证嵌入前后对于图像每个像素灰度值差值至多为 1。

提取算法：嵌入的逆过程， $a$ 和 $b$ 的值需额外传递。

由于其在期末考试中出现，故列之于此。隐写及水印算法多以提取较嵌入简单，故本文大多先介绍提取算法后介绍嵌入算法，而此算法例外。

Kafka 压缩算法详细介绍王多鱼的梦想～ kafka 分布式运维 apache
文章目录一、Kafka压缩算法概述二、Kafka压缩的作用2.1降低网络带宽消耗2.2提高Kafka生产者和消费者吞吐量2.3减少Kafka磁盘存储占用2.4减少KafkaBroker负载2.5降低跨数据中心同步成本三、Kafka压缩的原理3.1Kafka压缩的基本原理3.2.Kafka压缩的工作流程3.3Kafka压缩的数据存储格式四、Kafka压缩方式配置4.1Kafka生产者（Produce
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
Java并发CAS中的ABA问题 fragrans Java Java 并发编程 CAS ABA
1.ABA产生的原因CAS会导致“ABA问题”。CAS算法实现一个重要前提需要取出内存中某时刻的数据并在当下时刻比较并替换，那么在这个时间差类会导致数据的变化。比如说一个线程1从内存位置V中取出A，这时候另一个线程2也从内存中取出A，并且线程2进行了一些操作将值变成了B，然后线程2又将V位置的数据变成了A，这时候线程1进行CAS操作发现内存中仍然是A，然后线程1操作成功。只关注开始和结尾，不关心中
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
留学生scratch计算机haskell函数ocaml编程ruby语言prolog作业VB matlabgoodboy ruby 开发语言后端
您列出了一系列编程语言和技术，这些可能是您在留学期间需要学习或完成作业的内容。以下是对每个项目的简要说明和它们可能涉及的领域或用途：Scratch：Scratch是一种图形化编程语言，专为儿童和初学者设计，用于教授编程基础概念。它通过拖拽代码块来创建程序，非常适合学习算法、逻辑和基本的编程概念。计算机（科学）：这是一个广泛的领域，涉及计算机硬件、软件、算法、数据结构、网络安全等多个方面。留学生可能
代码随想录算法训练营第三十九天-动态规划-337. 打家劫舍 III taoyong001 算法动态规划 c++leetcode
老师讲这是树形dp的入门题目解题思路是以二叉树的遍历（递归三部曲）再结合动规五部曲dp数组如何定义：只需要定义一个二个元素的数组，dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历：使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti
使用OpenSSL库接口，实现AES CBC加密，基于X509 base64编码证书的RSA非对称加密例子 GavinFj C语言相关工作学习总结算法数据安全
RSA加密的填充方式安全不一样，RSA算法PKCS1填充方式没有OAEP填充方式安全；同样的AES选择CBC模式更加安全。网上看了好多例子，都没有使用X509base64编码证书的RSAOAEP填充方式加密。研究记录下RSA、AES的加密，以供参考。话不多说，直接上demo。/*************************************************************
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
【AI中数学-数理统计-综合实例-包括python实现】揭开数据的面纱：真实样本数据的探索与可视化云博士的AI课堂 AI中的数学人工智能 python 数理统计数据预处理数据探索数据可视化机器学习
第五章：数理统计-综合实例1.揭开数据的面纱：真实样本数据的探索与可视化在人工智能（AI）应用中，数据是构建算法和模型的基石，而数理统计则为我们提供了理解和处理这些数据的工具。数据探索和可视化是数理统计中至关重要的步骤，它们不仅能帮助我们理解数据的分布、关系和趋势，还能够为后续的建模工作提供依据。本节将通过五个实际案例，展示如何使用数理统计和可视化技术对真实样本数据进行探索。每个案例都包括具体的描
数据结构与算法之排序: LeetCode 1356. 根据数字二进制下 1 的数目排序 (Ts版) Wang's Blog Data Structure and Algorithms 动态规划 leetcode 算法
根据数字二进制下1的数目排序https://leetcode.cn/problems/sort-integers-by-the-number-of-1-bits/description/描述给你一个整数数组arr。请你将数组中的元素按照其二进制表示中数字1的数目升序排序如果存在多个数字二进制中1的数目相同，则必须将它们按照数值大小升序排列请你返回排序后的数组示例1输入：arr=[0,1,2,3,4
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模旅游 2025美赛 2025年数学建模美赛 python代码 matlab 可持续旅游管理
目录代码框架：遗传算法优化可持续旅游模型python代码代码解析：matlab代码代码解析：代码框架：遗传算法优化可持续旅游模型python代码importnumpyasnpimportrandomimportmatplotlib.pyplotasplt#定义遗传算法的参数POP_SIZE=100#种群大小GENS=500#迭代代数MUTATION_RATE=0.01#变异率CROSSOVER_R
Python 实现文本摘要功能热爱技术的小胡 python
互联网时代信息爆炸式增长，人们面对越来越多的信息无法一一阅读，而文本自动摘要技术可以一定程度上缓解这个问题。摘要就是一篇文章的核心部分信息，文本自动摘要技术分抽取式摘要和生成式摘要，前者是在原文中挑选一定比例的句子拼凑成一个摘要，后者更接近人为的总结式简写一篇文章。目前越来越多的研究者使用深度神经网络来研究生成式摘要技术，但是难度也挺大，效果有限。本文的方法是使用基于启发式规则的算法实现了一个抽取
区块链学习资料 sunchenzl 区块链学习资料
本文列举了关于区块链和数字加密技术的文章和资源，分为以下几个部分：构建区块和基础；基础（和历史）；关键概念——包括特定课题（例如区块链治理）；隐私和安全；扩展；共识算法、加密货币经济和投资；资金筹集和通证分布；去中心化交易所；稳定货币；加密货币经济原生产品（数字加密收藏品、管理市场、游戏）。最后，文章还提供了开发者教程、实践教程和人物事迹，以及其他资源，例如时事新闻和课程。干货满满哦！1、构建区块
快手NS sig3签名算法（2025年1月） sh_moranliunian 蜘蛛侠网络爬虫后端 python 爬虫算法
kuaishou/__NS_sig3.js源码见文章最后。python中调用示例importjsonimportsysimportrequestsimportosimportexecjsimporthashlibimportdatetimefromCookieUtilimportCookieUtilfromfake_useragentimportUserAgentnormal_js=execjs.
bkcrack安装 x0da6h 网络安全
bkcrack是一款破解密码算法工具在ctf中主要用于破解压缩包密码本文主要介绍它的下载、安装方法先从github获取资源，windows中安装bkcrack还需要额外安装VC++的Redistributablegitclonehttps://github.com/kimci86/bkcrack.git然后配置cmake工具，需要用到cmake手动构建brack的项目代码pipinstallcma
【IMU Kalman滤波器】9轴IMU传感器（加速度计、陀螺仪、磁力计）的卡尔曼滤波器算法研究（Matlab代码实现）然哥爱编程算法 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、引言二、9轴IMU传感器原理及误差分析三、卡尔曼滤波器算法四、实验与结果分析五、结论与展望2运行结果3参考文献4Matlab代码、数据⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努
CVPR‘24开源 | ADA-Track：端到端3D多目标跟踪最新SOTA！计算机视觉工坊 3D视觉从入门到精通 3d 目标跟踪人工智能
编辑：计算机视觉工坊添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
数据结构与算法课后题整理（三）ミッタン数据结构算法
第三章1.(2分)串是任意有限个（）。A.符号构成的集合B.符号构成的序列C.字符构成的集合D.字符构成的序列2.(2分)串是一种特殊的线性表，其特殊性体现在（）。A.可以顺序存储B.数据元素是一个字符C.可以链式存储D.数据元素可以是多个字符3.(2分)两个串相等必有串长度相等且（）。A.串的各位置字符任意B.串中各位置字符均对应相等C.两个串含有相同的字符D.两个串所含字符任意4.(2分)设有
数据结构与算法课后题整理（四）ミッタン数据结构算法二叉树
1.(2分)具有10个叶结点的二叉树中有（）个度为2的结点。A.9B.10C.8D.112.(2分)一棵完全二叉树上有1001个结点，其中叶子结点的个数是(）。A.250B.501C.505D.2543.一棵二叉树高度为h（只有根结点时的高度为1）,所有结点的度或为0，或为2，则这棵二叉树最少有（）个结点。A.2hB.h+1C.2h+1D.2h-14.高度为K（只有根结点时的高度为1）的二叉树最大
Python实现复原毫米波雷达呼吸波形的示例 go5463158465 python 算法机器学习 python 开发语言
以下是一个使用Python实现复原毫米波雷达呼吸波形的示例，该示例将涉及模型算法在重建损失和KL（Kullback-Leibler）损失之间的平衡问题。我们将使用深度学习中的变分自编码器（VAE）作为模型来进行呼吸波形的复原，因为VAE可以很好地处理重建和潜在空间分布的问题。步骤概述数据准备：生成或加载毫米波雷达的呼吸波形数据。定义VAE模型：包括编码器和解码器。定义损失函数：结合重建损失和KL损
大数据技术在数据安全治理中的应用罗思付之技术屋综合技术探讨及方案专栏大数据
摘要面对新形势下的数据安全治理挑战，顺应数据安全领域的技术发展趋势，针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题，提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素，并可从多个角度衡量不同含义的权重影响力，识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题，提出一种基于生成对抗网络的用户与实体行为异常检测方法，实验结果表明，所提方法
阶乘的六种实现代码 ← Python hnjzsyjyj Python程序设计 Python 阶乘
阶乘是一个常见的数学概念。一个正整数n的阶乘是所有小于等于n的正整数的乘积。阶乘通常用符号n!来表示。其中n是一个正整数。【算法代码一：for循环】deffac(n):p=1foriinrange(1,n+1):p=p*ireturnpx=eval(input())print(fac(x))【算法代码二：while循环】Python中没有++和--这两个运算符。deffac(n):i=1p=1wh
代码随想录算法训练营第五十九天| 503.下一个更大元素II、42. 接雨水 Joanna-升代码随想录训练营算法 leetcode 数据结构
代码随想录算法训练营第五十九天|503.下一个更大元素II、42.接雨水503.下一个更大元素II解题代码42.接雨水解题代码503.下一个更大元素II题目链接：503.下一个更大元素II解题代码funcnextGreaterElements(nums[]int)[]int{length:=len(nums)result:=make([]int,length,length)fori:=0;i0&&
LeetCode-第一题 Joanna-升 LeetCode解题篇 leetcode c语言
LeetCode1.求两数之和开篇心得题目复述思考历程解题代码（C语言）结题结语开篇心得刷算法题一直是一件在计划中的事情，从未接触C语言时就拥有这样的冲动，直到现在学完数据结构，才有了略为正式的开始。之前从没有接触过算法题的训练，也深知自己几斤几两，所以博客里可能会有很多不成熟的、不正确的想法和观点，十分欢迎混圈的大神们赐教，但更多的还是想记录自己青涩的成长之路。叨叨半天的废话，下面还是开始进入正
如何使用深度学习中的 Transformer 算法进行视频目标检测 go5463158465 python 算法深度学习 python 开发语言
以下将介绍如何使用深度学习中的Transformer算法进行视频目标检测，并给出一个复现相关论文思路及示例代码。这里以DETR（End-to-EndObjectDetectionwithTransformers）为基础进行说明，它是将Transformer引入目标检测领域的经典论文。步骤概述环境准备：安装必要的库，如PyTorch、torchvision等。数据准备：使用公开的视频目标检测数据集，
数据结构---数组与链表 GOV_D 数据结构数据结构
文章目录一、数组二、链表三、数组和链表的选择四、链表的基本使用和算法一、数组数组的特点1.在内存中，数组是一块连续的区域2.数组需要预留空间，在使用前需要提前申请所占内存的大小，不知道需要多大的空间，可能会浪费内存空间，即数组空间利用率低3.在数组起始位置处，插入数据和删除数据效率低。插入数据时，待插入位置的的元素和它后面的所有元素都需要向后搬移删除数据时，待删除位置后面的所有元素都需要向前搬移4
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
模型架构选择：从传统NLP到Transformer AI天才研究院 AI大模型应用入门实战与进阶大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
模型架构选择：从传统NLP到Transformer关键词：自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预训练模型文章目录模型架构选择：从传统NLP到Transformer1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1传统NLP模型3.1.2RNN模型3.1.
基于matlab的GPS信号捕获仿真 Simuworld MATLAB仿真案例 matlab GPS信号捕获
目录1.算法概述2.仿真效果3.MATLAB仿真源码1.算法概述全球定位系统gps是一种可以在全球范围内为用户全天候提供实时、连续、高精度的位置、速度和时间信息的卫星导航系统，其主要终端设备是gps接收机。gps信号捕获是gps接收机的关键技术之一，它直接影响着后续对信号的跟踪和定位数据的解算，决定着接收机的性能。现有的gps接收机c/a码捕获方法主要有两种：一种是基于时域的串行搜索捕获法，该方法
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

HIT 信息隐藏基础 算法整理