rtygbwwwerr

神经网络可视化（Visualization of Neural Network ）

神经网络可视化和可解释性（Visualization and Explanation of Neural Network ）

相对于传统的ML模型，Deep NN由于其自身所特有的多层非线性的结构而导致难以对其工作原理进行透彻的理解。比如，我们很难理解网络将一个输入x判断为某一类别c时，其输入向量x中的每一个特征分别对这个结果贡献了多大，找出哪些输入特征起到了关键作用，这对判断网络是否正常工作是很重要的。尤其在NLP领域，由于现在大多数模型的输入都是稠密的Embedding向量，而每一个维度上的值并没有一个显式的含义，这就使得我们很难像图像领域那样，直接可视化CNN中的filters，分析网络所学习到的特征。

文章目录

神经网络可视化和可解释性（Visualization and Explanation of Neural Network ）

1.现有的方法

1.1 Interpreting Models
1.2 Explaining decisions

2. SA & Decomposition

2.1 SA
2.2 Decomposition
2.2.1 LRP Framework
2.2.2 Deep Taylor Decomposition

3.如何评估
4. NLP中的应用
5. Keras 开源框架innvestigate分析

5.1 框架执行流程图
5.2 Z-Rule
5.3 $W^2$-rule
5.4 alpha-beta rule
5.5 Embedding pooling

6.更进一步的思考

1.现有的方法

现有的网络解释思路大致可以分为两大类：模型解释（Interpreting Models）和决策解释（Explaining Decision）

1.1 Interpreting Models

这类方法的主要解释手段是：
a. find prototypical example of a category
找到一个类别的典型样本，比如1-10的手写字体图片分类，对于类别1, 我们的目的就是找到最能代表数字1的样本，即找到使分类函数f(x)输出值最大的x。
b. find pattern maximizing activity of a neuron
找到能够最大化激活神经元的pattern，以上边的例子来说，即找到能够最大化激活网络的pixel空间组合方式（比如在手写数字识别任务中，CNN模型的高层filter里边，通常每个pattern对应于一个模糊的数字，如：“1”）
这一类的方法倾向于得到一个整体上的（ensemble）的结论，即找出某个数字（比如“1”）最常见的图片模式应该是怎样

1.2 Explaining decisions

a.“why” does the model arrive at this particular prediction
试图解释为什么模型能够做出这样的预测，比如，为啥将一张图片分类为数字“1”而不是其它
b.verify that model behaves as expected
验证模型是否按期望运行，以上边的例子来说，当模型将一个输入x预测为“1”时，起主要作用的特征（pixels）应该是组成数字“1”的附近的pixels
在这一思路下，大致有两类方法：Sensitivity Analysis(SA)和Decomposition。

2. SA & Decomposition

为了说明方便,我们先定义几个符号:
神经网络分类函数: $f (x)$
输入向量: $x$
对于最终生成的heatmapping $\boldsymbol{R(x)}=\{R_p(x)\}$ ,
接下来，再定义如下性质:

1. Conservative, 即 $\forall x: f(x)=\sum_p R_p(x)$

这里粗体的 $\boldsymbol{R(x)}$ 表示整个heatmapping的元素集合(可以看做一个向量, 其对应的输入 $\boldsymbol{x}$ 也是一个向量), $R_p(x)$ 表示heatmapping上的第 $p$ 个元素, 也称为Relevance, 对应输入向量中的一个分量 $x_p$ . Conservative 确保在向后传播时, 每层所有神经元对应的Relevance之和能够始终等于最终分类的预测值. 最终 $\boldsymbol{R(x)}$ 将以图片的形式展示出来，这就是所谓的Visualization了。

2. Positive, 即 $\forall x, p: R_p(x)≥0$

这个性质确保heatmapping中的元素不存在相互矛盾的对象, 即某些元素是与最终结果正相关, 某些元素是负相关.这样做的好处是可以简化最终的relevance分布.

最后,同时具备1和2的, 我们就称之为"一致的"( $c o n s i s t e n t$ ), 需要注意的是， $c o n s i s t e n t$ 对于heatmapping虽然不是一个硬性的要求, 但满足一致性条件的heatmapping将具备一系列优良的性质，因此我们的方法要尽可能的符合 $c o n s i s t e n t$ 约束。

2.1 SA

SA方法,主要原理是通过输入x对输出y的影响程度来对x的每一个特征(分量)进行打分, 通过对打分进行可视化,最终将形成一张heatmapping.而打分的方法, 使用非常符合直觉的梯度, 即:
$R_p(x)= (\partial f / \partial x_p )^2$
$∴\boldsymbol{R(x)}=\|\nabla_{\!\boldsymbol{x}} f (\boldsymbol{x})\|^2$
有时，为了区分出positive和negative的影响，可以去掉平方运算：
$R_p(x)= (\partial f / \partial x_p )$
SA方法的优点是实现容易，很符合直观感受，但缺点也很明显：输出的heatmap只是反映了增加（或减小）对应输入位置的值对预测结果的影响，并未直接反映出该点输入值本身对结果的影响。e.g. 当前位置梯度 $R_p>0$ ，而对应的输入 $x_p<0$

2.2 Decomposition

2.2.1 LRP Framework

从字面上看，Decomposition就是分解，这种方法的本质也是将最终输出的Relevance进行分解再向上传递。该怎么分解呢?我们先看下图的DNN网络结构:

在上图所示的网络中，最终输出出值为 $f (x)$ , 显然，对于输出层而言，其Relevance就为： $R_f=f(x)$
那么第 $l$ 层的第 $i$ 个节点的Relevance $R_i^{(l)}$ 应该为什么呢？首先根据性质2，每层所有节点的Relevance之和应该相等：
$\sum_d R_d^{(1)} = \sum_k R_k^{(2)} =...=\sum_i R_i^{(l)}=\sum_j R_j^{(l+1)}=...=R_f$
我们可以把Relevance看做一种沿着网络连线流动的信息，其流动方向为输出节点到输入节点，其值总和为 $R_f$ . 那么我们可以参考反向传播的思想，将网络结构倒过来（上图右），沿着节点间的子路径将Relevance逐层分解，比如从层 $\rightarrow 5$ , 这里我们始终假设 $i$ 代表低层神经元的序号， $j$ 代表高层神经元的序号:
$R^{(5, 6)}_{i \leftarrow j} = factor_{ij}^{(5,6)} \cdot R^{(6)}_j$
其中 $factor_{ij}$ 表示分配因子,是一个介于[0,1]之间的数, 并满足:
$\sum_i factor_{ij}^{(5,6)} = 1$
对于任意一个上层神经元, 其输入 $z^{(l)}_j = W^{(l)}_j a^{(l-1)}$ , 其中 $a^{(l-1)}$ 为低层神经元的激活输出向量. 上层单元j的最终输出为 $\sigma(z^{(l)}_j)$ . 由于神经元的激活函数通常为单调递增函数，所以，输入值越大，那么对应的激活值也就越大。因此 $z^{(l)}_j$ 的每个分量 $z^{(l)}_{ij}$ 可以看做是每个下层单元 $i$ 与上层单元 $j$ 之间的Relevance分配因子, 由于还需要满足归一化的约束, 我们可以对其除以一个归一化参数 $z^{(l)}_j$ :
$factor_{ij} = \frac {z^{(l)}_{ij}} {z^{(l)}_j} = \frac {w^{(l)}_{ij} a_i^{(l-1)}} {\sum_i w^{(l)}_{ij} a_i^{(l-1)}}$
回到上边的例子:
$R^{(5, 6)}_{i \leftarrow j} = factor_{ij}^{(5,6)} \cdot R^{(6)}_j =\frac {w^{(6)}_{ij} a_i^{(5)}} {\sum_i w^{(6)}_{ij} a_i^{(5)}} \cdot R^{(6)}_j$
写成更一般化的形式:
$R^{(l-1, l)}_{i \leftarrow j} = factor_{ij}^{(l-1, l)} \cdot R^{(l)}_j =\frac {w^{(l)}_{ij} a_i^{(l-1)}} {\sum_{i'} w^{(l)}_{i'j} a_{i'}^{(l-1)}} \cdot R^{(l)}_j$
将 $l - 1$ 替换成 $l$ ， $l$ 替换成 $l + 1$ ，并按下标 $j$ 求和，即得第 $i$ 个单元的Relevance：
$R^{(l)}_{i} =\sum_j R^{(l, l+1)}_{i \leftarrow j}=\sum_j \frac {w^{(l+1)}_{ij} a_i^{(l)}} {\sum_{i'} w^{(l+1)}_{i'j} a_{i'}^{(l)}} \cdot R^{(l+1)}_j..............................(1)$
上边即为通用的LRP(Layer-Wise Relevance Propagation)框架的基本公式（z-rule）, 注意到这个framework的公式中没有求导运算,所以它的适用范围很广, 并不需要分析对象可导。在LRP框架下派生出了多种规则，比如 $\alpha \beta-rule, z^+$ ,我们接下来再讲讲 $\alpha \beta-rule$ 。
在很多情况下，我们需要知道Relevance的符号，即需要heatmap能够标识出input中哪些features对预测结果起促进作用，哪些起抑制作用。于是 $\alpha \beta-rule$ 应运而生了，我们首先要做的是将上边的(1)式进行拆解，重新写为大于0和小于0的两部分加权和的形式， $\alpha$ 即为大于0部分的权值， $\beta$ 为小于0部分的权值：
$R^{(l)}_{i} =\alpha (R^{(l)}_{i})^+ + \beta (R^{(l)}_{i})^-=[\alpha \frac {(z^{(l)}_{ij})^+} {(z^{(l)}_j)^+} + \beta \frac {(z^{(l)}_{ij})^-} {(z^{(l)}_j)^-}] \cdot R^{(l+1)}_j$
通过调整 $\alpha \beta$ 的值，我们可以灵活的指定正负Relevance显示的权重。比较常用的参数配置是 $\alpha=1，\beta=0$ 此时heatmap中只显示正Relevance（ $z^+-rule // LRP-α_1 \beta_0$ ）。

2.2.2 Deep Taylor Decomposition

除了这种方法之外,还有其它decomposition方法吗? 答案就是Deep Taylor Decomposition，这其实是可以将Taylor Decomposition和LRP结合起来的一种方法，主要动机是使用逐层拆解的方式解决Deep network函数过于复杂，整体求导难的问题。如果我们把任意一个神经元看做是一个函数 $f (x)$ ，其相邻的低层每个神经元的输出看做是函数 $f (x)$ 的输入向量即 $x$ , 根据 $T a y l o r$ 公式：
$f(\tilde{x}) + f'(\tilde{x})(x-\tilde{x}) + \epsilon≈f(\tilde{x}) + f'(\tilde{x})(x-\tilde{x})$

其中， $\epsilon$ 为高阶项。注意其中的x为多维的输入向量，那么f(x)其实就是一个多元函数，其在某一点上的导数值就为各个分量上的偏导值之和，因此我们就可以将Relevance从最后一层的 $R_f$ 往上逐层分解。以最后一层为例上式可以写成如下形式：
$R_f=f(\tilde{x}) +\sum_k \frac{\partial f(\tilde{x})}{\partial x_k}(x_k - \tilde{x}_k)$
令 $R_a = f(\tilde{x}), R_d=\sum_k \frac{\partial f(\tilde{x})}{\partial x_k}(x_k - \tilde{x}_k)$ 有：
$R_f=R^{(6)}_a + R^{(6)}_d$
显然 $R_d$ 可以自然的分解为低层每个节点的relevance之和，即：
$R^{(6)}_d =\sum_k R^{(5)}_{dk}$
因此，我们可以很自然的得出低层（第 $5$ 层）节点的relevance：
$R^{(5)}_{k} =R^{(5)}_{ak} + R^{(5)}_{dk} =R^{(5)}_{ak} + \frac{\partial f(\tilde{x})}{\partial x_k}(x_k - \tilde{x}_k) ..............................(2)$
看到这里，大家会想， $R_d$ 的问题是解决了，那前边这个 $R_a$ 怎么分解？或者这个 $R_a=f(\tilde{x}) =0$ 就更好了，这样我们只需要计算导数和 $x$ 变化值的乘积即可。这里的关键在于，我需要找出这样的一个特殊的点 $\tilde{x}$ ，即函数的0点。这里我们先把 $f(\tilde{x})$ 展开， W的下标表示高层的神经元的序号，由于最后一层只有一个神经元，所以这里为1：
$f(\tilde{x})=\sigma(\boldsymbol{W^{(6)}_1\tilde{x}}^{(5)}+b^{(6)})$
假设网络的激活函数为Relu，则有：
$f(\tilde{x})=max(\boldsymbol{W^{(6)}_1\tilde{x}}^{(5)}+b^{(6)}, 0)$
要找到0点，本质上就等于解线性方程组：
$\boldsymbol{W^{(6)}_1\tilde{x}}^{(5)}+b^{(6)}= 0$

显然，这个方程的解集是一个超平面。我们可以来看一个二维的例子：
假设 $\tilde{x} = [x, y], b = -1$ , 我们有： $x - y - 1 = 0$

上图左侧为平面 $z = x - y - 1$ , 右侧为其与平面 $z = 0$ 的交集，即方程的解集(超平面)： $x - y - 1 = 0$

显然，在上边的情形下， $\tilde{x}$ 将有无数个，该取哪一个呢？我们先假设从样本点 $x$ 开始，沿方向v按步长t开始搜索（注意下标 $k$ 表示向量的一个分量,粗体的符号均为向量）结合 $R_{ak}=0$ 的假设，我们可得到下边的约束方程组：
$\begin{cases} \boldsymbol{\tilde{x}} = \boldsymbol{x} - t \boldsymbol{v} , \\ R_{a}=f(\tilde{x})=\boldsymbol{W_1^{(6)}\tilde{x}}+b^{(6)}=0 \\ \end{cases}$
将上边的第一个约束代入第二个：
$\boldsymbol{W_1^{(6)}}(\boldsymbol{x} - t \boldsymbol{v})+b^{(6)}=0$
即：
$\boldsymbol{W_1^{(6)}} \boldsymbol{x}+b^{(6)}=\boldsymbol{W_1^{(6)}} \boldsymbol{v} t$
可以求出 $\frac{\boldsymbol{W_1^{(6)}} \boldsymbol{x}+b^{(6)}}{\boldsymbol{W_1^{(6)}} \boldsymbol{v} }$

我们先把 $\sigma=Relu，R_{ak}=0$ 的假设带入(2)：
$R^{(5)}_{k} =\frac{\partial f(\tilde{x})}{\partial x_k}(x_k - \tilde{x}_k)= w^{(6)}_k (x_k - \tilde{x}_k)$
将上边求出的t（是一个标量值）及 $\tilde{x}_k=x_k - t v_k$ 带入上式，得：
$R^{(5)}_{k} =w^{(6)}_k (x_k - \tilde{x}_k)=w^{(6)}_k v_k \cdot t=w^{(6)}_k v_k \cdot \frac{\boldsymbol{W_1^{(6)}} \boldsymbol{x}+b^{(6)}}{\boldsymbol{W_1^{(6)}} \boldsymbol{v} }$
即为：
$R^{(5)}_{k} = \frac{w^{(6)}_k v_k}{\sum_k w_{k1}^{(6)} v_{k1}} \cdot (\boldsymbol{W_1^{(6)}} \boldsymbol{x}+b^{(6)})$
按上边的假设，所有的神经元激活函数都是Relu，所以对最后一层一样有：
$R^{(6)}_1 = \boldsymbol{W_1^{(6)}} \boldsymbol{x}+b^{(6)}$
带入上式得：
$R^{(5)}_{k} = \frac{w^{(6)}_k v_k}{\sum_k w_{k1}^{(6)} v_{k1}} \cdot R^{(6)}_1$
使用 $i$ 表示低层网络神经元的下标， $j$ 表示高层网络神经元的下标， $l$ 表示层序号，则上式可以写成更一般的形式：
$R^{(l, l+1)}_{i \leftarrow j} = \frac{w^{(l+1)}_{ij} v_{ij}}{\sum_{i'} w_{i'j}^{(l+1)} v_{i'j}} \cdot R^{(l+1)}_j$
通过上式，我们可以算出单个链接上的Relevance，如果要求出 $l$ 层第 $i$ 个节点的Relevance总和，只需要将所有上层对应链接上的值相加即可：
$R^{(l)}_{i} = \sum_j R^{(l, l+1)}_{i \leftarrow j}= \sum_j \frac{w^{(l+1)}_{ij} v_{ij}}{\sum_{i'} w_{i'j}^{(l+1)} v_{i'j}} \cdot R^{(l+1)}_j..............................(3)$
接下来我们需要确定的就是搜索方向向量 $\boldsymbol{v}$ 。Taylor逼近中，最后还有一个省略掉的高阶项 $\epsilon$ , 它是随着 $|x-\tilde{x}|$ 的增大而增大的，也即是说，我们找到的点应该尽可能的靠近 $x$ ，这样才能保证逼近值的精度。所以一个直观的想法是，我们只要沿着函数的梯度方向进行搜索，就能找到一个最近的解，按照Relu函数的定义，其梯度即为权值向量 $\boldsymbol{W}_j$ , 代入(3)，我们就得到了 $w^2-Rule$ 的公式：
$R^{(l)}_{i} = \sum_j \frac{(w^{(l+1)}_{ij} )^2}{\sum_{i'} (w_{i'j}^{(l+1)})^2 } \cdot R^{(l+1)}_j..............................(4)$

我们把(1)和(3)对比一下，可以看到出这两个式子长得非常相似，唯一的差别就是与w相乘的值，一个取的是神经元的激活值 $a$ , 另一个是方向 $v$ 。两者之间是否有某种联系呢？其实（1）可以看做是 $v = a$ 的一种特殊情况，即沿着上层输出向量 $x_i$ 与原点连线方向移动（即在线段 $0, x_i)$ 上搜索）。

3.如何评估

怎么评估visualization生成的heatmap质量呢？我们知道heatmap代表了输入x的重要程度，屏蔽掉 $x$ 中影响越大的点对分类函数 $f (x)$ 的输出带来的影响也越大。一种直观的想法是，我们通过对heatmap中的位置按重要程度降序排列并取前L个元素，得到一个序列 $O=[r_1, r_2,...,r_L]$ ，依次对这些位置的数据点通过函数 $g(x, r_k)$ 进行扰动（比如屏蔽或替换等）

将得到一个 $x$ 的序列： $X_{MoRF}=[x^{(1)}_{MoRF}, x^{(2)}_{MoRF}, ..., x^{(L)}_{MoRF}]$ , 我们只需要计算替换前后f(x)值的变化即可：

其中 $\langle \rangle _{p_(x)}$ 表示按分布p(x)求期望，这里就是对所有测试样本求均值。需要注意的是，在NLP任务中，我们的扰动函数 $g$ 进行的操作为屏蔽，即将操作位置 $r_k$ 对应的字符替换为空字符（仍然占位），其对应embedding 向量为全0向量：

帮	我	来	一首	刘德华	的	歌
1	2	3	4	5	6	7

执行 $g(x, r_1)$ 后，结果为：

[BLANK]	我	来	一首	刘德华	的	歌
1	2	3	4	5	6	7

AOPC值越大，说明heatmap的质量越高。另外，L可以根据实际输入x的长度灵活选择，如果输入句子普遍较少，L可取1~3.

4. NLP中的应用

在NLP中我们有时需要对模型的预测进行分析，即判断哪些输入term对分类结果造成主要影响。如果是RNN，我们可以使用Attention的方式很方便的实现Visualization，但如果是CNN呢？有了LRP我们同样可以很方便的实现针对输入term的定性分析，需要注意的是，原始的keras实现代码是针对图像场景的，并没有考虑NLP中Embedding Layer不可导的问题，直接使用会报错，这里有修改后的版本。
整个框架的使用非常简单，首先参考github上的方法安装：

注意：model即待分析的keras模型，emb_model为基于gensim的词向量矩阵对象，inputs为输入文本的onehot矩阵

def make_drawer(shape, zoom_factor=1):

    array = np.ndarray((shape[0] * zoom_factor, shape[1] * zoom_factor, 3), np.uint8)
    #set background RGB
    array[:, :, 0] = 255
    array[:, :, 1] = 255
    array[:, :, 2] = 255
 
    image = Image.fromarray(array)
 
    draw = ImageDraw.Draw(image)
    return draw, image
    
def analysis_model(model, emb_model, inputs):
    #visualization
    import innvestigate
    import innvestigate.utils.visualizations as ivis 
    import matplotlib.pyplot as plt
    plt.rcParams['font.sans-serif'] = ['SimHei']


    #for Chinese char
    id2w = dict([(v.index, k) for (k, v) in emb_model.wv.vocab.items()])
    
    def postprocess(X):
        X = X.copy()
        X = X / np.max(np.abs(X), axis=-1).reshape([14, 1])
        return X
    
    def bk_proj(X):
        return ivis.graymap(X)
    
    def heatmap(X):
        return ivis.heatmap(X)
    
    def graymap(X):
        return ivis.graymap(np.abs(X), input_is_postive_only=True)
        
#     analyzer = innvestigate.create_analyzer("lrp.alpha_beta",  model, alpha=1000, beta=999)
#     analyzer = innvestigate.create_analyzer("lrp.epsilon", model)
#     analyzer = innvestigate.create_analyzer("lrp.w_square", model)
#     analyzer = innvestigate.create_analyzer("lrp.z_plus", model)
#     analyzer = innvestigate.create_analyzer("lrp.sequential_preset_a", model)
#     analyzer = innvestigate.create_analyzer("lrp.sequential_preset_b", model)
#     analyzer = innvestigate.create_analyzer("lrp.sequential_preset_a_flat", model)
#     analyzer = innvestigate.create_analyzer("lrp.z", model)
    analyzer = innvestigate.create_analyzer("gradient", model)
#     analyzer = innvestigate.create_analyzer("deconvnet", model)
#     analyzer = innvestigate.create_analyzer("smoothgrad", model)
#     analyzer = innvestigate.create_analyzer("guided_backprop", model)
#     analyzer = innvestigate.create_analyzer("pattern.net", model)
#     analyzer = innvestigate.create_analyzer("pattern.attribution", model)
#     analyzer = innvestigate.create_analyzer("integrated_gradients", model)


    # some analyzers require additional training. For those
    analyzer.fit(inputs,
                 pattern_type='relu',
                 batch_size=256, verbose=1)
    
    print(inputs.shape)
    zoom_factor = 10
    drawer, image = make_drawer(inputs.shape, zoom_factor)


    img = analyzer.analyze(inputs)
    print(np.sum(img, axis=1))
    print(img)
    img = postprocess(img)
    print("after processing:")
    print(img)

    for i in range(inputs.shape[0]):
        for j in range(inputs.shape[1]):
            show_char = id2w[inputs[i, j]]
            if show_char == END_C:
                show_char = ''
            r = img[i, j] if img[i, j] > 0 else 0
            b = -img[i, j] if img[i, j] < 0 else 0
            plt.text(j * zoom_factor, i * zoom_factor, s=show_char, fontdict=None, color=(r, 0, b))
    plt.axis('off')
    plt.imshow(image)
    plt.savefig("result/analysis.png", dpi=800)
    plt.show()

5. Keras 开源框架innvestigate分析

Innvestigate的框架结构如下：

框架共实现了三类计算方法LRP-based，gradient-based（SA）， Pattern-based，其基类存放于innvestigate/analyzer 目录下。其中LRP-based的方法实现放在relevance_based文件夹下，由analyzer和rule两部分组成，analyzer实现基本的框架流程，通过代理模式调用不同的rule实现各种计算规则。
由于框架代码结构相对简单，下边直接看图说话：

5.1 框架执行流程图

5.2 Z-Rule

5.3 $W^2$ -rule

5.4 alpha-beta rule

5.5 Embedding pooling

由于Embedding layer不可导，在Relevance方向传播时会导致报错，为了解决这一问题，我们使用pooling的方式来计算Embedding layer输入的relevance（参见代码：innvestigate/layers.GradientWRT_Pooling【5】）

6.更进一步的思考

1.目前LRP的实现代码仅能在Relu为主要激活函数的模型结构下正常工作，遇到一些较为复杂的模型（比如Capsule）则只能通过SA的方法来进行分析，后边我们是否可以探索复杂模型上的实现方法？

参考文献：
【1】：Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps
【2】：On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation
【3】：Explaining NonLinear Classification Decisions with Deep Taylor Decomposition
【4】：Evaluating the visualization of what a Deep Neural Network has learned
【5】：“What is Relevant in a Text Document?”:An Interpretable Machine Learning Approach
workshop官网：
[1] : http://www.heatmapping.org/
original代码来源于Keras Explanation Toolbox (LRP and other Methods)

MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
【机器学习】朴素贝叶斯入门：从零到垃圾邮件过滤实战吴师兄大模型 0基础实现机器学习入门到精通机器学习人工智能朴素贝叶斯深度学习 pytorch sklearn 开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【机器学习】机器学习工程实战-第2章项目开始前腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第1章概述文章目录2.1机器学习项目的优先级排序2.1.1机器学习的影响2.1.2机器学习的成本2.2估计机器学习项目的复杂度2.2.1未知因素2.2.2简化问题2.2.3非线性进展2.3确定机器学习项目的目标2.3.1模型能做什么2.3.2成功模型的属性2.4构建机器学习团队2.4.1两种文化2.4.2机器学习团队的成员2.5机器学习项目为何失败2.5.1缺乏有经验的人才2.5.2缺乏领
机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
机器学习——KNN超参数练习AI两年半机器学习人工智能深度学习
sklearn.model_selection.GridSearchCV是scikit-learn中用于超参数调优的核心工具，通过结合交叉验证和网格搜索实现模型参数的自动化优化。以下是详细介绍：一、功能概述GridSearchCV在指定参数网格上穷举所有可能的超参数组合，通过交叉验证评估每组参数的性能，最终选择最优参数组合。其核心价值在于：自动化调参：替代手动参数调试，提升效率3。交叉验证支持：通
重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵概率论线性代数 windows 微信机器学习
fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要