愤怒的可乐

李宏毅机器学习——循环神经网络(一)

引言

今天来介绍一下循环神经网络(Recurrent Neural Network,RNN)，和现在比较常用的长短期记忆网络(LSTM)。并且通过多个例子来阐述这些概念，个人觉得还是比较容易理解的。

循环神经网络

我们以一个例子来引入RNN，这个例子就是填槽(Slot Filling)。

假设你要做一个智能订票系统。

假设有个人对你的订票系统说:“I would like to arrive Taipei(台北) on November 2nd.”，
作为一个订票系统，里面肯定会有像目的地(desination)和到达时间(time of arrival)这种关键信息。这里就用slot表示，你的系统要通过上面说的话就能识别出来目的地是Taipei,到达时间是:November 2nd。其他的词汇就不属于任何Slot。

这个问题可不可以用一个前馈神经网络来解，输入是一个词汇，比如把Taipei变成一个向量，丢到NN中去，但是在这之前你必须先把这个词汇用一个向量来表示。

把词汇用向量表示的方法有很多，最简单的方法是1-of-N编码。假设现在你的训练数据里面只有5个词汇，那么你就可以用一个5维向量表示，每个维度对应一个向量。出现某个词，就将对应维度的值设成1，其他都为0。

如果测试数据中出现了你训练数据中没有的词汇，那怎么办呢，有一种办法是增加一个维度，专门用来表示没有见过的词汇，这里用"other"表示。

除了这种方法外，还有一个Word Hasing的方法。
用某个词汇的字母来表示它的向量，比如有个词汇叫“apple”，“apple”里面有出现“app”、“ppl”和“ple”。在这个向量，对应中上面三个维度的值就是1，其他的都是0。

这样我们就能把一个词汇表示成一个向量，然后丢到NN中去，在填槽任务中，你希望这个前馈NN的输出是一个概率分布。这个概率分布代表我们输入的每个词汇属于每个SLOT的概率。

举例来说，就是Taipei属于这两个SLOT的概率。

如果仅是如此是不够的。

假设有人说“arrive Taipei on November 2nd”，这里面“Taipei”是目的地，“November 2nd”是时间，剩下的不属于这两个SLOT。

假设你解决了这个问题，但是另一个人说：“leave Taipei on November 2nd”。

那此时的Taipei应该是出发地，但是对于NN来说，输入是一样的东西，输出就是一样的东西。

你输入Taipei这个词汇，它输出要么都是目的地的概率最高，要么都是出发地(这里引入了一个新的SLOT)的概率最高。

你无法让同样的输入有时出发地的概率最高，有时目的地的概率最高。

如果NN是有记忆的就好了，如果它在看过红色的Taipei之间就已经看过arrive这个词汇；它记得它在看过绿色的Taipei之间，看过leave这个词汇。它就可以根据对话的上下文产生不同的输出！

这样就能解决输入是同样的词汇，输出是不同的问题。

这种有记忆的神经网络就是RNN(具体的说应该是简单的RNN（SimpleRNN）)。

在RNN里面，每次我们的隐藏层产生输出的时候，这个输出都会被存到内存里面去。

那么在下次有输入的时候，此时这个NN就不仅会考虑输入的 $x_1,x_2$ ，还会考虑存在内存中的值。它们都会影响这个隐藏层的输出。

这里还是用一个例子来让大家更好的明白。

假设我们现在图上的NN所有的权重都是 $1$ ，并且所有的神经元都没有任何的偏置( $b$ )，同时假设所有的激活函数都是线性的。

假设我们的输入是这样的序列：

接下来在使用我们的RNN之前需要给 $a_1,a_2$ 初始值。

这里假设里面的初始值是 $0$ 。

现在输入我们输入序列中的第一个1和1。

以上面用红框框出来的神经元来说，它不仅接到我们输入的1和1，它还接到内存中的0和0。

因为我们说所有的权重 $w$ 都是1，因此它的输出为： $0(a_1)\times 1(w) + 0(a_2)\times 1 + 1(x_1)\times 1 + 1(x_2)\times1 = 2$ 括号里面是解释对应的值是怎么来的。

同样，隐藏层右边的神经元输出也是2。
接下来，根据同样的计算方法，红色两个神经元的输出都是4。

因此，输入是1和1的时候，输出就是4和4。

接下来RNN会把绿色神经元的输出存到内存中去，覆盖之前的0和0。

接下来再输入第二个1和1,这时绿色的神经元的输出就会是： $\times 1 + 2\times 1 + 1\times1 + 1\times1 = 6$ 。

最后红色神经元的输出就是 $\times 1 + 6\times 1 = 12$ 。

所以当输入第二个1和1的时候，输出就是12和12。

所以从这里可以看出，对于RNN来说，就算给它一样的东西，也能得到不一样的结果。因为存在内存中的值是不一样的。

别忘了，接下来还会把绿色神经元的输出6和6覆盖掉之前的2和2。

接下来输入就是2和2,

根据同样的方法，就可以计算出绿色神经元的输出是16，红色神经元的输出是32。
当输入2和2时，输出就是32和32。

在做RNN的时候，有个很重要的是，输入序列的顺序会影响输出。

所以我们要用RNN来处理填槽问题的话，它就可以就像下面这样。

有个人说：“arrive Taipei on November 2nd”。

arrive就变成了一个向量，丢到NN中去，它的隐藏层输出是 $a_1$ (也是个向量)，然后根据 $a_1$ 我们产生 $y^1$ ，就是arrive属于每个SLOT的概率。

接下来 $a_1$ 会被存在内存中去，并且Taipei会变成输入，这个隐藏层会同时考虑Taipei这个输入和存在内存中的 $a_1$ ，得到 $a_2$ ，在根据 $a_2$ 产生 $y^2$ ， $y^2$ 是Taipei属于每个SLOT的概率。

以此类推，我们就把 $a_2$ 存到内存中去，再把on丢进去，然后产生 $a_3$ ，进而产生 $y^3$ 。

上面其实只是同一个神经网络，只是内存中保存的值不同，这里被使用了3次。

所以当神经网络有了记忆以后，刚才我们讲的输入同一个词汇，我们希望输出不同的问题就有可能被解决。

比如说，同样是输入了Taipei这个词汇，红色的前面接的是leave，绿色的Taipei前面接的是arrive。因为leave和arrive的向量不一样，所以存在内存中的值就不一样，这样最终得到的输出也不一样。

这个RNN的基本概念，虽然我们这里只有一个隐藏层，其实是可以很深的。

比如把 $x^t$ 丢进去后，它可以通过很多个隐藏层，最后得到输出 $y^t$ 。

每个隐藏层的输出都会存在内存中，下个时间点的时候，每个隐藏层都会读出前个时间点存的值，最后得到最终的输出，整个过程如下：

Elman Network & Jordan Network

RNN有不同的变形，我们刚才讨论的是Elman Network，就是把隐藏层的输出值存起来，下个时间点再读出来。如下图：

还有一种是Jordan Network，它存在的整个网络(这里用网络)的输出值，它会把这个输出值在下个时间点读进来。

据说Jordan Network能有比较好的结果，因为Elman Network的隐藏层的输出是没有目标的，你很难控制它学到怎样的东西；而输出值 $y$ 是有目标的，我们可以很清楚知道我们放到内存中的是什么。

双向循环神经网络(Bidirectional RNN)

RNN还可以是双向的，我们刚才看到的RNN是输入一个句子，从句首读到句尾。

比如说，先读 $x^t$ ，再读 $x^{t+1}$ ，再读 $x^{t+2}$

但是，它的读取方向其实是可以反过来的。可以先读 $x^{t+2}$ ，再读 $x^{t+1}，最后读$ x^t$。

我们可以同时训练正向的RNN和逆向的RNN，然后把这两个RNN的隐藏层拿出来，都接给一个输出层，产生 $y$ 。

用双向循环神经网络的好处是，你的网络在产生输出的时候，它看的范围是比较广的。如果你只有正向的RNN，在产生 $y^t,y^{t+1}$ 的时候，你的网络只看过 $x^1$ 一直到 $x^{t+1}$ 的输入。
如果我们今天是双向循环神经网络的时候，在产生 $y^{t+1}$ 的时候，你的网络不仅看了 $x^1$ 到 $x^{t+1}$ 的输入，它也看了从句尾一直到 $x^{t+1}$ 的输入。
你的网络等于是看了整个输入的序列以后，才决定每个词汇的SLOT应该是什么。当然会比只看了句子的一般得到更好的结果。

长短期记忆网络

刚才讨论的RNN的内存版本只是最简单的，接下来我们讨论下长短期记忆网络(Long Short-term Memory,LSTM)。

我们现在有个Memory Cell，它就像我们刚才说的RNN中隐藏层的内存。

LSTM它的Memory Cell有三个门结构，当神经网络的输出想要写到内存Memory Cell中去时，它必须先通过一个输入门(Inpute Gate)，这个输入门打开的时候才能把值写到Memory Cell中去，如果关闭的时候是无法写进去的。

这个输入门是打开还是关闭是神经网络自己学的。

在输出的地方也有一个输出门(Output Gate)，这个输出门会决定外界(其他的神经元)能否从这个Memory Cell中读出值。只有打开的时候才能读出值。和输入门一样，输出门什么时候打开，什么时候关闭，也是神经网络自己学习的。

第三个门是遗忘门(Forget Gate)，它来决定Memory Cell是否要忘掉之前保存的值。

同样，什么时候要忘掉，什么时候要保存也是网络自己学到的。

整个LSTM你可以看成是一个特征的神经元，它有4个输入和1个输出。

这个四个输入是：想要存到Memory Cell中的值、操控输入门的讯号(决定能否存进去)、操控输出门的讯号(决定别人能否看到)以及操控遗忘门的讯号(决定是否要清除当前保存的值)。

这里应该是更“专业”的图例：

我们假设现在要存到Cell中的输入是 $z$ ，操作输入门的数值(标量)是 $z_i$ ，操控输出门的数值是 $z_o$ ，操控遗忘门的数值是 $z_f$ ，综合这些东西后得到的输出是 $a$ 。

假设在输入 $z$ 之前，Cell里面已经存了值 $c$ 。

然后我们输入 $z$ ，将 $z$ 通过激活函数(都是与它们自己相邻的那个)得到的值记为 $g (z)$ ， $z_i$ 通过另外一个激活函数得到 $f(z_i)$ ，这三个门机构的激活函数通常会选择Sigmoid函数。
因为Sigmoid函数的值是在0到1之间的，这个值可以代表这个门被打开的程度，如果经过Sigmoid函数后的输出是1，代表门是打开的；反之，0代表门是关闭的。

接下来就把 $g (z)$ 乘上输入门的值： $f(z_i)$ ，得到 $g(z)f(z_i)$ 。

$z_f$ 也通过激活函数得到 $f(z_f)$ ，接下来把存在Cell中的值 $c$ 乘上 $f(z_f)$ 得到： $cf(z_f)$ ，然后把 $cf(z_f)$ 加上 $g(z)f(z_i)$ 得到 $c^\prime$ ，它就是新的存在Cell中的值。

根据目前为止的运算你可以发现， $f(z_i)$ 就是控制 $g (z)$ 能否输入的一个关卡，假设 $f(z_i)=0$ ，那么不管你输入什么， $g(z)f(z_i)=0$ ，就像是没有输入一样。

如果 $f(z_i)=1$ ，那就把 $g (z)$ 当做输入。

而 $f(z_f)$ 决定是否要把存在Cell中的值清掉，假设 $f(z_f)=1$ ，也就是遗忘门被开启的时候，这个时候 $\times c$ ，会得到 $c$ ，然后把 $c + g(z)f(z_i)$ 写回去，相当于就会保存(用到)之前的值；如果 $f(z_f)=0$ ，也就是遗忘门关闭， $\times c$ 得到 $0$ ，把 $0 + g(z)f(z_i)$ 写到Cell中去，就相当于忘掉了(没用到)原来的 $c$ 。

然后把这两个值加起来写到Cell中去。遗忘门的开关和我们的直觉是相反的，打开的时候是记得，而关闭的时候是遗忘。或许应该叫它记忆门。

然后把这个 $c^\prime$ 通过 $h$ 这个激活函数，得到 $h(c^\prime)$ ，接下来有一个输出门，这个输出门受 $z_o$ 所操控， $z_o$ 通过 $f$ 得到 $f(z_o)$ ，然后会把 $f(z_o)$ 乘上 $h(c^\prime)$ 得到 $h(c^\prime)f(z_o)$ 。

如果 $f(z_o)=1$ ，表示 $h(c^\prime)$ 可以通过这个输出门，反之如果是0，就表示这个输出就会变成0，也就是存在内存中的值就无法通过输出门被读取出来。

一个良心的例子

如果你没理解上面所说的，接下来用一个例子，结合上面说的，再描述一遍，希望你能明白。

假设我们的网络中只有一个LSTM的Memory Cell，我们的输入是3维的向量，输出都是1维的向量。

这个3维的输入向量和1维的输出向量之间的关系是

当输入向量第2个维度 $x_2$ 的值是1的话( $x_2=1$ )， $x_1$ 的值就会被写到内存中去
当 $x_2=-1$ 时，内存中存的值就会被遗忘
当 $x_3=1$ 时，才会打开输出门，看到输出。

假设我们原来存到内存中的值是 $0$ ，当这边 $x_2=1$ 时， $3$ 会被存到内存中去，所以得到的值就变成 $3$ 。

接下来又出现了 $x_2=1$ 的情况，所以 $4$ 就会被存到内存中去，加上之前的 $3$ 得到 $7$ 。

接下来遇到 $x_3=1$ ,所以现在内存中的值 $7$ 就会被输出。

下面碰到了 $x_2=-1$ 就会忘掉内存中的值，下一个时间点内存中的值就变成了 $0$

然后看到 $x_2=1$ 就会把此时 $x_1$ 的值 $6$ 存进去。

并且看到 $x_3=1$ ，会把 $6$ 输出。

接下来就来实际做一下运算。

这是一个LSTM的Memory Cell，我们知道它有4个输入标量，这4个标量就是我们输入的3维向量乘上一个权重后加上偏差所得到的的结果。

比如 $x_1,x_2,x_3$ 与权重进行线性转换并加上偏差后就会得到一个标量，就得到这里的输入。

这里的权重与偏差都是通过训练数据学到的，这里假设我们已经知道这些值是多少。

这里假设我们的输入是：

我们来实际运算一下，不过在这之前，先分析一下我们可能会得到的结果。

先看整个Cell的输入这里

$x_1$ 乘 $1$ ,其他都是乘 $0$ ，因此这里会直接把 $x_1$ 当成输入。

再看输入门的地方

它是 $x_2 \times 100$ 而偏差是 $- 10$ ，就是说假设 $x_2$ 没有值时，经过运算就会得到偏差 $- 10$ ，经过Sigmid激活函数后，它的值会接近 $0$ ，这相当于输入门是关闭的，只有在 $x_2$ 有值的时候，才有可能得到的结果比 $- 10$ 要大，经过Sigmoid函数得到一个正值，代表输入门被打开。

在看遗忘门这里

这里哪怕 $x_2$ 没值也会被打开，因为偏差有个正值 $10$ ，只有在 $x_2$ 有个很大的负值能压过偏差的时候，才会关闭。

最后看下输出门

输出门通常是关闭的，因为偏差是个较大的负值，如果 $x_3$ 的正值可以压过偏差的话，就可以把输出门打开。

好了，接下来就可以实际手撸一把了。

这里为了简化计算，假设 $g, h$ 都是线性的，并且内存中的初始值是 $0$ 。

现在我们输入第一个向量 ${3,1,0\}$ 。

先看输入这里， $\times 1=3$ ，因为其他的权重为 $0$ ，这里得到的输入就是 $3$ 。
然后再输入门这里

$\times 100 - 10=90$ 代入Sigmoid激活函数约等于 $1$ ，这里输入门就打开。

然后就可以通过输入门， $1\times 3=3$

此时再来看下遗忘门

$\times 100 + \times 10 = 110$ 代入Sigmoid函数得到 $1$ ，遗忘门被打开，意思不会遗忘。

然后把Memory Cell中的 $\times 1 + 3 = 3$

所以 $3$ 就会被存入Memory Cell。接下来看下输出门。

$\times 100 - 10 = -10$ 代入激活函数约等于 $0$ ，说明输出门关闭，也就是值无法输出，为什么

因为我们把输出门得到的 $0$ 乘以遗忘门传过来的 $3$ 得 $0$ ,就是最终的输出值，被 $0$ 给消掉了。

接下来输入 ${4,1,0\}$ 。

首先输入的值是 $4$ ，然后输入门是打开的，然后遗忘门也是打开的，所以内存中的值就变成了 $\times 1 + 4 = 7$ ，因此更新内存中的值为 $7$ 。

但是在这个输入（ ${4,1,0\}$ ）下，输出门还是关闭的，导致 $7$ 也无法输出，输出的是 $0$ 。

接下来输入 ${2,0,0\}$ 。

输入变成了 $2$ ，输入门经过计算是关闭的， $2$ 乘以输入门的 $0$ 得到 $0$ 。
遗忘门是打开的 $\times 1 + 0 =7$ ，相当于内存中的值不变。此时输出门还是关闭的，最终输出是 $0$ 。

接下来输入 ${1,0,1\}$ 。

输入变成了 $1$ ，输入门是关闭的，遗忘门是打开的，内存中的值不变。但是此时输出门是打开的，我们把输出门的 $1$ 乘上传过来的 $7$ ，得到最终的输出是 $7$ 。

最后输入 ${3,-1,0\}$ 。

输入变成了 $3$ ，输入门是关闭的，遗忘门也是关闭的，所以内存中的值就变成了 $\times 3 + 7 \times 0 = 0$ ，输出门也是关闭的，不过此时哪怕打开了输出也是 $0$ 。

演算完毕。

看到这个东西我们可能觉得和原来的神经网络不像，在我们原来的神经网络里面会有很多神经元，我们会把输入乘上不同的权重，得到的值当成不同神经元的输入，
每个神经元都是一个函数，输入一个标量，输出另一个标量。

如果是LSTM的话，只要把LSTM的Memory Cell想成是一个神经元就好了。
现在的输入会乘上不同的权重，当做LSTM的不同的输入。这里假设这个隐藏层只有两个神经元。

$x_1,x_2$ 乘上某组权重会去操控第一个LSTM的输出，再乘上另外一组权重操控输出门，乘上另外一组权重会去操控第一个LSTM的输入门，再乘上一组权重去操纵遗忘门。

第二个LSTM也是一样， $x_1,x_2$ 乘上不同的权重去操控第二个LSTM的输入、输出门、输入门和遗忘门。

因此对应LSTM会有4倍的参数数量。因为每组权重不同，同一个输入 $x_1,x_2$ 得到的乘以权重得到的值也是不一样的。

也即使LSTM需要4个输入才会产生一个输出，而原来的神经元只要一个输入就能产生一个输出。

但是看起来还是不太像RNN，这里画另外一个图来表示它。

假设我们有一整排的神经元(LSTM),每个LSTM的Cell中都存了一个标量，把这些标量连接起来就得到一个向量 $c^{t-1}$ (表示时间点 $t$ 的前一个时间点)。每个LSTM存的值在这个向量的某个维中。

现在在时间点 $t$ ，有个输入向量 $x^t$ ，它首先会乘上一个矩阵进行线性转换变成另外一个向量 $z$ 。 $z$ 这个向量的每个维度代表了操控每个LSTM的输入。

它的第一维就丢给第一个Cell，第二维就丢给第二个Cell…

这个 $x^t$ 会乘上另外一个矩阵得到 $z^i$ 。 $z^i$ 的维度也和LSTM的数量一样，不过它的每个维度操控的是LSTM的输入门。

看到这里你可能会想到，还有有两个新的向量来操控输出门与遗忘门。对了。

同样滴，得到 $z^f$ 来操控遗忘门， $z^o$ 操控输出门。

所以我们把 $x^t$ 乘上4个不同的矩阵，得到四个不同的向量。它们的维度都会LSTM的数量一样，这4个向量一起操控LSTM的运作。

注意每个只把4个向量的某个维度的值丢给某个LSTM，但是所有的Cell是可以共同一起被运算的。

我们知道 $z$ 要乘上 $z^i$ 通过激活函数的结果，我们上面画出来。

$z^f$ 也要通过遗忘门的激活函数，然后与之前存在Cell中的值相乘(在 $c^{t-1}$ 的某个维度中)。

接下来要把上面得到的两个值加起来。

$z^o$ 通过激活函数，把输出与上面的值经过激活函数的结果相乘，最后得到输出 $y^t$ 。

对了，红框框出来相加后的结果就是存到内存中的值 $c^t$ 。
整个过程会反复进行下去，在下个时间点，输入 $x^{t+1}$ ，然后经过上面一样的过程，得到下个时间点的输出 $y^{t+1}$

你可能觉得这个很复杂，但这还仅仅是简化的形式，真正的LSTM还会接入一个 $h^t$ ：

把上图红色箭头尾部的输出当做下个时间点的输入。

也就是说下个时间点操控这些门和输入的值不仅仅只是看原来的输入 $x^{t+1}$ ，还会看前一个时间点的输出 $h^t$ 。

其实还不只这样，还会加一个peephole(窥视孔)，就是把存在前一个时间点内存中的值也拿出来当成新的时间点的输入。

而且现在随便都会叠个5,6层，它看起来是这样的：

李老师这里还贴出了个图片，类似我看到了什么鬼！？

你可能会觉得这么复杂能否真的有用，但是它还真是很常用的。好在我们用Keras这种工具，可以很方便的开箱即用(上面的没看懂也没关系)。

Keras支持LSTM、GRU(LSTM的简化版，据说表现还差不多，并且不容易过拟合)和SimpleRNN。

参考

1.李宏毅机器学习

一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！小城哇哇人工智能语言模型 AI大模型大模型微调预训练 agi LLM
前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。近年来，人工智能（AI）在各个领域的突破性进展，尤其是在自然语言处理（NLP）方面，引起了广泛关注。两项重要的技术方法——预训练和微调，成为了AI模型发展的基石。预训练通常是指在大规模数据集上进行模型训练，以帮助
ONE Deep模型：LG AI Research的开源突破耶耶Norsea 网络杂烩自动化
摘要由LGAIResearch开发的ONEDeep系列开源AI模型，参数规模覆盖2.4亿至32亿。经评估，2.4B参数规模的ONEDeep模型在性能上优于同类其他模型，展现出显著优势。这一成果为AI技术的应用与研究提供了强有力的支持。关键词ONEDeep模型,开源AI模型,LGAIResearch,2.4B参数,性能优越一、ONEDeep模型概述1.1ONEDeep模型的开发背景在当今人工智能技术
2025.03.22【读书笔记】| fastq-multx：高效barcode拆分数据解决工具穆易青读书笔记数据处理读书笔记 linux 运维服务器
文章目录1.工具介绍为什么需要`fastq-multx`？`fastq-multx`的特点2.安装方式通过源代码编译安装使用包管理器安装3.使用命令基本命令高级参数设置结语1.工具介绍在生物信息学的世界里，工具的选择至关重要。今天，我们要介绍的这个工具，就是fastq-multx，一个用于高效barcode去复用和demultiplex的解决方案。fastq-multx是一个专门设计用于处理高通量
深度解析大模型推理框架：原理、应用与实践百度_开发者中心人工智能大模型自然语言处理
在当今数据驱动的时代，大模型推理框架已经成为人工智能领域的重要支柱。本文将通过简明扼要、清晰易懂的方式，带领读者深入了解大模型推理框架的原理、应用领域和实践经验，帮助读者更好地掌握这一技术，并在实际工作中发挥其价值。一、大模型推理框架简介大模型推理框架是指一种基于深度学习技术的推理框架，主要用于解决大规模数据集下的复杂问题。该框架通过对海量数据进行高效的训练和推理，能够快速地对各种复杂场景进行分析
Python基础知识点总结豆芽819 tip python 开发语言
1Python简介Python特点：解释型语言：无需编译，逐行执行。动态类型：变量类型在运行时确定。简洁易读：语法接近自然语言，代码简洁。跨平台支持：Windows/Linux/macOS均可运行。应用领域：Web开发、数据分析、人工智能、自动化脚本等。开发环境：推荐使用IDLE、PyCharm、VSCode或JupyterNotebook。2Python数值运算基本运算符：算术：+,-,*,/,
人工智能和云计算带来的技术变革：工业自动化的新趋势 AI天才研究院 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能（AI）和云计算技术的发展，我们正面临着一场巨大的技术变革。这些技术正在改变我们的生活方式、工作方式和社会结构。在工业自动化领域，人工智能和云计算技术正在为我们提供新的可能性和挑战。本文将探讨这些技术如何影响工业自动化，以及未来的发展趋势和挑战。1.1人工智能的基本概念人工智能（ArtificialIntelligence，AI）是一种试图使计算机具有人类智能的技术。AI的
《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造” 耘瞳科技科技
在江宁开发区，机器人已不再是科幻电影里的遥远想象，他们就像人类的“同事”，在工地上忙着贴砖、刷墙、搬运、检测；在体育训练场上帮助运动员矫正姿势；在医院里帮助医生发现帕金森早期征兆，在智慧工厂里与人类分工协作……作为南京市机器人产业“一核多翼”布局的“核”，江宁开发区当前聚集人工智能产业核心及上下游关联企业超百家。近日，《南京日报》走访了多家链条上的“明星企业”，耘瞳科技作为中国领先的智能检测与测量
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
双一流软件工程大二听闻 Java 前景堪忧，是否该转C++或人工智能或者读研？程序员yt java c++人工智能
今天给大家分享的是一位粉丝的提问，双一流软件工程大二听闻Java前景堪忧，是否该转C++或人工智能或者读研？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：yt老师好，我是双一流软件工程的大二学生，一直在学习java方向，目前掌握了数据库，spring框架等内容，大一暑假在老家一个小公司找了段实习，有蓝桥杯java组b组国一，专业排名前2（保研名
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
编程行业必备！12个热门AI工具帮你写代码~ DevSecOps选型指南人工智能软件供应链安全工具代码安全开发助手 SAST 安全
到今年，AI编程工具的发展已经非常成熟了，它们可以极大地提高开发效率，帮助程序员解决复杂问题，并优化代码质量。拒绝废话，今天给大家推荐12款AI编程工具！1悬镜安全灵脉AI开发安全卫士灵脉AI开发安全卫士是基于多模智能引擎的新一代静态代码安全扫描产品，通过自动化审查流程来定位潜在缺陷、提升审计效率和代码质量，并显著减少手动审查所需的时间和精力。该平台利用人工智能技术，提供逐行的代码反馈，建议改进和
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
关于AI OS那点事大囚长科普天地大模型人工智能
AIOS（人工智能操作系统）作为面向智能时代的操作系统，其功能定位和架构设计与传统操作系统（如Linux、Windows、iOS等）存在显著差异。一、AIOS需具备的核心功能智能体全生命周期管理智能体调度与并发：需支持多智能体任务的优先级排序、资源分配及并发执行，例如通过轮询调度或动态优先级算法优化LLM资源利用率。上下文感知与切换：通过上下文管理器实现智能体交互状态的快照保存与恢复，解决LLM生
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
HCIA-AI人工智能笔记3：数据预处理噗老师华为认证人工智能笔记 wpf 数据处理 AI 华为认证
统讲解数据预处理的核心技术体系，通过Python/Pandas与华为MindSpore双视角代码演示，结合特征工程优化实验，深入解析数据清洗、标准化、增强等关键环节。一、数据预处理技术全景图graphTDA[原始数据]-->B{数据清洗}B-->B1[缺失值处理]B-->B2[异常值检测]B-->B3[重复值删除]A-->C{特征工程}C-->C1[标准化/归一化]C-->C2[离散化分箱]C--
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
景联文科技入选中国信通院发布的“人工智能数据标注产业图谱” 景联文科技科技人工智能
近日，由中国信息通信研究院、中国人工智能产业发展联盟牵头，联合中国电信集团、沈阳市数据局、保定高新区等70多家单位编制完成并发布《人工智能数据标注产业图谱》。景联文科技作为人工智能产业关键环节的代表企业，入选图谱中技术服务板块。图谱按照国家数据局技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等六个方面任务展开，由上游资源提供方、中游数据标注核心服务方、下游配套支撑方三部分组成。其中上游
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
今日行情明日机会——20250321 人大博士的交易之路人工智能区块链数学建模数据挖掘分类涨停回马枪大数据
后续投资机会分析结合2025年3月21日盘面数据（涨停56家，跌停31家），市场呈现结构性分化行情，海洋经济成为绝对主线，机器人概念局部活跃，人工智能表现较弱。以下是具体方向与策略建议：1.海洋经济（核心主线，政策+事件驱动）核心逻辑：板块23家涨停，梯队完整（七板至一板），神开股份（七板）打开高度，叠加海洋资源开发、碳中和政策（如海上风电、深海装备）催化，资金深度介入。大连重工（三板，海洋工程装
人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
比较分析：Windsurf、Cody、Cline、Roo Cline、Copilot 和通义灵码张3蜂开源编程语言与开发技术选型与架构设计 copilot c#AI编程
随着人工智能技术的快速发展，开发者工具变得越来越智能化，特别是在代码生成、辅助编程等领域，市面上涌现了多种AI驱动的工具。本文将从开源性、集成能力、功能覆盖范围、支持的编程语言、生态兼容性、成本、学习曲线、响应速度、离线支持以及与.NETCore的适配性等十个维度对以下几种产品进行比较：Windsurf、Cody、Cline、RooCline、Copilot和通义灵码。1.开源性Windsurf:
使用Aim追踪LangChain执行 bavDHAUO langchain python
在现代人工智能应用中，调试和可视化自动化工作流变得越来越重要，Aim正是为此而生。通过Aim，你可以轻松地追踪LangChain中语言模型(LLM)和工具的输入输出，以及代理的动作，从而在执行过程中快速定位和解决问题。此外，Aim还支持并排比较多个执行流程，使之成为调试中的得力助手。Aim是一个完全开源的项目，你可以在GitHub上找到更多关于Aim的信息。在本文中，我们将展示如何启用和配置Aim
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
分享12个国内AI对话聊天的免费网站（含DeepSeek大模型）码上飞扬人工智能语言模型 DeepSeek
在人工智能领域，基于对话的语言模型已成为当前研究的热点，其中以ChatGPT为代表的模型凭借其卓越的语言理解与交互能力备受瞩目。为帮助用户更好地选择和使用这类AI工具，本文将介绍12个国内可直接体验对话聊天功能的平台，为用户提供实用参考。1、腾讯元宝地址：https://hunyuan.tencent.com/bot/chat腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预
《今日AI-人工智能-编程日报》-源自2025年3月21日小亦编辑部人工智能
一、AI编程领域最新动态AI编程工具崛起，程序员职业面临挑战Anthropic首席执行官DarioAmodei预言，未来一年内，90%的代码将由AI生成，传统程序员的工作可能被大幅替代。最新发布的AI编程模型（如Claude3.7、Sonnet3.7）在初级开发评估中表现优异，得分率超过60%，部分模型甚至在全球程序员排名中位列前0.1%。字节跳动的Trae海外版接入Claude3.7和GPT-4
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi