予亭

EM算法 - 期望极大算法

前言

EM算法是机器学习十大算法之一，它很简单，但是也同样很有深度，简单是因为它就分两步求解问题，

E步：求期望（expectation）
M步：求极大（maximization)

深度在于它的数学推理涉及到比较繁杂的概率公式等，所以本文会介绍很多概率方面的知识，不懂的同学可以先去了解一些知识，当然本文也会尽可能的讲解清楚这些知识，讲的不好的地方麻烦大家评论指出，后续不断改进完善。

EM算法引入

概率模型有时候既含有观测变量，又含有隐变量或潜在变量，如果概率模型的变量都是观测变量，那么给定数据，可以直接用极大似然估计法，或贝叶斯估计方法估计模型参数，但是当模型含有隐变量时，就不能简单的使用这些方法，EM算法就是含有隐变量的概率模型参数的极大似然估计法，或极大后验概率估计法，我们讨论极大似然估计，极大后验概率估计与其类似。
参考统计学习方法书中的一个例子来引入EM算法，假设有3枚硬币，分别记做A、B、C，这些硬币正面出现的概率分别是 $\pi$ 、 $p$ 、 $q$ ，进行如下实验：

先掷硬币A，根据结果选出硬币B和硬币C，正面选硬币B，反面选硬币C
通过选择出的硬币，掷硬币的结果出现正面为1，反面为0
如此独立地重复n次实验，我们当前规定n=10，则10次的结果如下所示：
$1, 1, 0, 1, 0, 0, 1, 0, 1, 1$
假设只通过观测到掷硬币的结果，不能观测掷硬币的过程，问如何估计三个硬币出现正面的概率？
我们来构建这样一个三硬币模型：
$\begin{aligned} P(y|\theta) &=\sum_{z}P(y,z|\theta)=\sum_{z}P(z|\theta)P(y|z,\theta) \\ &=\pi p^{y}(1-p)^{1-y}+(1-\pi)q^{y}(1-q)^{1-y} \end{aligned}$
若 $y = 1$ ，表示这此看到的是正面，这个正面有可能是B的正面，也可能是C的正面，则 $P(1|\theta)=\pi p+(1-\pi)q$
若 $y = 0$ ，则 $P(0|\theta)=\pi (1-p)+(1-\pi)(1-q)$

y是观测变量，表示一次观测结果是1或0，z是隐藏变量，表示掷硬币A的结果，这个是观测不到结果的， $\theta=(\pi,p,q)$ 表示模型参数，将观测数据表示为 $Y=(Y_1,Y_2,...,Y_n)^{T}$ ，未观测的数据表示为 $Z=(Z_1,Z_2,...,Z_n)^{T}$ ，则观测函数的似然函数是：
$\begin{aligned} P(Y|\theta)&=\sum_{Z}P(Z|\theta)P(Y|Z,\theta)\\ &=\prod_{i=0} ( \pi p^{y_i}(1-p)^{1-y_{i}}+(1-\pi)q^{y_{i}}(1-q)^{1-y_{i}}) \end{aligned}$
考虑求模型参数 $\theta=(\pi,p,q)$ 的极大似然估计，即：
$\hat{\theta}=arg\max_{\theta}logP(Y|\theta)$
这个问题没有解析解，只有通过迭代方法来求解，EM算法就是可以用于求解这个问题的一种迭代算法，下面给出EM算法的迭代过程：

首先选取初始值，记做 $\theta^{0}=(\pi^{0},p^{0},q^{0})$ ，第i次的迭代参数的估计值为 $\theta^{i}=(\pi^{i},p^{i},q^{i})$
E步：计算在模型参数 $\pi^{i}，p^{i}，q^{i}$ 下观测变量 $y_i$ 来源于硬币B的概率：
$\mu^{i+1}=\frac{\pi^{i}(p^{i})^{y_i}(1-p^i)^{1-y_i}}{\pi^{i}(p^{i})^{y_i}(1-p^i)^{1-y_i}+(1-\pi^{i})(q^{i})^{y_i}(1-p^i)^{1-y_i}}$
备注一下：这个公式的分母是 $P(Y|\theta)$ ，分子表示是来源与B硬币的概率。
M步：计算模型参数的新估计值：
$\pi^{i+1}=\frac{1}{n}\sum_{j=1}^{n}\mu_{j}^{i+1}$
因为B硬币A硬币出现正面的结果，所以A硬币概率就是 $\mu_{j}$ 的平均值。
$p^{i+1}=\frac{\sum_{j=1}^{n}\mu_{j}^{i+1}y_j}{\sum_{j=1}^{n}\mu_{j}^{i+1}}$
分子乘以 $y_{i}$ ，所以其实是计算B硬币出现正面的概率。
$q^{i+1}=\frac{\sum_{j=1}^{n}(1-\mu_{j}^{i+1})y_j}{\sum_{j=1}^{n}(1-\mu_{j}^{i+1})}$
$(1-\mu_{j}^{i+1})$ 表示出现C硬币的概率。

闭环形成，从 $P(Y|\theta)$ 到 $\pi、p、q$ 一个闭环流程，接下来可以通过迭代法来做完成。针对上述例子，我们假设初始值为 $\pi^{0}=0.5，p^{0}=0.5，q^{0}=0.5$ ，因为对 $y_i=1$ 和 $y_i=0$ 均有 $\mu_j^{1}=0.5$ ，利用迭代公式计算得到 $\pi^{1}=0.5，p^{1}=0.6，q^{1}=0.6$ ，继续迭代得到最终的参数：
$\widehat{\pi^{0}}=0.5，\widehat{p^{0}}=0.6，\widehat{q^{0}}=0.6$
如果一开始初始值选择为： $\pi^{0}=0.4，p^{0}=0.6，q^{0}=0.7$ ，那么得到的模型参数的极大似然估计是 $\widehat{\pi}=0.4064，\widehat{p}=0.5368，\widehat{q}=0.6432$ ，这说明EM算法与初值的选择有关，选择不同的初值可能得到不同的参数估计值。

这个例子中你只观察到了硬币抛完的结果，并不了解A硬币抛完之后，是选择了B硬币抛还是C硬币抛，这时候概这就成了一个先有鸡还是先有蛋的问题了。鸡说：没有我，谁把你生出来的啊。蛋不服，说：没有我，你从哪蹦出来啊。为了解决这个你依赖我，我依赖你的循环依赖问题，总得有一方要先打破僵局，不管了，我先随便整一个值出来，看你怎么变，然后我再根据你的变化调整我的变化。

EM算法

输入：观测变量数据Y，隐变量数据Z，联合分布 $P(Y,Z|\theta)$ ，条件分布 $P(Z|Y,\theta)$ ；
输出：模型参数 $\theta$

(1)选择参数的初值 $\theta^0$ ，开始迭代
(2) E步：记 $\theta^i$ 为第i次迭代参数 $\theta$ 的估计值，在第i+1次迭代的E步，计算
$\begin{aligned} Q(\theta,\theta^i)&=E_{Z}[logP(Y,Z|\theta)|Y,\theta^i]\\ &=\sum_{Z}logP(Y,Z|\theta)P(Z|Y,\theta^i) \end{aligned}$
这里， $P(Z|Y,\theta^i)$ 是在给定观测数据Y和当前的参数估计 $\theta^i$ 下隐变量数据Z的条件概率分布；
(3) M步：求使 $Q(\theta,\theta^i)$ 极大化的 $\theta$ ，确定第i+1次迭代的参数的估计值 $\theta^{i+1}$ ，
$\theta^{i+1}=arg \max \limits_{\theta}Q(\theta,\theta^{i})$
$Q(\theta,\theta^{i})$ 是EM算法的核心，称为Q函数(Q function)，这个是需要自己构造的。
(4) 重复第(2)步和第(3)步，直到收敛，收敛条件：
$\theta^{i+1}-\theta^{i} || < \varepsilon_1$
或者：
$||Q(\theta^{i+1},\theta^{i})-Q(\theta^{i},\theta^{i})|| <\varepsilon_2$
收敛迭代就结束了。其实这里应该思考一个问题，E步到底在做什么事情，如果只是定义 $Q$ 函数，那么可以在M步来操作就行，完全不要这个E步。于是在找来了一些资料来了解一下，其中有一篇博客讲解的非常好，我这里简约一些流程，并做一些注释。部分内容在推导逼近里有讲到，我们这里超前讲解一下，增加隐藏变量之后似然函数如下：
$L(\theta,z)=\sum_{i=1}^{m}log\sum_{z^{i}}P(x^{i},z^{i}|\theta)$
我们需要对此公式求最大值时的变量 $z,\theta$ ，所以完整的公式是：
$z,\theta = arg max L(\theta,z)=arg max \sum_{i=1}^{m}log\sum_{z^{i}}P(x^{i},z^{i}|\theta)$
利用由于“和的对数”求解过于复杂，用jensen不等式来转换为“对数的和”，于是有：
$L(\theta,z)=\sum_{i=1}^{m}log\sum_{z^{i}}P(x^{i},z^{i}|\theta) \\ =\sum_{i=1}^{m}log\sum_{z^{i}}Q(z^{i})\frac{P(x^{i},z^{i}|\theta)}{Q(z^{i})} \\ \ge \sum_{i=1}^{m}\sum_{z^{i}}Q(z^{i})log\frac{P(x^{i},z^{i}|\theta)}{Q(z^{i})}$
其实这里是把 $Q(z^{i})$ 作为权重，利用了期望函数来做jensen不等式转换：
$\ge E(log(y))$
那什么时候不等式相等呢？只有当y等于常数的时候，也就是：
$y=c=\frac{P(x^{i},z^{i}|\theta)}{Q(z^{i})} \\ cQ(z^{i}) = P(x^{i},z^{i}|\theta)$
对其做累计和，由于有 $\sum_{z^i} Q(z^{i}) =1$ ，于是有：
$\begin{aligned} \sum cQ(z^{i}) &= \sum_{z^i} P(x^{i},z^{i}|\theta) \\ c &=\sum_{z^i} P(x^{i},z^{i}|\theta) \end{aligned}$
所以 $Q(z^{i})$ 的形式其实是：
$Q(z^{i}) = \frac{P(x^{i},z^{i}|\theta)}{\sum_{z^i} P(x^{i},z^{i}|\theta)}$
这也是E步要做的计算，计算得到了 $Q(z^{i})$ ，接下来算M步，原公式固定 $Q(z^{i})$ ，将其作为常数，去掉坟分母中的 $Q(z^{i})$ ，利用极值求解 $\theta$ ，则原公式变为：
$\theta=arg max \sum_{i=1}^{m}\sum_{z^{i}}Q(z^{i})log P(x^{i},z^{i}|\theta)$
聊一下为啥不去掉另一个 $Q(z^{i})$ ，主要是另一个对求极值导数，影响值，如下：
$Q(z^{i})log P(x^{i},z^{i}|\theta) - Q(z^{i})log Q(z^{i})$
求导数，后面的公式等于0，所以直接去掉分母中的 $Q(z^{i})$

推导逼近

主要讲解Jensen不等式，这个公式在推导和收敛都用到，主要是如下的结论：

$f (x)$ 是凸函数
$\le E(f(x))$
$f (x)$ 是凹函数
$\ge E(f(x))$

推导出Em算法可以近似实现对观测数据的极大似然估计的办法是找到E步骤的下界，让下届最大，通过逼近的方式实现对观测数据的最大似然估计。统计学习基础中采用的是相减方式，我们来看下具体的步骤。

增加隐藏变量
$L(\theta)=\sum_{Z}logP(Y|Z,\theta)P(Z,\theta)$
则 $L(\theta)-L(\theta^{i})$ 为：
$\begin{aligned} L(\theta)-L(\theta^{i})=log(\sum_{Z} P(Y|Z,\theta^i)\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Y|Z,\theta^i)})-L(\theta^{i})\\ \ge \sum_{Z} P(Y|Z,\theta^i)log(\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Y|Z,\theta^i)})-L(\theta^{i}) \end{aligned}$
$\ge$ 这一个步骤就是采用了凹函数的Jensen不等式做转换。因为 $Z$ 是隐藏变量，所以有 $\sum_{Z} P(Y|Z,\theta^i)==1，P(Y|Z,\theta^i)>0$ ，于是继续变：

$\begin{aligned} L(\theta)-L(\theta^{i})&=log(\sum_{Z} P(Y|Z,\theta^i)\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Y|Z,\theta^i)})-L(\theta^{i})\\ &\ge \sum_{Z} P(Z|Y,\theta^i)log(\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Z|Y,\theta^i)})-L(\theta^{i})\\ &=\sum_{Z} P(Z|Y,\theta^i)log(\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Z|Y,\theta^i)})-\sum_{Z} P(Z|Y,\theta^i)L(\theta^{i})\\ &= \sum_{Z} P(Z|Y,\theta^i)log(\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Z|Y,\theta^i) (P(Y|\theta^{i})}) \\ & \ge0 \end{aligned}$
也就是： $L(\theta)\ge L(\theta^{i})+ \sum_{Z} P(Z|Y,\theta^i)log(\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Y|Z,\theta^i) L(\theta^{i})})$ ，有下界，最大化下界，来得到近似值。这里有一个细节： $P(Y|Z,\theta^i)$ 变为 $P(Z|Y,\theta^i)$ ？如果要满足Jensen不等式的等号，则有：
$\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Y|Z,\theta^i)} = c$
c为一个常数，而 $\sum_{Z}P(Y|Z,\theta^i)=1$ 则：
$\begin{aligned} \sum_{Z}P(Y|Z,\theta)P(Z,\theta)= c\sum_{Z}P(Y|Z,\theta^i)&=c\\ &=\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Y|Z,\theta^i)}\\ P(Y|Z,\theta)=\frac{P(Y|Z,\theta)P(Z,\theta)}{\sum_{Z}P(Y|Z,\theta)P(Z,\theta)}=\frac{P(Y,Z,\theta)}{P(Y,\theta)}=P(Z|Y,\theta) \end{aligned}$

大家是不是很奇怪 $P(Y|Z,\theta)P(Z,\theta)$ 加上 $\sum$ 之后等于什么，其实有的博客这里使用 $P(Z,\theta) = P(Y^i,Z^i,\theta^i)$ 来替代 $P(Y|Z,\theta)$ 参与计算，这样 $\sum_{Z}P(Y^i,Z^i,\theta^i)$ ，这样就方便理解来了。

于是最大化如下：

$\begin{aligned} \theta^{i+1}&=arg \max_{\theta}\sum_{Z} P(Z|Y,\theta^i)log(\frac{P(Y|Z,\theta)P(Z,\theta)}{P(Z|Y,\theta^i)})\\ &=arg \max_{\theta}\sum_{Z} P(Z|Y,\theta^i)log(P(Y|Z,\theta)P(Z,\theta))\\ & =arg \max_{\theta}\sum_{Z} P(Z|Y,\theta^i)log(P(Y,Z|\theta))\\ &=arg \max_{\theta}Q(\theta,\theta^i) \end{aligned}$
其中 $l o g$ 分母提出来是关于 $Z$ 的 $\sum_{Z} P(Z|Y,\theta^i)logP(Z|Y,\theta^i)$ ，可以去掉。当然也有博客写的形式是：
$\max_{\theta}\sum_{i=1}^{M}\sum_{Z^{i}} P(Z^{i}|Y^{i},\theta^i)log(P(Y^{i},Z^{i};\theta))\\$
形式其实一样，表示的不一样而已。用jansen不等式可以把求解和的对数变为对数的和的形式，这样可以很方便的对其求导。

证明收敛

我们知道已知观测数据的似然函数是 $P(Y,\theta)$ ，对数似然函数为：
$\begin{aligned} L()=\sum_{i=1}^{M}logP(y^{i},\theta) &=\sum_{i=1}^{M}log(\frac{P(y^i,Z|\theta)}{P(Z|y^i,\theta)})\\ &=\sum_{i=1}^{M}logP(y^i,Z|\theta) - \sum_{i=1}^{M}logP(Z|y^i,\theta) \end{aligned}$
要证明收敛，就证明单调递增， $\sum_{i=1}^{M}logP(y^{i},\theta^{j+1})>\sum_{i=1}^{M}logP(y^{i},\theta^{j})$
由上文知道：
$\begin{aligned} Q(\theta,\theta^i)&=\sum_{Z}logP(Y,Z|\theta)P(Z|Y,\theta^i)\\ &=\sum_{i=1}^{M}\sum_{Z^j}logP(y^i,Z^j|\theta)P(Z^j|y^i,\theta^i) \end{aligned}$
我们构造一个函数 $H$ ，让他等于：
$H(\theta,\theta^{i})=\sum_{i=1}^{M}\sum_{Z^j}log(P(Z|y^i,\theta)P(Z|y^i,\theta^i))$
让 $Q(\theta,\theta^i)-H(\theta,\theta^{i})$ ：
$\begin{aligned} Q(\theta,\theta^i)-H(\theta,\theta^{i})&=\sum_{i=1}^{M}\sum_{Z^j}logP(y^i,Z^j|\theta)P(Z^j|y^i,\theta^i) - \sum_{i=1}^{M}\sum_{Z^j}log(P(Z^j|y^i,\theta)P(Z^j|y^i,\theta^i)) \\ &=\sum_{i=1}^{M}\sum_{Z^j}log\bigg(P(y^i,Z^j|\theta)-P(Z^j|y^i,\theta)\bigg) \\ &=\sum_{i=1}^{M}logP(y^{i},\theta) \end{aligned}$ 所以：
$\sum_{i=1}^{M}logP(y^{i},\theta^{j+1})-\sum_{i=1}^{M}logP(y^{i},\theta^{j}) \\ = Q(\theta^{i+1},\theta^i)-H(\theta^{i+1},\theta^{i}) - (Q(\theta^{i},\theta^{i})-H(\theta^{i},\theta^{i}))\\ = Q(\theta^{i+1},\theta^i)- Q(\theta^{i},\theta^{i}) -( H(\theta^{i+1},\theta^{i}) - H(\theta^{i},\theta^{i}))$
该公式左边已经被证明是大于0，证明右边： $H(\theta^{i+1},\theta^{i}) - H(\theta^{i},\theta^{i})<0$ ：
$\begin{aligned} H(\theta^{i+1},\theta^{i}) - H(\theta^{i},\theta^{i}) &=\sum_{Z^j}\bigg(log(\frac{P(Z^j|Y,\theta^{i+1})}{P(Z^j|Y,\theta^i)}) \bigg)P(Z^j|Y,\theta^i) \\ &=log\bigg(\sum_{Z^j}\frac{P(Z^j|Y,\theta^{i+1})}{P(Z^j|Y,\theta^i)}P(Z^j|Y,\theta^i) \bigg)\\ &=logP(Z|Y,\theta^{i+1})=log1=0 \end{aligned}$
其中不等式是由于Jensen不等式，由此证明了 $\sum_{i=1}^{M}logP(y^{i},\theta^{j+1})>\sum_{i=1}^{M}logP(y^{i},\theta^{j})$ ，证明了EM算法的收敛性。但不能保证是全局最优，只能保证局部最优。

高斯混合分布

EM算法的一个重要应用场景就是高斯混合模型的参数估计。高斯混合模型就是由多个高斯模型组合在一起的混合模型（可以理解为多个高斯分布函数的线性组合，理论上高斯混合模型是可以拟合任意类型的分布），例如对于下图中的数据集如果用一个高斯模型来描述的话显然是不合理的：

两个高斯模型可以拟合数据集，如图所示：

如果有多个高斯模型，公式表示为：
$P(y|\theta)=\sum_{k=1}^{K}a_k\phi(y|\theta_{k}) \\ \phi(y|\theta_{k})=\frac{1}{\sqrt{2\pi}\delta_{k}}exp(-\frac{(y-\mu_{k})^2}{2 \delta_{k}^{2}}) \\ a_k>0,\sum a_k =1$
$\phi(y|\theta_{k})$ 表示为第k个高斯分布密度模型，定义如上，其中 $a_k$ 表示被选中的概率。在本次模型 $P(y|\theta)$ 中，观测数据是已知的，而观测数据具体来自哪个模型是未知的，有点像之前提过的三硬币模型，我们来对比一下，A硬币就像是概率 $a_k$ ，用来表明具体的模型，而B、C硬币就是具体的模型，只不过这里有很多个模型，不仅仅是B、C这两个模型。我们用 $\gamma_{jk}$ 来表示，则：
$\gamma_{jk} = \begin{cases} 1& \text{第j个观测数据来源于第k个模型}\\ 0& \text{否则} \end{cases}$
所以一个观测数据 $y_j$ 的隐藏数据 $(\gamma_{j1},\gamma_{j2},...,\gamma_{jk})$ ，那么完全似然函数就是：

$P(y,\gamma|\theta)= \prod_{k=1}^{K}\prod_{j=1}^{N}[a_{k}\phi(y|\theta_{k})]^{\gamma_{jk}}$

取对数之后等于：

$\begin{aligned} log(P(y,\gamma|\theta))&=log( \prod_{k=1}^{K}\prod_{j=1}^{N}[a_{k}\phi(y|\theta_{k})]^{\gamma_{jk}})\\ &=\sum_{K}^{k=1}\bigg(\sum_{j=1}^{N}(\gamma_{jk}) log(a_k)+\sum_{j=1}^{N}( \gamma_{jk})\bigg[log(\frac{1}{\sqrt{2\pi}})-log(\delta_{k})-\frac{(y_i-\mu_{k})^2}{2 \delta_{k}^{2}}\bigg]\bigg) \end{aligned}$

E 步：
$\begin{aligned} Q(\theta.\theta^i) &= E[log(P(y,\gamma|\theta))]\\ &=\sum_{K}^{k=1}\bigg(\sum_{j=1}^{N}(E\gamma_{jk}) log(a_k)+\sum_{j=1}^{N}(E\gamma_{jk})\bigg[log(\frac{1}{\sqrt{2\pi}})-log(\delta_{k})-\frac{(y_i-\mu_{k})^2}{2 \delta_{k}^{2}}\bigg]\bigg) \end{aligned}$
其中我们定义 $\hat{\gamma_{jk}}$ ：
$\hat{\gamma_{jk}} = E(\gamma_{jk}|y,\theta)=\frac{a_k\phi(y_i|\theta_{k})}{\sum_{k=1}^{K}a_k\phi(y_i|\theta_{k}) }\\ j=1,2,..,N；k=1,2,...,K\\ n_k=\sum_{j=i}^{N}E\gamma_{jk}$
于是化简得到：
$\begin{aligned} Q(\theta.\theta^i) &= \sum_{K}^{k=1}\bigg(n_k log(a_k)+\sum_{j=1}^{N}(E\gamma_{jk})\bigg[log(\frac{1}{\sqrt{2\pi}})-log(\delta_{k})-\frac{(y_i-\mu_{k})^2}{2 \delta_{k}^{2}}\bigg]\bigg) \end{aligned}$

E 步在代码设计上只有 $\hat{\gamma_{jk}}$ 有用，用于M步的计算。

M步，
$\theta^{i+1}=arg \max_{\theta}Q(\theta,\theta^i)$
对 $Q(\theta,\theta^i)$ 求导，得到每个未知量的偏导，使其偏导等于0，求解得到：
$\hat{\mu_k}=\frac{\sum_{j=1}^{N}\hat{\gamma_{jk}}y_i}{\sum_{j=1}^{N}\hat{\gamma_{jk}}} \\ \\ \hat{\delta_k}=\frac{\sum_{j=1}^{N}\hat{\gamma_{jk}}(y_i-\mu_k)^2}{\sum_{j=1}^{N}\hat{\gamma_{jk}}} \\ \\ \\ \hat{a_k}=\frac{\sum_{j=1}^{N}\hat{\gamma_{jk}} }{N}$
给一个初始值，来回迭代就可以求得值内容。这一块主要用到了 $Q(\theta.\theta^i)$ 的导数，并且用到了E步的 $\hat{\gamma_{jk}}$ 。

总结

这里其实还有很多问题没讲，这一块概念突然不太想学了，有点任性的我就不继续了，大家想了解的可以去学习统计学习方法这本书，讲解的还是挺全的，可能之后我也会继续更新，哈哈。

参考博客

统计学习基础
EM算法原理总结
什么是EM算法？
机器学习算法总结(六)——EM算法与高斯混合模型
人人都懂EM算法

DeepSeek：中国大模型 “破壁者” 引发的四大产业地震赵同学爱学习人工智能 chatgpt DeepSeek 语言模型大模型开源
导语：当全球AI产业还在为GPT-4的1750亿参数惊叹时，中国团队DeepSeek以颠覆性创新撕开了大模型领域的“铁幕”。这款首个引发国际学术界集体关注的中文大模型，正从技术底层重构产业规则，其冲击波已蔓延至硬件、软件、商业模式的每个角落。一、算力霸权瓦解：低成本训推技术改写游戏规则1.1训练成本“悬崖式下降”DeepSeek通过混合专家架构（MoE）动态路由算法，在同等效果下将模型激活参数压缩
大语言模型的潜力是否被高估 dev.null AI #NLP 语言模型人工智能机器学习
关于大语言模型（LLM）的潜力是否被高估，目前学术界和产业界存在显著分歧。以下从技术能力、应用局限性和未来发展方向三个方面综合分析：一、技术能力的争议：潜力与局限并存对现实世界的理解与模拟MIT的研究表明，LLM在训练过程中可能自发形成对现实世界的内部模拟。例如，通过解决卡雷尔编程谜题（KarelPuzzle），模型在没有直接接触环境信息的情况下，正确率从初始的随机指令提升至92.4%，并展现出对
python 基于混合式推荐算法的学术论文投稿系统 mosquito_lover1 python 知识图谱
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术（如基于内容的推荐、协同过滤、知识图谱等）来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。系统设计思路1.数据收集与预处理：-收集论文数据（标题、摘要、关键词、作者信息等）。-收集期刊/会议数据（领域、主题、影响因子、投稿要求等）。-对文本数据进行预处理（分词、去停用词、向量化等）。2.推荐算法设计
长文本、知识库、微调对比司南锤程序院学习人工智能
长文本、知识库和微调是三种不同的技术手段，用于增强大模型的能力。1.长文本处理•核心目标：理解和生成长篇内容。•优点：•连贯性强，适合处理需要深入理解背景信息的任务。•适合复杂任务，如长篇阅读理解或文章生成。•缺点：•资源消耗大，处理长文本需要更多的计算资源和内存。•受上下文长度限制，可能会丢失一些细节信息。•适用场景：•写作助手：生成长篇博客、报告或故事。•阅读理解：处理长篇阅读理解任务，如学术
DeepSeek选择方向的优势 AIWritePaper官方账号 DeepSeek AIWritePaper ChatGPT 人工智能 deepseek AIWritePaper 机器学习大数据
DeepSeek选择方向的优势在学术研究与论文发表的征程中，DeepSeek凭借其独特的优势，正逐渐成为研究者们不可或缺的得力助手。以下将从多个维度深入剖析DeepSeek选择方向的卓越之处。一、高效的数据处理能力DeepSeek能够迅速处理海量数据，自动识别数据模式，精准定位关键趋势与关联。这一能力使研究者无需耗费大量时间在数据的海洋中苦苦搜寻，从而为论文研究节省宝贵时间，显著提升研究效率。二、
Nature：OpenAI的deep research工具对科研人员有用吗？迪娜学姐人工智能论文阅读论文笔记 prompt
OpenAI的deepresearch工具对科研人员有用吗？它有哪些优缺点？来看看全球学术界专家的评价。科技巨头OpenAI发布了一款名为“深度研究”的付费访问工具，该工具能够将来自数十乃至数百个网站的信息综合成一份数页长的引用报告。此工具与谷歌去年12月发布的同名“深度研究”功能类似，能在短短数十分钟内完成相当于数小时的工作量。许多科学家对其撰写文献综述或整篇综述论文的能力，甚至识别知识空白的能
第81期 | GPTSecurity周报 aigc网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.大语言模型与代码安
如何去除文章的 AI 痕迹 hjehheje 人工智能
一、引言在当今数字化时代，人工智能（AI）技术已经广泛应用于写作领域，无论是学生撰写论文、科研人员整理研究报告，还是创作者编写文章，AI都能提供强大的辅助。然而，过度依赖AI或者不恰当使用AI写作工具可能会导致文章中留下明显的AI痕迹，这不仅可能影响文章的自然度和可信度，还可能在某些场合引发学术不端的质疑。因此，学会去除文章中的AI痕迹，对于提升文章质量至关重要。本文将详细介绍去除文章AI痕迹的方
网站外链影响网站排名吗为什么霏霏看世界搜索引擎百度百度小程序百度云算法
权重传递：搜索引擎认为，如果一个网站被其他高质量、权威的网站所链接，就像是获得了这些网站的“信任投票”。高质量的外链能够将一部分权重传递给目标网站，提升其在搜索引擎眼中的重要性和可信度，从而有助于提高排名。例如，在学术领域，一篇论文被众多知名学术期刊引用，那么这篇论文的学术价值和影响力就会被认可，类似地，网站获得权威网站的外链，也会被搜索引擎认为更有价值。www.czyhjy.cn增加爬行入口：搜
告别高租金压力！西安国际科创产业园火热招商中！国际数字科创产业园人工智能创业创新传媒大数据
在企业发展的征程中，租金成本往往是一道绕不开的难题。高昂的租金压力，如同沉重的枷锁，束缚着企业前行的步伐。而如今，西安国际科创产业园的出现，为众多企业带来了告别高租金压力的希望曙光。西安国际科创产业园坐落于城市发展的关键区域，这里交通网络四通八达，无论是货物运输还是人员往来，都极为便捷。周边高校、科研机构林立，形成了浓厚的学术与创新氛围，为企业的人才储备和技术研发提供了得天独厚的条件。走进园区，现
友思特新闻 | 再创佳绩！友思特荣获“机器人技术成果创新创业大赛”三等奖！友思特机器视觉与光电图像处理机器视觉光电检测 OCT
2024年11月22日，“2024粤港澳大湾区科技协同创新联盟机器人技术成果转移转化活动”圆满落下帷幕。赛事奖项介绍：机器人技术成果创新创业大赛2024粤港澳大湾区科技协同创新联盟机器人技术成果转移转化活动于11月22日在广东粤港澳大湾区国家纳米科技创新研究院学术报告厅隆重举行。活动锚定“力度更大、成果更多”的目标，围绕“湾区智融·科创领航”主题，开展授牌、演讲、数据服务、成果发布、推介、比赛等一
Python 爬虫实战：全球大学排名数据抓取与排名趋势分析西攻城狮北 python 爬虫开发语言大学排名
引言作为一名对教育数据和数据分析感兴趣的内容创作者，我决定利用Python爬虫技术抓取全球大学排名数据，并对排名趋势进行分析。这对于了解大学的学术表现、国际竞争力以及教育发展的动态具有重要意义。一、项目背景全球大学排名是衡量高等教育机构学术声誉和综合实力的重要指标。QS世界大学排名作为全球最具影响力的大学排名之一，每年都会发布最新的排名数据。通过抓取这些数据，我们可以分析不同大学在各个指标上的表现
不同用户群体设计的Manus试用申请理由模板 xinxiyinhe 人工智能人工智能
注：仅供参考。以下是为不同用户群体设计的Manus试用申请理由模板，结合其核心功能与官方审核偏好撰写，可根据自身需求调整使用：模板1：学术研究场景申请理由：我目前从事人工智能与产业经济交叉领域的博士后研究，亟需通过AI技术快速处理大量非结构化数据（如政策文件、企业年报、行业研报）。Manus的「多智能体调度」与「跨平台工具调用」功能能显著提升研究效率，例如：自动化筛选并分析1000+份上市公司ES
使用 Python 爬虫抓取 Wikipedia 页面内容——完整实战教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 json java
引言随着互联网的普及和信息化时代的到来，获取知识变得异常方便。Wikipedia作为全球最大的开放式百科全书，几乎涵盖了所有领域的知识。每年都有数十亿次的访问量，成为全球获取信息的一个重要来源。对于数据分析、自然语言处理、学术研究等领域，Wikipedia页面内容往往是研究者和开发者的重要数据来源之一。本篇博客将带您通过Python爬虫，学习如何抓取Wikipedia页面中的内容，并处理提取的文本
19个判定学术写作内容有AI生成痕迹的例子 AIWritePaper官方账号 AIWritePaper DeepSeek ChatGPT 人工智能 chatgpt 机器学习 AIWritePaper 大数据
写作风格与语言特征重复性与一致性：AI生成的内容往往会在文中重复使用某些短语或表达方式，且整体语气和风格保持高度一致，缺乏人类写作者在不同情境下自然产生的微妙变化。缺乏情感与语境变化：AI生成的文本通常难以体现出人类写作者在不同段落或情境中可能会有的情感波动或语境的灵活转换。过度使用特定词汇和短语：某些词汇和短语在AI生成的文本中出现频率较高，如“commendable”“meticulous”“
AI双轨革命：DeepSeek与Manus 人工智能aigc
DeepSeek与Manus是当前人工智能领域备受关注的两款产品，它们在技术定位、核心能力及适用场景上存在显著差异，但并非直接竞争关系，而是形成互补。一、技术架构与核心能力DeepSeek：知识型“最强大脑”技术架构：基于混合专家模型（MoE），参数规模达6710亿，专注于语言模型的极致优化，擅长知识推理、文本生成与专业问题解答。核心优势：语言理解与生成：中文知识问答正确率达64.1%，在学术论文
基于Deepseek的智能辅助论文写作系统 CodeJourney. 算法数据库人工智能能源
在学术的浩瀚海洋中，撰写论文是每一位科研人员、学生都必须面对的挑战。从选题的迷茫，到资料收集的繁琐，再到写作过程中的反复推敲，每一个环节都充满了艰辛。然而，随着人工智能技术的飞速发展，一款名为Deepseek的工具正逐渐崭露头角，为论文写作带来了全新的解决方案。本文将深入探讨Deepseek在论文写作中的应用，以及它如何帮助我们从论文写作的“青铜”一路飙升至“王者”。一、论文写作的困境（一）选题难
传输分析_基于可重构智能表面的MIMO传输：系统设计，分析和实现徐柚柚传输分析
1研究背景随着第五代(5G)移动通信网络正在全球进行测试和部署，第六代(6G)移动通信系统也逐渐引起学术界和工业界的广泛兴趣。在6G物理层候选使能技术中，将大规模多输入多输出(MIMO)升级成为超大规模MIMO，以及将工作频段扩展至太赫兹频段被公认为有潜力的技术路线。但是，超大规模MIMO技术需要包含大量射频链路收发机，太赫兹通信也需要复杂昂贵的器件支撑，这些都面临高硬件成本和高能耗的严峻挑战。2
AI Agent 分类详解：从反射 Agent 到学习型 Agent 的演进紫雾凌寒 AI 炼金厂 #深度学习 #AI Agent 人工智能 Agent agent 智能体分类机器学习 manus
一、引言：AIAgent，智能时代的新宠儿在当今科技飞速发展的时代，人工智能（AI）已成为推动各行业变革的核心力量。而AIAgent，作为人工智能领域的关键概念，正逐渐崭露头角，成为学术界和工业界共同关注的焦点。从智能家居中的智能助手，到复杂工业流程中的自动化控制系统，AIAgent的身影无处不在，它正以其独特的智能决策和自主行动能力，为我们的生活和工作带来前所未有的便利和效率提升。随着AI技术的
Deepseek:太翌氏混沌语言理论学术价值评估报告太翌修仙笔录 deepseek 超算法认知架构人工智能知识图谱 agi
基于科学性和真实性的基础上，做一个太翌氏混沌语言理论学术价值评估报告###**太翌氏混沌语言理论学术价值评估报告**---####**一、理论概述****太翌氏混沌语言理论**提出了一种跨学科框架，通过将混沌动力学、量子物理、语言学及生命科学融合，利用特定频率的“混沌语言”干预物理系统与生命过程。其核心假设为：**语言结构可通过共振效应调制非线性系统的动力学行为**，进而实现量子态坍缩、生命场衰变
最新整理的50个网络安全必知术语，想要入行网安，建议收藏！ wljslmz 网络技术 web安全安全网络安全
想象一下，你刚入行网络安全（Cybersecurity），兴冲冲地打开一本专业书，或者加入一个网安论坛，结果满屏的“漏洞”“威胁”“DDoS”“加密”……脑袋瞬间一片迷雾。这时候，你会不会觉得自己像个“数字文盲”，完全摸不着北？别慌，这正是网络安全术语存在的意义——它们是你进入这个高能领域的“通行证”！网络安全术语可不是什么枯燥的学术名词，而是行业里沟通的“通用语言”。它就像一张地图，能帮你快速定
NTIRE比赛：技术前沿、国内企业表现与计算机视觉未来展望 AndrewHZ 深度学习新浪潮计算机视觉人工智能深度学习调研报告算法 NTIRE 画质算法
一、NTIRE比赛概述：图像恢复与增强领域的全球竞技场1.1NTIRE的定位与历史NTIRE（NewTrendsinImageRestorationandEnhancement）是计算机视觉领域最具影响力的国际赛事之一，聚焦于图像恢复与增强技术的前沿探索。自2017年首次举办以来，NTIRE每年与计算机视觉顶会CVPR联合召开，成为学术界与工业界技术实力的重要展示平台。其竞赛内容涵盖图像超分辨率、
哪个AI论文生成助手好用？5 款AI论文工具深度评测 AI论文图鉴人工智能
2025年，AI论文写作工具如雨后春笋般涌现，迅速在学术圈走红。身为一个常被论文写作困扰的“懒人”，我对这些工具的实际表现充满好奇。于是，我亲测了五款当下国内外最热门的AI论文写作助手，从功能、交互、写作水平、写作效率等维度进行全面评测，结果令人惊喜。相信这篇文章能为仍在观望的你带来新的启发与认识。这次测评，我挑选了五款极具代表性的AI工具，以“基于大语言模型的医疗诊断研究”为主题，看它们如何大显
【大模型开发】大模型背后的基础组件与生态概览云博士的AI课堂深度学习哈佛博后带你玩转机器学习大模型技术开发与实践大模型开发 Hugging Face DeepSpeed 大模型生态机器学习深度学习大模型技术栈
支撑大模型开发与部署的关键组件与生态系统当今大模型（LLM,LargeLanguageModel）在工业与学术界的应用日益广泛，从ChatGPT、BERT到DeepSeek等新兴模型，背后离不开一整套成熟的技术生态和工具链支持。本文将介绍其中几大核心组件和框架，包括HuggingFaceTransformers、DeepSpeed、Megatron-LM，以及其他相关工具和方法，展示它们在训练效率
JSON数据解析实战：从嵌套结构到结构化表格亿牛云爬虫专家代理IP 爬虫代理 python json 数据解析嵌套结构结构化表格 Google Scholar 学术文献爬虫代理
在信息爆炸的时代，如何从杂乱无章的数据中还原出精准的知识图谱，是数据侦探们常常面临的挑战。本文以GoogleScholar为目标，深入解析嵌套JSON数据，从海量文献信息中提取关键词、作者、期刊等内容。最终，我们不仅将数据转换成结构化表格，还通过Graphviz制作出技术关系图谱，揭示文献间的隐秘联系。关键数据分析在本次调研中，我们的核心目标是获取GoogleScholar上的学术文献信息。为此，
大语言模型原理基础与前沿挑战与机遇 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿挑战与机遇1.背景介绍大语言模型（LargeLanguageModels,LLMs）是近年来人工智能领域的一个重要突破。它们通过深度学习技术，特别是基于变换器（Transformer）架构的模型，能够在自然语言处理（NLP）任务中表现出色。大语言模型的出现不仅推动了学术研究的发展，也在实际应用中展现了巨大的潜力。1.1大语言模型的起源大语言模型的起源可以追溯到早期的统计语言
LLM Weekly（2025.02.17-02.23） UnknownBody LLM Daily LLM Weekly 人工智能自然语言处理
本文是LLM系列文章，主要是针对2025.02.17-02.23这一周的LLM相关新闻与文章、GitHub资源分享。网络新闻Grok3Beta——推理代理的时代。Grok发布了Grok3Beta，通过强化学习、扩展计算和多模态理解提供卓越的推理能力。Grok3和Grok3mini在学术基准上取得了高分，其中Grok3在AIME’25上获得了93.3%的分数。Grok3的推理可通过“思考”按钮访问，
清华DeepSeek宝典1-6册霸气降临：冲破AI迷雾，决胜深度进阶辉煌之路 2501_91080101 pdf
清华DeepSeek宝典1-6册霸气降临：冲破AI迷雾，决胜深度进阶辉煌之路在科技迅猛发展的时代，AI已经成为推动各行业变革的核心力量。但AI领域知识体系庞大复杂，新理论、新技术层出不穷，让人望而生畏。如今，清华DeepSeek宝典1-6册霸气降临，为在AI浪潮中奋勇前行的探索者们，开辟出一条决胜深度进阶的辉煌之路。清华智慧，铸就AI领域巅峰宝典清华大学，作为国内学术与科研的重镇，始终在人工智能领
技术人实测 | 如何用AI工具2分钟突破知网AIGC检测线 LL06210721 人工智能 AIGC
最近在GitHub发现个有意思的本地化算法工具，其核心是通过对抗式语义重组技术重构文本逻辑链。测试时发现：将GPT生成的论文导入后，系统会保留原始参考文献格式，同时用学术同义词替换引擎重写表达结构。实测数据：某985实验室的AI生成稿经处理，知网AIGC率从38%→9.7%（检测截图已脱敏），维普重复率从24%→8.3%。工具最实用的三个细节：保留公式编号和图表位置不变支持LaTeX源码级修改追踪
[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调强化学习曾小健 #LLM大语言模型语言模型人工智能自然语言处理
该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abstract）背景：大型语言模型（LLMs）在多种应用中展现了卓越的推理能力，但需要有效的微调方法来适应下游任务。问题：现有的高效微调方法缺乏一个系统化
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str