weixin_961876584

最大熵模型

内容源于公众号《简博士数据分析吧》和b站《【合集】十分钟机器学习系列视频《统计学习方法》》
代码来自于https://blog.csdn.net/weixin_41566471/article/details/106319467

最大熵原理

在满足约束条件的模型集合中选取熵最大的模型
离散：

$\begin{aligned} &\max \quad -\sum_x p(x)\log p(x) \\ &s.t. \quad \sum_x p(x)=1 \\ \end{aligned}$
求解结果是服从均匀分布

连续：连续随机变量的均值为 $\mu$ ，方差为 $\sigma ^2$ ，求熵最大对应的概率分布:

$\begin{aligned} &\max L=-\int_{-\infty}^{\infty} p(x) \log p(x) d x \\ &s.t. \begin{cases} \int_{-\infty}^{\infty} p(x) d x=1\\ \int_{-\infty}^{\infty} x p(x) d x=\mu\\ \int_{-\infty}^{\infty}(x-\mu)^2 p(x) d x=\sigma^2 \end{cases} \end{aligned}$
求得模型服从正态分布

最大熵模型的定义

将最大熵原理应用到分类就是最大熵模型。给定训练数据集 $T=\{(x_1,y_1),...,(x_N,y_N)\}$ ，目标就是用最大熵原理选择最好的分类模型。
数学定义为：

联合分布 $P (X, Y)$ 和边缘分布 $P (X)$ 的经验分布为：

$\tilde P(X=x,Y=y)=\frac{{\rm v}(X=x,Y=y)}{N}$
$\tilde P(X=x)=\frac{{\rm v}(X=x)}{N}$
${\rm v}(X=x,Y=y)$ 表示训练数据中样本 $(x, y)$ 出现的频数。

特征函数 $f (x, y)$

注意：特征函数可以是任意实值函数，不一定是二值函数

特征函数关于经验分布的期望：

$E_{\tilde{P}}\left(f_i\right)=\sum_{x, y} \tilde{P}(x, y) f_i(x, y)$

特征函数关于理论分布的期望：

$\begin{aligned} E_P\left(f_i\right) &=\sum_{x, y} P(x, y) f_i(x, y) \\ &=\sum_{x, y} P(x) P(y \mid x) f_i(x, y)\\ &=\sum_{x, y}\tilde P(x) P(y \mid x) f_i(x, y) \end{aligned}$

约束条件：经验分布的期望=理论分布的期望，若有n个特征函数 $f_i(x,y),i=1,..,n$ ，就有n个约束条件。当然，还有一个自然约束条件：概率和为1
目标：最大熵模型实际上是**「判别方法」**，判别方法就是要得出条件概率分布，就是要得出满足 $\max H(P)$ 的 $P (Y ∣ X)$ 。

$\begin{aligned} H(P)&=\sum_{i=1}^n p\left(x_i\right) H\left(Y \mid X=x_i\right)\\ &=-\sum_{i=1}^n p\left(x_i\right)\sum_{j=1}^k p\left(y_j \mid x_i\right) \log p\left(y_j \mid x_i\right) \\ &=-\sum_{i=1}^n \sum_{j=1}^k \tilde{p}\left(x_i\right) p\left(y_j \mid x_i\right) \log p\left(y_j \mid x_i\right)\\ &=-\sum_{x, y} \widetilde{P}(x) P(y \mid x) \log P(y \mid x) \end{aligned}$

最大熵模型的学习

约束最优化问题

最大熵模型的学习可以形式化为最优化问题：

$\begin{aligned} & \min_{P\in C} -H(P)=\sum_{x, y} \widetilde{P}(x) P(y \mid x) \log P(y \mid x)\\ &s.t.\begin{cases} E_P(f_i)=E_{\widetilde P}(f_i),i=1,..,n\\ \sum_y P(y|x)=1 \end{cases} \end{aligned}$

优化问题的原始问题和对偶问题

若 $f(x),c_i(x),h_j(x)$ 是连续可微函数。考虑如下有约束的最优化问题：

$\begin{array}{ll} \min _{x \in R^n} & f(x) \\ s . t . & c_i(x) \leq 0, \quad i=1,2, \cdots, k \\ & h_j(x)=0, \quad j=1,2, \cdots, l \end{array}$

这就是该有约束最优化问题的原始形式。这样一个优化问题其实计算起来非常的复杂，因为有 k+l 个约束条件。

引进 「广义拉格朗日函数」 ：

$\alpha, \beta)=f(x)+\sum_{i=1}^k \alpha_i c_i(x)+\sum_{j=1}^l \beta_j h_j(x)\quad \alpha_i,\beta_j \ge 0$

「考虑关于x 的函数」:

$\theta_P(x)=\max _{\alpha, \beta} L(x, \alpha, \beta)=\begin{cases}f(x)\quad 有约束\\ \infty \quad 无约束 \end{cases}$
原始问题的最优值：
$p^*=\min _x \theta_P(x)=\min _x \max _{\alpha, \beta} L(x, \alpha, \beta)$

「考虑关于 $\alpha ,\beta$ ** 的函数」*

对偶问题的最优值：
$d^*=\max _{\alpha, \beta} \theta_D(\alpha, \beta)=\max _{\alpha, \beta} \min _x L(x, \alpha, \beta)$

原始问题和对偶问题的关系
1. 广义拉格朗日函数的区间范围

$\min _x L(x, \alpha, \beta) \leq L(x, \alpha, \beta) \leq \max _{\alpha, \beta} L(x, \alpha, \beta)$
$d^*=\max _{\alpha, \beta: \alpha_i \geq 0} \min _x L(x, \alpha, \beta) \leq L(x, \alpha, \beta) \leq \min _x \max _{\alpha, \beta: \alpha_i \geq 0} L(x, \alpha, \beta)=p^*$

令等号相等需满足的条件

该条件等价于KKT条件：
$\begin{array}{ll} \nabla_x L\left(x^*, \alpha^*, \beta^*\right)=0 & \\ \alpha_i^* c_i\left(x^*\right)=0, & i=1,2, \cdots, k \\ c_i\left(x^*\right) \leq 0, & i=1,2, \cdots, k \\ \alpha_i^* \geq 0, & i=1,2, \cdots, k \\ h_j(x *)=0, & j=1,2, \cdots, l \end{array}$

证明最大熵模型的原始问题是满足上述条件

$f (x) = - H (P)$ 如果熵函数是严格的凹函数，就要满足：
$H\left(\lambda_1 P+\lambda_2 Q\right)>\lambda_1 H(P)+\lambda_2 H(Q)$
将熵的表达式代入上式：
$\begin{aligned} &H\left(\lambda_1 P+\lambda_2 Q\right)=-\sum_{i=1}^m\left(\lambda_1 p_i+\lambda_2 q_i\right) \log \left(\lambda_1 p_i+\lambda_2 q_i\right) \\ &\lambda_1 H(P)+\lambda_2 H(Q)=-\lambda_1 \sum p_i \log p_i-\lambda_2 \sum q_i \log q_i \end{aligned}$
整理可得我们要证的是下式：
$\sum \lambda_1 p_i \log \frac{\lambda_1 p_i+\lambda_2 q_i}{p_i}+\sum \lambda_2 q_i \log \frac{\lambda_1 p_i+\lambda_2 q_i}{q_i}<0 \quad \lambda_1+\lambda_2=1$
利用不等式 $\log (t)log(t)<t−1，t=1$

内部极小化

最大熵模型的原始问题可以通过对偶问题来求解，它的拉格朗日函数为：
$\begin{aligned} L(P, \omega) &=\sum_{x, y} \widetilde{P}(x) P(y \mid x) \log P(y \mid x)+\omega_0\left(1-\sum_y P(y \mid x)\right) \\ &+\sum_{i=1}^n \omega_i\left(\sum_{x, y} \widetilde{P}(x, y) f_i(x, y)-\sum_{x, y} \widetilde{P}(x) P(y \mid x) f_i(x, y)\right) \end{aligned}$
其对偶问题为：
$d^*=\max _{\omega \geq 0} \theta_D(P)=\max _{\omega \geq 0} \min _{P\in C} L(P,\omega)$
我们先处理 $\min _x L(x, \alpha, \beta)$ 这一部分.

$\frac{\partial L(P, \omega)}{\partial P(y|x)}=\sum_{x, y} \widetilde{P}(x)[\log P(y \mid x)+1]-\omega_0-\sum_{i=1}^n \omega_i \sum_{x, y} \widetilde{P}(x) f_i(x, y)=0$

得到
$\mid x)=\exp \left(\sum_{i=1}^n w_i f_i(x, y)+\omega_0-1\right)=\frac{\exp \left(\sum_{i=1}^n w_i f_i(x, y)\right)}{\exp \left(1-\omega_0\right)}$

由 $\sum_y P(y|x)=1$ ，得
$\exp \left(1-\omega_0\right)=\sum_y {\exp \left(\sum_{i=1}^n w_i f_i(x, y)\right)}$
将2待人1，我们可以得到条件概率分布

$P_{\omega}(y|x)=\frac{1}{Z_{\omega}(x)} \exp \left(\sum_{i=1}^n w_i f_i(x, y)\right)$
其中规范化因子
$Z_\omega(x)=\sum_y \exp \left(\sum_{i=1}^n w_i f_i(x, y)\right)$

外部极大化

把3中的 $P_w(y|x)$ 带入到拉格朗日函数中，得外部极大化问题为max 对偶函数：
$\begin{aligned} \max \Psi(\omega)=& \sum_{x, y} \widetilde{P}(x) P_\omega(y \mid x) \log P_\omega(y \mid x)+\omega_0\left(1-\sum_y P_\omega(y \mid x)\right) \\ &+\sum_{i=1}^n \omega_i\left(\sum_{x, y} \widetilde{P}(x, y) f_i(x, y)-\sum_{x, y} \widetilde{P}(x) P_\omega(y \mid x) f_i(x, y)\right) \end{aligned}$

证明对偶函数得极大化=最大熵模型得极大似然估计

将对偶函数继续化简：
由 $\sum_y P_\omega(y \mid x)=1$ 可知，对偶函数得第二项为0。
$\begin{aligned} \Psi(\omega)=& \sum_{x, y} \widetilde{P}(x) P_\omega(y \mid x) \log P_\omega(y \mid x) +\sum_{i=1}^n \omega_i\left(\sum_{x, y} \widetilde{P}(x, y) f_i(x, y)-\sum_{x, y} \widetilde{P}(x) P_\omega(y \mid x) f_i(x, y)\right)\\ =&\sum_{x, y} \widetilde{P}(x, y)\sum_{i=1}^n \omega_i f_i(x, y)+\sum_{x, y} \widetilde{P}(x) P_\omega(y \mid x)\left( \log P_\omega(y \mid x)-\sum_{i=1}^n \omega_if_i(x,y) \right)\\ =&\sum_{x, y} \widetilde{P}(x, y)\sum_{i=1}^n \omega_i f_i(x, y)-\sum_{x, y} \widetilde{P}(x) P_\omega(y \mid x)\log Z_{\omega}(x)\\ =&\sum_{x, y} \widetilde{P}(x, y)\sum_{i=1}^n \omega_i f_i(x, y)-\sum_{x} \widetilde{P}(x) \log Z_{\omega}(x) \end{aligned}$
现在看最大熵模型的极大似然估计：
最大熵模型的对数似然函数为：（ $\cdot \widetilde{P}(x, y)$ 是数据 $(x, y)$ 出现的次数）
$\begin{aligned} L_{\widetilde{P}}\left(P_\omega\right) &=\log \prod_{x, y} P_\omega(y \mid x)^{N \cdot \widetilde{P}(x, y)} \\ &=N \cdot \log \prod_{x, y} P_\omega(y \mid x)^{\widetilde{P}(x, y)} \\ &=N \cdot \sum_{x, y} \widetilde{P}(x, y) \log P_\omega(y \mid x)\\ &=N \cdot \sum_{x, y} \widetilde{P}(x, y) \log \frac{1}{Z_\omega(x)} \exp \left(\sum_{i=1}^n \omega_i f_i(x, y)\right) \\ &=N\left[\sum_{x, y} \widetilde{P}(x, y)\left(\sum_{i=1}^n \omega_i f_i(x, y)\right)-\sum_{x, y} \widetilde{P}(x, y) \log Z_\omega(x)\right]\\ &=N\left[\sum_{x, y} \widetilde{P}(x, y)\left(\sum_{i=1}^n \omega_i f_i(x, y)\right)-\sum_{x} \widetilde{P}(x) \log Z_\omega(x)\right] \end{aligned}$
N是样本数，是固定的，可以省略。这样会发现
$\Psi(\omega)=L_{\widetilde{P}}\left(P_\omega\right)$

模型学习的最优化算法

我们把求解最大熵模型转化为求解最大化对数似然函数或者最大化对偶函数，那么关键点就转换到找出拉格朗日乘子 $\omega$ 上。
$\max \Psi(\omega)=\sum_{x, y} \widetilde{P}(x, y)\sum_{i=1}^n \omega_i f_i(x, y)-\sum_{x} \widetilde{P}(x) \log Z_{\omega}(x)$
$Z_\omega(x)=\sum_y \exp \left(\sum_{i=1}^n w_i f_i(x, y)\right)$

梯度下降法解最大熵模型

目标函数 $Q(\omega)=-\Psi(\omega)=\sum_x \widetilde{P}(x) \log \sum_y \exp \left(\sum_{i=1}^n \omega_i f_i(x, y)\right)-\sum_{x, y} \widetilde{P}(x, y) \sum_{i=1}^n \omega_i f_i(x, y)$

$\nabla Q(\omega)=\left(\frac{\partial Q(\omega)}{\partial \omega_1}, \frac{\partial Q(\omega)}{\partial \omega_2}, \cdots, \frac{\partial Q(\omega)}{\partial \omega_n}\right)^T$

$\begin{aligned} \frac{\partial Q(\omega)}{\partial \omega_i}&=\sum_x \widetilde{P}(x) \frac{\sum_y \exp \left(\sum_{i=1}^n \omega_i f_i(x, y)\right) \cdot f_i(x, y)}{\sum_y \exp \left(\sum_{i=1}^n \omega_i f_i(x, y)\right)}-\sum_{x, y} \widetilde{P}(x, y) f_i(x, y)\\ &=\sum_x \widetilde{P}(x) P_\omega(y \mid x) f_i(x, y)-E_{\widetilde{P}}\left(f_i\right), i=1,2, \cdots, n \end{aligned}$

拟牛顿法解最大熵模型

牛顿法

先浅谈一下牛顿法：牛顿法最初是为了求解方程的根。

一元

$x^{(k)},g(x^{(k)}))$ 处的切线
$y=g(x^{(k)})+g^{'}(x^{(k)})(x-x^{(k)})$
与 x 轴的交点
$\Rightarrow x=x^{(k)}-\frac{g(x^{(k)})}{g^{'}(x^{(k)})}$
求 $f (x)$ 的极值点，就是解 $g(x)=f^{'}(x)=0$ 的根
$x=x^{(k)}-\frac{g(x^{(k)})}{g^{'}(x^{(k)})}=x^{(k)}-\frac{f^{'}(x^{(k)})}{f^{''}(x^{(k)})}$

多元

$x^{(k+1)}=x^{(k)}-H_f^{-1}\left(x^{(k)}\right) \nabla f\left(x^{(k)}\right)$
这里的难点就在于要求出 「海森矩阵的逆」，但是如果数值计算量过大，由于是二阶偏导，那在计算过程中就会复杂很多，同时，如果海森矩阵的行列式为零，则计算不出逆矩阵，因此这时就需要 「拟牛顿法」出场了~搞清楚了牛顿法的难点，接着我们就看看有什么办法能「替代这个海森矩阵的逆」。

拟牛顿条件

牛顿法的实质其实是对它的目标函数 $f (x)$ 进行二阶泰勒展开，这里选择的点就是 $x^{(k)}$ ，这里另提一句，梯度下降法是通过一阶泰勒展开得到的哦。f对x求导是g
$\approx f\left(x^{(k)}\right)+g_k^T\left(x-x^{(k)}\right)+\frac{1}{2}\left(x-x^{(k)}\right)^T H\left(x^{(k)}\right)\left(x-x^{(k)}\right)$
$\begin{aligned} \frac{\partial f(x)}{\partial x} & \approx 0+g\left(x^{(k)}\right)+\frac{1}{2} \times 2 H\left(x^{(k)}\right)\left(x-x^{(k)}\right) \\ &=g_k+H_k\left(x-x^{(k)}\right) \end{aligned}$
$g\left(x^{(k+1)}\right)=g_k+H_k\left(x^{(k+1)}-x^{(k)}\right)$
「左式」是两个导函数的差值 $g_{k+1}-g_{k}=y_k$ ，「右式」是两个相邻迭代点之间的差值 $x^{(k+1)}-x^{(k)}=\delta_k$
于是可以写成
$y_k=H_k \delta_k$
或者
$H_k^{-1}y_k=\delta_k$
这两个式子成为拟牛顿条件。

拟牛顿法的合理性

合理性就不证明了，详情看(https://mp.weixin.qq.com/s/NmynLoYV23RCZPXFsYk6PA)

我们知道，拟牛顿法的核心就是为了找到替代品来取代求逆的海森矩阵，那么是不是意味着把这个替代品找到之后，就可以代入牛顿法去计算？
「其实不然！」

拟牛顿法可以看作牛顿法和梯度下降法的结合
$\begin{cases} 牛顿法:x^{(k+1)}=x^{(k)}-H^{-1}_kg_k\\ 梯度下降法:x^{(k+1)}=x^{(k)}+\lambda p_k ,\lambda是步长，p_k是搜索方向 \end{cases}$
拟牛顿法的迭代：步长这样确定 $\lambda=\argmin_{\lambda}f(x^{(k)}+\lambda p_k)$ ，搜索方向 $p_k=-H^{-1}_kg_k$

DFP算法

使用第二个拟牛顿条件就是DFP算法，推导过程如下

$P_ky_k=\delta_k \Rightarrow P_ky_k=\frac{\delta_k(\delta_k^Ty_k)}{\delta_k^Ty_k}=\frac{\delta_k\delta_k^Ty_k}{\delta_k^Ty_k} \Rightarrow P_k=\frac{\delta_k\delta_k^T}{\delta_k^Ty_k}$

$Q_ky_k=-G_ky_k \Rightarrow Q_ky_k=-\frac{G_ky_k(y_k^TG_ky_k)}{y_k^TG_ky_k} \Rightarrow Q_ky_k=-\frac{G_ky_ky_k^TG_ky_k}{y_k^TG_ky_k} \Rightarrow Q_k=-\frac{G_ky_ky_k^TG_k}{y_k^TG_ky_k}$

这里的 $G_{k+1}$ 就去替代 $H_{k+1}^{-1}$

DFP求解最大熵模型的完整过程：

BFGS算法

使用第一个拟牛顿条件就是BFGS算法，推导过程如下

这里的 $B_{k+1}$ 就去替代 $H_{k+1}$

BFGS求解最大熵模型的完整过程：

Broyden算法

改进的迭代尺度法IIS

思想：找 $\delta$ 使得 $L(\omega+\delta)>L(\omega)$

在“证明对偶函数得极大化=最大熵模型得极大似然估计”里有：
$\begin{aligned} L(\omega+\delta)-L(\omega)&=\sum_{x, y} \widetilde{P}(x, y) \log P_{\omega+\delta}(y \mid x)-\sum_{x, y} \widetilde{P}(x, y) \log P_\omega(y \mid x)\\ &=\sum_{x, y} \widetilde{P}(x, y) \sum_{i=1}^n \delta_i f_i(x, y)-\sum_x \widetilde{P}(x) \log \frac{Z_{\omega+\delta}(x)}{Z_\omega(x)}\\ &\ge \sum_{x, y} \widetilde{P}(x, y) \sum_{i=1}^n \delta_i f_i(x, y)-\sum_x\widetilde P(x)[1-{\frac{Z_{\omega+\delta}(x)}{Z_\omega(x)}}]\\ &=\sum_{x, y} \widetilde{P}(x, y) \sum_{i=1}^n \delta_i f_i(x, y)+1-\sum_x\widetilde P(x){\frac{Z_{\omega+\delta}(x)}{Z_\omega(x)}} \end{aligned}$
$\begin{aligned} \frac{Z_{\omega+\delta}(x)}{Z_\omega(x)}&=\frac{\sum_y \exp \left(\sum_{i=1}^n\left(\omega_i+\delta_i\right) f_i(x, y)\right)}{Z_\omega(x)}\\ &=\frac{\sum_y \exp \left(\sum_{i=1}^n \omega_i f_i(x, y)\right) \cdot \exp \left(\sum_{i=1}^n \delta_i f_i(x, y)\right)}{Z_\omega(x)}\\ &=\sum_y P_\omega(y \mid x) \exp \sum_{i=1}^n \delta_i f_i(x, y) \end{aligned}$

令不等式右边的式子
$A(\delta \mid \omega)=\sum_{x, y} \widetilde{P}(x, y) \sum_{i=1}^n \delta_i f_i(x, y)+1-\sum_x \widetilde{P}(x) \sum_y P_\omega(y \mid x) \exp \sum_{i=1}^n \delta_i f_i(x, y)$

IIS的真谛

1.找到 $A(\delta \mid \omega)$ ** 函数的下界**
引入：

可以得到如下
$\begin{cases} \begin{gathered} \frac{f_i(x, y)}{f^{\#}(x, y)} \geq 0 \\ \sum_i^n \frac{f_i(x, y)}{f^{\#}(x, y)}=1 \end{gathered} \end{cases}$

说明IIS是合理的

IIS求解最大熵模型的完整过程

sklearn没有实现最大熵

模型实现

import numpy as np
np.random.seed(10)


class MyMaxEntropy(object):
    def __init__(self, lr=0.0001):
        """
        最大熵模型的实现，为了方便理解，尽可能的将参数都存储为字典形式
        :param lr: 学习率，默认值为0.0001

        其他参数：
        :param w: 模型的参数，字典
        :param N: 样本数量
        :param label: 标签空间
        :param hat_p_x: 边缘分布P(X)的经验分布
        :param hat_p_x_y: 联合分布P(X,Y)的经验分布
        :param E_p: 特征函数f(x,y)关于模型P(X|Y)与经验分布hatP(X)的期望值
        :param E_hat_p: 特征函数f(x,y)关于经验分布hatP(X,Y)的期望值
        :param eps: 一个接近于0的正数极小值，这个值放在log的计算中，防止报错
        """
        self.lr = lr
        self.params = {'w': None}

        self.N = None
        self.label = None

        self.hat_p_x = {}
        self.hat_p_x_y = {}

        self.E_p = {}
        self.E_hat_p = {}

        self.eps = np.finfo(np.float32).eps


    def _init_params(self):
        """
        随机初始化模型参数w
        :return:
        """
        w = {}
        for key in self.hat_p_x_y.keys():
            w[key] = np.random.rand()
        self.params['w'] = w

    def _rebuild_X(self, X):
        """
        为了自变量的差异化处理，重新命名自变量
        :param X: 原始自变量
        :return:
        """
        X_result = []
        for x in X:
            X_result.append([y_s + '_' + x_s for x_s, y_s in zip(x, self.X_columns)])
        return X_result

    def _build_mapping(self, X, Y):
        """
        求取经验分布，参照公式(1)(2)
        :param X: 训练样本的输入值
        :param Y: 训练样本的输出值
        :return:
        """
        for x, y in zip(X, Y):
            for x_s in x:
                if x_s in self.hat_p_x.keys():
                    self.hat_p_x[x_s] += 1
                else:
                    self.hat_p_x[x_s] = 1
                if (x_s, y) in self.hat_p_x_y.keys():
                    self.hat_p_x_y[(x_s, y)] += 1
                else:
                    self.hat_p_x_y[(x_s, y)] = 1

        self.hat_p_x = {key: count / self.N for key, count in self.hat_p_x.items()}
        self.hat_p_x_y = {key: count / self.N for key, count in self.hat_p_x_y.items()}

    def _cal_E_hat_p(self):
        """
        计算特征函数f(x,y)关于经验分布hatP(X,Y)的期望值，参照公式(3)
        :return:
        """
        self.E_hat_p = self.hat_p_x_y


    def _cal_E_p(self, X):
        """
        计算特征函数f(x,y)关于模型P(X|Y)与经验分布hatP(X)的期望值，参照公式(4)
        :param X:
        :return:
        """
        for key in self.params['w'].keys():
            self.E_p[key] = 0
        for x in X:
            p_y_x = self._cal_prob(x)
            for x_s in x:
                for (p_y_x_s, y) in p_y_x:
                    if (x_s, y) not in self.E_p.keys():
                        continue
                    self.E_p[(x_s, y)] += (1/self.N) * p_y_x_s

    def _cal_p_y_x(self, x, y):
        """
        计算模型条件概率值，参照公式(9)的指数部分
        :param x: 单个样本的输入值
        :param y: 单个样本的输出值
        :return:
        """

        sum = 0.0
        for x_s in x:
            sum += self.params['w'].get((x_s, y), 0)
        return np.exp(sum), y


    def _cal_prob(self, x):
        """
        计算模型条件概率值，参照公式(9)
        :param x: 单个样本的输入值
        :return:
        """
        p_y_x = [(self._cal_p_y_x(x, y)) for y in self.label]
        sum_y = np.sum([p_y_x_s for p_y_x_s, y in p_y_x])
        return [(p_y_x_s / sum_y, y) for p_y_x_s, y in p_y_x]


    def fit(self, X, X_columns, Y, label, max_iter=20000):
        """
        模型训练入口
        :param X: 训练样本输入值
        :param X_columns: 训练样本的columns
        :param Y: 训练样本的输出值
        :param label: 训练样本的输出空间
        :param max_iter: 最大训练次数
        :return:
        """
        self.N = len(X)
        self.label = label
        self.X_columns = X_columns

        X = self._rebuild_X(X)

        self._build_mapping(X, Y)

        self._cal_E_hat_p()

        self._init_params()

        for iter in range(max_iter):

            self._cal_E_p(X)

            for key in self.params['w'].keys():
                sigma = self.lr * np.log(self.E_hat_p.get(key, self.eps) / self.E_p.get(key, self.eps))
                self.params['w'][key] += sigma

    def predict(self, X):
        """
        预测结果
        :param X: 样本
        :return:
        """
        X = self._rebuild_X(X)
        result_list = []

        for x in X:
            max_result = 0
            y_result = self.label[0]
            p_y_x = self._cal_prob(x)
            for (p_y_x_s, y) in p_y_x:
                if p_y_x_s > max_result:
                    max_result = p_y_x_s
                    y_result = y
            result_list.append((max_result, y_result))
        return result_list

模型测试

def run_my_model():
    data_set = [['youth', 'no', 'no', '1', 'refuse'],
               ['youth', 'no', 'no', '2', 'refuse'],
               ['youth', 'yes', 'no', '2', 'agree'],
               ['youth', 'yes', 'yes', '1', 'agree'],
               ['youth', 'no', 'no', '1', 'refuse'],
               ['mid', 'no', 'no', '1', 'refuse'],
               ['mid', 'no', 'no', '2', 'refuse'],
               ['mid', 'yes', 'yes', '2', 'agree'],
               ['mid', 'no', 'yes', '3', 'agree'],
               ['mid', 'no', 'yes', '3', 'agree'],
               ['elder', 'no', 'yes', '3', 'agree'],
               ['elder', 'no', 'yes', '2', 'agree'],
               ['elder', 'yes', 'no', '2', 'agree'],
               ['elder', 'yes', 'no', '3', 'agree'],
               ['elder', 'no', 'no', '1', 'refuse'],
               ]
    columns = ['age', 'working', 'house', 'credit_situation', 'label']
    X = [i[:-1] for i in data_set]
    X_columns = columns[:-1]
    Y = [i[-1] for i in data_set]
    print(X)
    print(Y)

    my = MyMaxEntropy()
    train_X = X[:12]
    test_X = X[12:]
    train_Y = Y[:12]
    test_Y = Y[12:]
    my.fit(train_X, X_columns, train_Y, label=['refuse', 'agree'])

    print(my.params)

    pred_Y= my.predict(test_X)
    print('result: ')
    print('test: ', test_Y)
    print('pred: ', pred_Y)

具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
python折半查找算法_python二分查找代码试用递归法编写python程序实现折半查找算法...
python二分查找算法函数bi_search(),该函数实现检回忆，很美却很伤；回忆只是回不到过去的记忆。输入格式:第一行为正整数n接下来若干行为待查找的数字，每行输入一个总是女人为了天长地久而烦恼，男人却可以洒脱地出乎意料。defprime(n):ifnend:return-1mid=(start+end)//2ifprimelist[mid]==prime:returnmidelifprim
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
python作业陈小铃子 python 开发语言
基础练习练习目标函数01.计算车费题目描述小红打车，起步价8元(3公里),每公里收费2元，她打车行驶了n公里，通过函数封装并计算车费输入描述输入一个公里数输出描述输出应付车费示例输入：5输出：12defcalculate_fare(distance):base_price=8#起步价per_km_cost=2#每公里费用min_distance=3#最小计费距离ifdistance0:sum_nu
【Python】(三）面试题和Py基础题戏精亿点点菜面试职场和发展 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程（Process）：进程是操作系统中资源分配的基本单位，是正在运行的程序的实例。每个进程都有自己的内存空间、文件描述符和执行上下文。管理：①查看进程：使用ps、top、htop等命令查看当前运行的进程。②启动进程：通过命令行或脚本启动新进程。③终止进程：使用kill命令发送信号终止进程，例如kill-9PI
python小工具：测内网服务器网速和延迟秃了也弱了。 python大家庭服务器 python java
文章目录一、使用1、代码2、使用3、注意事项一、使用1、代码importargparseimportsocketimporttimeimportsubprocessimportreimportsysdefmeasure_latency(host):#使用ping命令测量延迟try:#根据操作系统选择ping参数ifsys.platform.startswith('win'):output=subp
Python面试题-6 编织幻境的妖 python 服务器开发语言
1.请解释Python中的动态类型。Python中的动态类型Python是一种动态类型语言，这意味着你不需要在编程时声明变量的类型，而是在运行时自动推断类型。在Python中，变量的类型是在程序运行时决定的，这意味着同一个变量可以在不改变其类型的情形下被赋予不同类型的值。动态类型的优点在于它提高了编程的灵活性，因为你不需要预先确定数据的类型，可以更容易地写出简洁的代码。然而，这也可能导致运行时错误
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama（一）开源技术探险家开源模型-实际应用落地 #深度学习自然语言处理语言模型
一、前言在AI大模型百花齐放的时代，很多人都对新兴技术充满了热情，都想尝试一下。然而，实际上要入门AI技术的门槛非常高。除了需要高端设备，还需要面临复杂的部署和安装过程，这让很多人望而却步。在这样的背景下，Ollama的出现为广大开发者和爱好者提供了一条便捷的道路，极大地降低了应用机器学习的门槛。Ollama的优势在于其极致的简化。通过这个平台，用户可以轻松下载、运行和管理各种机器学习模型，而无需
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
Epoch 老兵发新帖人工智能
在深度学习和机器学习中，Epoch（轮次或周期）是一个核心训练概念，指模型在整个训练数据集上完成一次完整遍历的过程。以下是关于Epoch的详细解析：一、核心定义基本含义Epoch表示模型将所有训练数据完整学习一次的过程。例如：若训练集有10,000个样本，则1个Epoch即模型用这10,000个样本训练一轮。与相关概念的关系Batch（批次）：数据集被分割成的小组（如每批32个样本）。Iterat
火爆全网的条形竞赛图，Python轻松实现统计学家
image这个动图叫条形竞赛图，非常适合制作随时间变动的数据。我已经用streamlit+bar_chart_race实现了，然后白嫖了heroku的服务器，大家通过下面的网址上传csv格式的表格就可以轻松制作条形竞赛图，生成的视频可以保存本地。https://bar-chart-race-app.herokuapp.com/本文我将实现过程介绍一下，白嫖服务器+部署留在下期再讲。纯matplot
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
时序数据库在数据库领域的行业应用数据库管理艺术数据库时序数据库 ai
时序数据库在数据库领域的行业应用关键词：时序数据库、数据库领域、行业应用、时间序列数据、实时分析摘要：本文深入探讨了时序数据库在数据库领域的行业应用。首先介绍了时序数据库的背景知识，包括其目的、适用读者、文档结构和相关术语。接着阐述了时序数据库的核心概念、架构和工作原理，通过Python代码详细讲解了核心算法。还介绍了相关的数学模型和公式，并举例说明。在项目实战部分，给出了开发环境搭建、源代码实现
Python --- Day3 推导式及常见语句和内置函数的学习！！！
系列文章目录前言相信各位伙伴们在前俩次的文章和Python的基础学习中大有收获，这次我们将进入推导式，常见语句和内置函数的学习！跟着博主一起成为一名Ai的算法工程师！一、推导式用更简洁的方式创建列表、字典和集合。是Python特有的一种表达式形式。1.1列表推导式a=[1,2,3,4]result=[x*2forxina]#创建一个新列表，元素是原列表每个元素的两倍1.2字典推导式a=['a','
生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
cuda编程python接口_使用Python写CUDA程序的方法 weixin_39822184 cuda编程python接口
使用Python写CUDA程序有两种方式：*Numba*PyCUDAnumbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指
基于 Python 的网站信息探测工具设计与实现计算机毕业设计指导 python 网络服务器
基于Python的网站信息探测工具设计与实现摘要在渗透测试与网络安全评估中，信息探测是最基础且关键的一步。通过对目标网站的操作系统、服务器、CMS、端口、目录结构等信息进行自动化探测，可为后续攻击路径识别提供基础数据支撑。传统工具如WhatWeb、FOFA等虽功能强大，但在定制化与扩展性方面受限。本文设计并实现了一款基于Python的轻量级网站信息探测工具，支持URL/IP扫描、开放端口探测、CM
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
使用CrewAI创建一个研究团队 AI量化投资 php 开发语言多智能体智能体人工智能
本指导文档将带你一步步完成使用CrewAI框架创建你的第一个AI代理团队的过程。通过这个简单的示例，你将学习如何构建一个研究团队，用于研究和分析指定主题，并生成一份综合报告。本教程基于CrewAI官方文档，适合初学者快速上手。前提条件在开始之前，请确保你已完成以下准备工作：安装Python：确保你的系统安装了Python版本在3.10到3.13之间。你可以通过以下命令检查Python版本：pyth
Python成第四个支持CUDA的编程语言
Python成第四个支持CUDA的编程语言3月19日NVIDIA的GTC2013图形技术大会将开幕，在此之前会有很多宣传造势内容，其中最重大也是最主要的就是NVIDIA老总黄仁勋的开幕词了，其他合作伙伴也会发布各自的演讲。ContinuumAnalytics联合NVIDIA宣布将会引入新的PythonCUDA编译器——NumbaPro，Python也成为继C、C++以及Fortan之后的第四个支持
Python FastMCP：让你的AI工具链飞起来
PythonFastMCP：让你的AI工具链飞起来FastMCPFastMCP是什么？1.工具(Tools)：赋予LLM执行能力2.Resources（资源）：安全数据通道3.Prompts（提示模板）：标准化LLM交互4.组件协同：构建项目AI工具链5.部署架构与性能优化博主热门文章推荐：官方文档：FastMCP官方文档：https://gofastmcp.com/MCP协议规范：https:/
Python 解析 PDF 文件的基础方法电脑维修员xy python pdf 前端
```htmlPython解析PDF文件的基础方法Python解析PDF文件的基础方法在现代数据处理和信息提取任务中，PDF文件是一种常见的文档格式。然而，PDF文件的结构复杂且难以直接解析，尤其是当需要从中提取文本或数据时。幸运的是，Python提供了多种强大的库来帮助我们轻松地解析PDF文件。1.PyPDF2库PyPDF2是一个功能强大的Python库，用于处理PDF文件。它可以读取、分割、合
socket网络通信TCP与UDP原理及代码实现（c++、python）
目录Socket原理通信协议原理TCPUDP代码实现TCPC++pythonUDPC++pythonSocket原理Socket（套接字）是计算机网络中用于实现进程间通信的一种机制，特别是在不同主机之间通过网络进行数据传输时。它是网络编程的核心概念之一，为应用程序提供了统一的接口，使得开发者可以通过网络发送和接收数据。可以将Socket类比为电话系统中的“电话机”。两台设备通过Socket建立连接
【Qt Designer使用快捷键】
QtDesigner简介QtDesigner是Qt框架提供的可视化界面设计工具，用于快速创建GUI（图形用户界面）。用户可通过拖拽控件（如按钮、文本框等）设计界面，无需手动编写布局代码。生成的界面文件（.ui）可通过pyuic或uic工具转换为代码（如Python或C++），与业务逻辑集成。常用快捷键及用途通用操作Ctrl+N：新建界面文件。Ctrl+O：打开现有.ui文件。Ctrl+S：保存当前
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
假冒朱民！通达OA社科院朱民ST-balance项目就是假的，被骗亏损真相揭秘，亲身亏损经历正义青天
通达OA社科院朱民ST-balance项目不正规——杀猪盘不能提现投票骗局曝光！随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu