端坐的小王子

MCMC详解2——MCMC采样、M-H采样、Gibbs采样（附代码）

MCMC是一种随机采样方法，用来处理一些复杂运算的近似求解。在HMM、LDA等模型中都有重要应用。
上一篇 MCMC详解1——蒙特卡洛方法

上一篇总结了求解复杂函数的积分问题，通过蒙特卡洛方法转化为了采集符合概率密度分布的样本求均值的问题，然后总结了拒绝-接受采样方法，但是该方法有个弊端，高纬度数据难以采样以及效率问题。本篇总结MCMC采样方法来解决这两个问题。

1，马尔科夫链模型

马尔科夫链的定义本身比较简单：某一时刻的状态转移概率只依赖与前一时刻。数学语言描述如下：
假设序列的状态为 $X_{t-1},X_{t},X_{t+1},...$ 那么在 $t + 1$ 时刻的状态概率只依赖与 $t$ 时刻：
$P(X_{t+1}|...,X_{t-2},X_{t-1},X_{t})=P(X_{t+1}|X_{t})$

既然某一时刻状态转移的概率只依赖于它的前一个状态，那么我们只要能求出系统中任意两个状态之间的转换概率，这个马尔科夫链的模型就定下来了，转移概率组成的矩阵P，我们称为状态转移矩阵。

那么马尔科夫链的转移矩阵与蒙特卡洛方法所需要的概率分布什么关系呢？ 这要从马尔科夫链的状态转移矩阵的性质讲起。

1.1 马尔科夫链转移矩阵的性质

1）不同的初始状态经过多次P状态转移后，保持稳定不变相同状态。即不同的初始概率分布样本经过多次转移矩阵后会稳定到同一个概率分布。

比如，P=[[0.9,0.075,0.025],[0.15,0.8,0.05],[0.25,0.25,0.5]]，初始状态[[0.3,0.4,0.3]]或者[[0.7,0.1,0.2]]在经过多次状态转移以后的结果都是[[ 0.625 0.3125 0.0625]]

那么重点来了：如果我们得到这个稳定概率分布对应的马尔科夫模型的状态转移矩阵P，则我们可以用任意的概率分布样本开始，带入马尔科夫模型，经过一系列的转换，就可以得到符合我们对应稳定概率分布的样本。

2）同时对于一个确定的状态转移矩阵P，它的n次幂 $P^n$ ，当n大于一定值的时候，也是稳定不变的。同时这个稳定的分布与1）所述的分布是一致的。

比如：还是上面的例子， $p^n$ 在n足够大的时候，该矩阵的每一行都是[[ 0.625 0.3125 0.0625]]

总结一下马尔科夫链转移矩阵的性质如下：
1）状态转移矩阵p，它的n次幂，将会稳定下来。矩阵的每一行都是稳定的序列，所以其只与j相关

$lim_{n\rightarrow \infty}P^n=\begin{gathered} \begin{pmatrix} \pi(1) & \pi(2) & ... & \pi(j) & ... \\ \pi(1) & \pi(2) & ... & \pi(j) & ... \\ ... &... &... &... &... & \\ \pi(1) & \pi(2) & ... & \pi(j) & ... \\ \end{pmatrix} \end{gathered}$ $lim_{n\rightarrow \infty}P_{ij}^n=\pi(j)$

将矩阵P看作是 $\pi$ 的组合：
$\pi(j)=\sum_{i=0}^{\infty}\pi(i)P_{ij}$
$\pi$ 是方程 $\pi P=\pi$ 的唯一非负解，通常称为马尔科夫链的平稳分布,其中：
$\pi=[\pi(1),\pi(2),...,\pi(j),...] ,\\ \sum_{i=0}^{\infty}\pi(i)=1$

1.2 马尔科夫链的采样思路

假设我们任意概率分布式 $p_0(x)$ ，经过n次马尔科夫状态转移后是 $p_n(x)$ ，之后是平稳分布：
$\pi_n(x)=\pi_{n+1}(x)=\pi_{n+2}(x)=...=\pi(x)$
对于每个 $\pi_i(x)$ 我们有：
$\pi_i(x)=\pi_{i-1}(x)P=\pi_{i-2}(x)P^2=\pi_0(x)P^i$

现在我们来描述采样过程： 首先基于任何初始分布比如均匀分布、高斯分布 $p_0(x)$ 等采样得到状态值 $x_0$ ，然后基于条件概率 $p(x|x_0)$ 采样状态值 $x_1$ ，一致进行下去，当状态转移达到一定的次数n，达到平稳，此时再次采样得到m个样本，即是符合我们的平稳分布的对应样本集。然后就可以用来做蒙特卡洛模拟求和了。

注：采样过程中有几个地方要解释
1）什么是条件概率 $p(x|x_0)$ ？p是状态转移概率，基于每个状态x0，都有相应的转移概率，可以认为 $p(x|x_0)$ 就是矩阵p的某一行。

2）每一步是怎么采样的？假设我们初始状态[0.1,0.8]两个，选取均匀采样，采样结果为两个状态中的某一个，比如状态1为0.1，此时，根据转移矩阵p = [[0.4,0.6],[0.3,0.7]]中状态1的条件概率 $p(x|x_0)$ ，即状态1情况下的其他状态的转移概率，进行采样，此时较大的概率（0.6）选取状态2，那么这一步采集了一个样本，相当于完成了一次状态转移，因为此时样本的概率分布已经经过P改变，不再是均匀分布，依次采样，在第n次后，分布平稳，再次采集m个样本，就是我们需要的符合分布的样本集。

3）整个过程本身，并没有改变状态内容，只是改变了状态分布，这里的状态，理解成坐标也没问题。

到此为止，我们知道，获得马尔科夫链的转移矩阵，就能得到我们需要的样本集，甚至我们也知道了采样方法。但是如何根据我们知道的平稳分布p(z)得到马尔科夫状态转移矩阵呢？这个问题还是没有解决这里就用到MCMC采样，以及其改进版M-H采样和Gibbs采样。

1.3 MCMC采样

马尔科夫链的细致平稳条件：我们知道非周期马尔科夫链经过多次转移后，变得平稳：
$\pi(i)P(i,j)=\pi(j)P(j,i)$

矩阵表示为：
$\pi P=\pi$

从以上公式可以看到，只要我们找到了可以使概率分布 $\pi(x)$ 满足该细致平稳分布的矩阵即可，这里就是一条寻找状态转移矩阵P的思路。

但是一般情况下，目标平稳分布 $\pi(x)$ ，随便找个马尔科夫转移矩阵是不满足以上条件的：
$\pi(i)Q(i,j)\not =\pi(j)Q(j,i)$
怎么办呢？我们需要对上述公式进行改造:
$\pi(i)Q(i,j)\alpha(i,j) =\pi(j)Q(j,i)\alpha(j,i)\\ \alpha(i,j) =\pi(j)Q(j,i)\\ \alpha(j,i)=\pi(i)Q(i,j)$
这样我们就得到分布p对应的马尔科夫状态转移矩阵P了！！！
$P(i,j)=Q(i,j)\alpha(i,j)$

我们的目标矩阵p可以通过任意的马尔科夫状态转移矩阵Q，乘以alpha获得，这里可以将alpha理解为接受率，可以类比拒绝-接受采样中的方法。那里是常见分布通过一定的拒绝-接受得到一个非常见分布，这里是一个常见的马尔科夫链状态转移矩阵Q通过一定的拒绝接受概率得到目标转移矩阵，通过这种方法，得到P（的分布）。

MCMC的采样过程如下：
1）输入我们任意选定的马尔科夫链状态转移矩阵Q，平稳分布 $\pi(x)$ ,设定状态转移次数 $n 1$ ,需要的样本个数 $n 2$
2）从任意的概率分布找那个采样得到初始状态值 $x_0$
3）for t=0 to n_1 + n_2 -1:
a）从条件概率分布 $Q(x|x_t)$ 中采样的得到样本 $x_*$
b）从均匀分布采样 $u\sim uniform[0,1]$
c）如果 $u<\alpha(x_t,x_*)=\pi(x_*)Q(x_*,x_t)$ ，则接受转移 $x_t\rightarrow x_*$ ，即 $x_{t+1}=x_*$
d)否则不接受转移，即 $x_{t+1}=x_t$
最后得到我们需要的平稳分布对应的样本集 $x_{n_1},x_{n_1+1},...,x_{n_1+n_2-1})$

以上过程已经解决了样本集采样问题，有了完整的理论，但是距离实际应用还有距离，因为在接受概率alpha可能非常小，采样值容易拒绝转移，效率低，难收敛。

1.4 M-H采样

M-H采样是Metropolis-Hastings采样的简称，这个算法首先由Metropolis提出，被Hastings改进，因此被称之为Metropolis-Hastings采样或M-H采样。

MCMC采样讲到效率问题，其根本是 $\alpha$ 这个接受概率可能太小，导致采样效率低。
$\pi(i)Q(i,j)\alpha(i,j) =\pi(j)Q(j,i)\alpha(j,i)$

假设 $\alpha(i,j) = 0.1, \alpha(j,i) = 0.2$
$\pi(i)P(i,j)*0.1=\pi(j)P(j,i)*0.2$

同时扩大5倍，等式仍然成立
$\pi(i)P(i,j)*0.5=\pi(j)P(j,i)*1$

我们的目的是让等式成立就行，所以，这里进行了一下改进,将alpha进行归一化:
$\alpha(i,j)=min\{\frac{\pi(j)Q(j,i)}{\pi(i)Q(i,j)},1\}$

M-H的采样过程如下：
1）输入我们任意选定的马尔科夫链状态转移矩阵Q，平稳分布 $\pi(x)$ ,设定状态转移次数 $n 1$ ,需要的样本个数 $n 2$
2）从任意的概率分布找那个采样得到初始状态值 $x_0$
3）for t=0 to n_1 + n_2 -1:
a）从条件概率分布 $Q(x|x_t)$ 中采样的得到样本 $x_*$
b）从均匀分布采样 $u\sim uniform[0,1]$
c）如果 $u<\alpha(x_t,x_*)=min\{\frac{\pi(j)Q(j,i)}{\pi(i)Q(i,j)},1\}$ ，则接受转移 $x_t\rightarrow x_*$ ，即 $x_{t+1}=x_*$
d)否则不接受转移，即 $x_{t+1}=x_t$
最后得到我们需要的平稳分布对应的样本集 $x_{n_1},x_{n_1+1},...,x_{n_1+n_2-1})$

# 在例子里，我们的目标平稳分布是一个均值3，标准差2的正态分布，
# 选择的马尔可夫链状态转移矩阵Q(i,j)的条件转移概率是以i为均值,方差1的正态分布在位置j的值。
# 这个例子仅仅用来让大家加深对M-H采样过程的理解。毕竟一个普通的一维正态分布用不着去用M-H采样来获得样本。
import random
from scipy.stats import norm
import matplotlib.pyplot as plt


def norm_dist_prob(theta):
    y = norm.pdf(theta, loc=3, scale=2)#均值为3、方差为2的高斯分布的概率密度函数，返回其在theta处的值。
    return y

T = 5000                                #采样次数
pi = [0 for i in range(T)]              #每次采样的结果
sigma = 1                               #转移矩阵分布参数
t = 0                                   #采样次数初始化
while t < T-1:
    t = t + 1
    # rvs 产生服从指定分布的随机数
    pi_star = norm.rvs(loc=pi[t - 1], scale=sigma, size=1, random_state=None)   #根据转移矩阵进行采样
    alpha = min(1, (norm_dist_prob(pi_star[0]) / norm_dist_prob(pi[t - 1])))    #计算拒绝-接受参数,Q相同，这里忽略

    u = random.uniform(0, 1)
    if u < alpha:
        pi[t] = pi_star[0]              # 接受
    else:
        pi[t] = pi[t - 1]               # 拒绝

plt.scatter(pi, norm.pdf(pi, loc=3, scale=2))
num_bins = 50
plt.hist(pi, num_bins, normed=1, facecolor='red', alpha=0.7)
plt.show()

M-H采样解决了使用蒙特卡洛方法需要的任意概率分布样本集的问题，得到了广泛的应用。

但是仍然面临着两大难题：
1）还是拒绝概率问题，如果特征非常多，那么算法效率是比较低的，是否能做到不拒绝的转移方法？
2）当特征很多的时候，我们很难求出目标的联合分布，但是可以方便求出各特征之间的条件概率分布（每次采样按照一个维度采），是否能在只具备各维度之间条件概率分布的情况下采样呢？

1.5 Gibbs采样

上一节提到多维数据分布的采样难题，本节来解决：

在M-H中使用接受率使细致平稳条件满足，现在换一个思路：

从二维数据分布开始，假设 $p_1(x_1,x_2)$ 是一个二维联合数据分布，假设有两个点， $A(x_1^{(1)},x_2^{(1)})$ , $B(x_1^{(1)},x_2^{(2)})$ ,则 $\pi(A)\pi(x_2^{(2)}|x_1^{(1)})=\pi(B)\pi(x_2^{(1)}|x_1^{(1)})$ 为什么呢？
$\pi(x_1^{(1)},x_2^{(1)})\pi(x_2^{(2)}|x_1^{(1)})=\pi(x_1^{(1)})\pi(x_2^{(1)}|\pi(x_1^{(1)})\pi(x_2^{(2)}|x_1^{(1)})\\ \pi(x_1^{(1)},x_2^{(2)})\pi(x_2^{(1)}|x_1^{(1)})=\pi(x_1^{(1)})\pi(x_2^{(2)}|\pi(x_1^{(1)})\pi(x_2^{(1)}|x_1^{(1)})$
上式右边相等，所以等式成立。
$\pi(A)\pi(x_2^{(2)}|x_1^{(1)})=\pi(B)\pi(x_2^{(1)}|x_1^{(1)})$

$P_i(A)$ 表示A点两个特征的联合分布， $p_i（x_2^{(2)}|x_1^{(1)}）$ 为 $x_1^{(1)}$ 条件下的分布。

现在 $x_1=x_1^{(1)}$ 这条直线上（看作是特征维度1在某个具体特征值上），在如果把条件概率分布 $\pi(x_2|x_1^{(1)})$ 看作是马尔科夫链的状态转移概率，则任意两个点之间的转移满足细致平稳条件，同理，在 $x_2=x_2^{(1)}$ 这个轴上也成立。基于以上发现，我们可以构造分布 $\pi(x_1,x_2)$ 的马尔科夫链的状态转移矩阵P。
$P(A\rightarrow B)=\pi(x_2^{(B)}|x_1^{(1)}) \quad if \; x_1^{(A)}=x_1^{(B)}=x_1^{(1)} \\ P(A\rightarrow C)=\pi(x_1^{(C)}|x_2^{(1)}) \quad if \; x_2^{(A)}=x_2^{(C)}=x_2^{(1)} \\ P(A \rightarrow D)=0 \quad else$

有了上面这个状态转移矩阵，我们很容易验证平面上的任意两点E,F满足细致平稳条件：
$\pi(E)P(E \rightarrow F)=\pi(F)P(F\rightarrow E)$

我们来看下Gibbs二维采样的步骤：
1）输入平稳分布 $\pi(x_1,x_2)$ 设定状态转移次数阈值 $n_1$ ，需要的样本个数 $n_2$
2）随机初始化初始状态 $x_1^{(0)}$ 和 $x_2^{(0)}$
3）for t=0 to n1+n2-1:
a）从条件概率分布 $P(x_2|x_1^{(t)})$ 中采样得到样本 $x_2^{t+1}$
b) 从条件概率分布 $P(x_1|x_2^{(t+1)})$ 中采样得到样本 $x_1^{t+1}$
样本集 ${(x_1^{(n_1)},x_2^{(n_1)}),(x_1^{(n_1+1)},x_2^{(n_1+1)}),...,(x_1^{(n_1+2)},x_2^{(n_1+2)})\}$ 即我们要的平稳分布对应的样本集。

采样过程是通过轮换改变坐标轴实现的，当然这不是必须的，但是一般是这样做。以上过程亦可以推广到多维Gibbs采样。

例子：
假设我们要采样的是一个二维正太分布 $Normal(u,\Sigma)$ ,其中
$u = (u_1,u_2)=(5,-1)$ $\Sigma=\begin{gathered} \begin{pmatrix} \sigma^2_1 & \rho\sigma_1\sigma_2 \\ \rho\sigma_1\sigma_2 & \sigma^2_2\\ \end{pmatrix} \end{gathered}= \begin{gathered} \begin{pmatrix} 1 & 1 \\ 1 & 4\\ \end{pmatrix} \end{gathered}$
状态转移条件分布为：
$P(x_2|x_1)=Norm(u+\rho \sigma_1 /\sigma_2(x_2-u_2),(1-\rho^2)\sigma_1^2)\\ P(x_1|x_2)=Norm(u+\rho \sigma_2 /\sigma_1(x_1-u_1),(1-\rho^2)\sigma_2^2)\\$

import random
import math
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from scipy.stats import multivariate_normal

samplesource = multivariate_normal(mean=[5,-1], cov=[[1,0.5],[0.5,2]])
#条件概率分布采样函数
def p_ygivenx(x, m1, m2, s1, s2):
    return (random.normalvariate(m2 + rho * s2 / s1 * (x - m1), math.sqrt(1 - rho ** 2) * s2))

def p_xgiveny(y, m1, m2, s1, s2):
    return (random.normalvariate(m1 + rho * s1 / s2 * (y - m2), math.sqrt(1 - rho ** 2) * s1))

N = 5000                                    #采样次数
K = 20
x_res = []                                  #采样样本x维度
y_res = []                                  #采样样本y维度
z_res = []                                  #采样样本z维度
m1 = 5                                      #均值u1
m2 = -1                                     #均值u2
s1 = 1                                      #方差s1
s2 = 2                                      #方差s2

rho = 0.5                                   #参数设置
y = m2

for i in range(N):
    for j in range(K):
        x = p_xgiveny(y, m1, m2, s1, s2)    #x轴根据条件概率采样
        y = p_ygivenx(x, m1, m2, s1, s2)    #y轴根据条件概率采样
        z = samplesource.pdf([x,y])         #z轴根据条件概率采样
        x_res.append(x)
        y_res.append(y)
        z_res.append(z)

num_bins = 50
plt.hist(x_res, num_bins, normed=1, facecolor='green', alpha=0.5)
plt.hist(y_res, num_bins, normed=1, facecolor='red', alpha=0.5)
plt.title('Histogram')
plt.show()

# 样本生成的二维正太分布图

fig = plt.figure()
ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=30, azim=20)
ax.scatter(x_res, y_res, z_res,marker='o')
plt.show()

两个维度的采样分布如下：

二维分布如下：

由于Gibbs采样在高维特征时的优势，目前我们通常意义上的MCMC采样都是用的Gibbs采样。当然Gibbs采样是从M-H采样的基础上的进化而来的，同时Gibbs采样要求数据至少有两个维度，一维概率分布的采样是没法用Gibbs采样的,这时M-H采样仍然成立。

Gibbs采样是一种多维数据分布的样本集采样方法，Gibbs的采样理论是基于马尔科夫链的平稳分布条件得到的。具体的，将两点之间相同维度值的条件概率作为两数据点之间的转移概率，进行状态转移计算，轮换坐标轴采样，相应的得到本次转移的采样样本，所以，对于Gibbs采样而言，获取条件概率是必须的。

2，总结

我们来回忆一下整个问题。
1）很多时候，我们对一个分布并不感兴趣，感兴趣的是它的期望，所以我们会对一个连续函数 $f (x)$ 求积分，但是积分需要知道 $f (x)$ 的原函数，可是很多时候原函数很难求的，然后我们想到一个办法，根据x的概率分布函数采样，然后求期望值得到近似结果。——蒙特卡洛方法

2）好了，我们换了一条路，通过对x的概率密度分布函数 $p (x)$ 采样，解决了 $f (x)$ 原函数不好求解的问题，很多时候概率密度分布函数是先验的，比如掷硬币。但是另一个问题，如何采样？最简单的，我们通过一个常见函数 $g (x)$ 覆盖目标函数 $p (x)$ ，先对常见函数采样，然后按照一定的概率接受这个样本。——拒绝-接受采样

3）ok，我们看似解决了整个问题，但是拒绝-接受采样需要先找到一个可行的 $g (x)$ ，在很多时候是比较困难的，而且不能处理多维数据采样问题，很多应用都是多维的。MCMC采样可以解决这个问题。根据MCMC平稳分布条件，我们知道，状态经过n次转移后，其概率分布不在变化，那么很明显，如果我们能得到使得状态能够平稳分布在目标分布 $p (x)$ 的转移概率P，随意初始化样本，经过多次采样，就可以得到 $p (x)$ 分布样本集。——MCMC

4）直接对 $p (x)$ 采样的思路有了，那么如何得到合适的转移矩阵P呢？对任意一个转移矩阵Q添加一个可以使平稳分布成立的 $\alpha$ 因子，我们就能得到想要的转移矩阵P，因此我们得到了MCMC采样方法。——MCMC采样

5）MCMC采样虽然可以完成采样任务，但是效率并不高，因为接受概率 $\alpha$ 因子比较小，在可以转移的两个样本之间 $\alpha$ 因子进行放大，保持等式成立的同时，增加了采样效率。——M-H采样

6）但是，我们还有一个最根本的问题。多维采样怎么处理？以上采样方法，只适合单一维度的函数采样，因为我们很难得到多维数据的联合分布状态转移矩阵，没关系，单一维度一样可以实现多维数据采样，只要我们从一个点的某一个轴开始，按照该参数轴上该点对另一个点的条件概率分布采样，就能得到另一个点的样本，多轴依次轮转，分别得到各个维度的采样值。而且同时我们每一次采样都是接受的，效率也很高。——Gibbs采样

至此，完美实现了概率密度函数 $p (x)$ 采样问题，也顺利解决了积分或者求期望问题。

上一篇 MCMC详解1——蒙特卡洛方法

（本文参考了刘建平老师的博客，加入了一些自己的一些理解，有兴趣的可以去拜读原文）

Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
2024大模型秋招LLM相关面试题整理 AGI大模型资料分享官人工智能深度学习机器学习自然语言处理语言模型 easyui
0一些基础术语大模型：一般指1亿以上参数的模型，但是这个标准一直在升级，目前万亿参数以上的模型也有了。大语言模型（LargeLanguageModel，LLM）是针对语言的大模型。175B、60B、540B等：这些一般指参数的个数，B是Billion/十亿的意思，175B是1750亿参数，这是ChatGPT大约的参数规模。强化学习：（ReinforcementLearning）一种机器学习的方法，
【python实用小脚本-127】基于 Python 的 Google 图片爬取工具：实现高效图片数据收集 Kyln.Wu Python python 开发语言
引言在数据科学、机器学习和多媒体应用中，图片数据的收集是一个常见且重要的任务。Google图片是一个丰富的图片资源库，能够为各种项目提供大量的图片数据。本文将介绍一个基于Python的Google图片爬取工具，它能够自动化地从Google图片搜索结果中下载图片。该工具主要利用了Python的selenium、BeautifulSoup、urllib和argparse库，结合了网页自动化和数据解析技
【Python爬虫进阶】从网页抓取到数据清洗与存储——完整实战教程 Python爬虫项目 python 爬虫开发语言 javascript 自然语言处理 selenium
1.为什么网页抓取后需要数据清洗？在实际项目中，抓取的原始数据往往是杂乱的、不完整的、格式各异的。如果不清洗，直接用来建模、分析，会导致：脏数据干扰（如乱码、重复数据）异常值影响结果（如薪资异常高）格式不统一（比如地点有中文名和英文名混杂）所以，抓取数据后，必须进行系统清洗与标准化，才能用于后续的：数据分析可视化展示机器学习建模2.项目概览：从抓取到存储的完整流程本项目流程如下：确定抓取目标（某招
验证码破解的可能与不可能：用Python处理图片验证码的原理与限制程序员威哥 python 开发语言
前言验证码（CAPTCHA）是当前互联网防护机制中的重要组成部分，用于区分真人与自动程序。近年来，随着自动化技术发展，验证码破解成为自动化测试、爬虫及安全研究领域的热点。然而，从技术层面来看，验证码破解既有可行之处，也存在根本限制。本文将结合Python图像处理与机器学习技术，深度剖析图片验证码破解的原理、实践与瓶颈。一、验证码的分类及破解难点1.验证码类型字符型验证码纯数字、字母或混合，最常见。
flask部署机器学习_如何开发端到端机器学习项目并使用Flask将其部署到Heroku cumichun6193 大数据 python 机器学习人工智能深度学习
flask部署机器学习There'sonequestionIalwaysgetaskedregardingDataScience:关于数据科学，我经常被问到一个问题：WhatisthebestwaytomasterDataScience?Whatwillgetmehired?掌握数据科学的最佳方法是什么？什么会雇用我？Myanswerremainsconstant:Thereisnoalterna
人工智能赋能气象气候：从数据智能到预测创新的融合之路慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：气象气候与AI的“天然耦合”气象与气候系统是典型的复杂、多尺度、强非线性的自然系统，其建模、分析与预测依赖庞大观测数据和高性能计算资源。传统方法以数值天气预报（NWP）与物理建模为核心，虽然取得重要成就，但也面临计算代价大、精度不足、长期预测偏差大等瓶颈。与此同时，人工智能（AI），尤其是以深度学习为代表的机器学习方法，近年来在图像识别、自
【机器学习|学习笔记】类别特征（Categorical Features）处理方法，附代码。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记神经网络人工智能深度学习
【机器学习|学习笔记】类别特征（CategoricalFeatures）处理方法，附代码。【机器学习|学习笔记】类别特征（CategoricalFeatures）处理方法，附代码。文章目录【机器学习|学习笔记】类别特征（CategoricalFeatures）处理方法，附代码。前言✅为什么要处理类别特征？原因1：大多数模型不能处理字符串原因2：避免“错误的顺序假设”原因3：方便模型泛化与特征交互✅
Python中使用Graphviz绘制决策树图解黃昱儒
本文还有配套的精品资源，点击获取简介：Graphviz是一款用于数据可视化和算法流程展示的图形绘制软件，特别适用于Python中绘制决策树和其他图形类型。本安装包包含Graphviz安装程序和配置指南，以及如何在Python中利用pydot库等第三方库进行图形绘制的详细步骤。通过配置环境变量和利用DOT语言，用户可以将决策树模型转换为可视化图形，加深对机器学习模型的理解和调试。1.Graphviz
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
大数据开发高频面试题：Spark与MapReduce解析
被招网约司机的盯上了好几天实习了六个月，到期被通知不能转正。外包裁员让我去友商我该去吗？offer比较华为状态码浏览器插件嵌入式项目推荐2019秋招总结+云从语音算法面经+银行群面面经科大讯飞语音算法面经语音算法美团一面已挂科大讯飞智能语音方向值得去吗？语音算法oc科大讯飞语音算法二面荣耀一面语音算法面经，已挂荣耀_语音算法工程一面科大讯飞语音一面凉经8.18携程机器学习（语音方向）一面【vivo
Python与Dlib库实现人脸技术实战西域情歌
本文还有配套的精品资源，点击获取简介：本项目详细说明了如何使用Python结合Dlib库实现人脸检测、识别、数量检测和距离检测。利用Dlib提供的机器学习算法和计算机视觉功能，包括HOG特征检测、级联分类器、面部特征向量模型和关键点预测等，项目能够快速准确地在图像中检测和识别人脸。此外，还介绍了如何统计图像中的人脸数量以及如何计算人脸之间的距离。通过实际代码资源，开发者能够掌握实时人脸技术的应用，
【Python】已解决：Traceback (most recent call last): File “C:/python/kfc.py”, line 8, in KfcError: KFC Cra 屿小夏 python c语言开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Orange3机器学习建模和可视化分析数据预处理、特征工程、算法训练维度软件库测试工具开源软件电脑
各位数据挖掘爱好者们！今天给你们介绍一款超厉害的开源软件——Orange3。它就像一个神奇的工具箱，你只要通过拖放组件就能完成机器学习建模和可视化分析，软件下载地址安装包它支持数据预处理、特征工程、算法训练和评估整个流程，就像一个贴心的管家，把数据挖掘的事儿全给你安排得明明白白！它还内置了箱线图、决策树这些可视化工具，能直观地把数据分布和模型结构展示出来，就像给你开了个透视眼，让数据一目了然！这软
KNN（K-近邻算法)(上)--day05 扫把星133 机器学习 python 人工智能近邻算法算法
KNN（K-NearestNeighbors，K近邻算法）是一种用于分类和回归的非参数化方法。其基本思想是通过找出与新样本最接近的已标记数据中的K个最近邻居来进行预测或分类。注释：非参数化方法是指在统计学和机器学习中，不对数据分布做出严格假设（这些假设通常包括
蚁群算法原理与应用详解
本文还有配套的精品资源，点击获取简介：蚁群算法是一种基于蚂蚁寻找食物路径行为的优化算法，它能够有效解决包括旅行商问题、网络路由和多目标优化在内的复杂问题。该算法模拟蚂蚁释放信息素来找到最短路径的过程，通过模拟蚂蚁的行为，算法逐步优化选择路径。蚁群算法具有并行性和全局优化能力，但也面临早熟收敛和参数调整的挑战。它已成功应用于物流优化、通信网络、任务调度、机器学习、图像处理和生物医学等众多领域。1.蚁
Python 解析 AI 在金融风控中的应用案例浮世清欢ai python 人工智能开发语言
```htmlPython解析AI在金融风控中的应用案例Python解析AI在金融风控中的应用案例在当今快速发展的金融科技领域，人工智能（AI）的应用正在改变传统的金融风险管理方式。通过使用Python编程语言和各种机器学习库，金融机构能够更准确地识别潜在风险，提高决策效率。本文将探讨几个具体的AI在金融风控中的应用案例，并展示如何利用Python实现这些功能。案例一：信用评分模型信用评分是金融风
机器学习算法_支持向量机
一、支持向量机支持向量机只能做二分类任务SVM全称支持向量机，即寻找到一个超平面使样本分成两类，且间隔最大硬间隔：如果样本线性可分，在所有样本分类都正确的情况下，寻找最大间隔；如果出现异常值或样本线性不可分，此时硬间隔无法实现软间隔：允许部分样本，在最大间隔之内，甚至在错误的一边，寻找最大间隔；目标是尽可能保持间隔宽阔和限制间隔违例之间寻找良好的平衡惩罚系数：通过惩罚系数来控制这个平衡，C值越小，
深度探索：机器学习中的条件生成对抗网络（Conditional GAN, CGAN）算法原理及其应用
目录1.引言与背景2.CGAN定理3.算法原理4.算法实现5.优缺点分析优点：缺点：6.案例应用7.对比与其他算法8.结论与展望1.引言与背景生成对抗网络（GenerativeAdversarialNetworks,GANs）作为一种深度学习框架，在无监督学习领域展现出强大的能力，特别在图像、音频、文本等复杂数据的生成任务中取得了显著成果。然而，原始GAN模型在生成过程中缺乏对生成样本特定属性的直
GEE数据集：全球地下水生态系统 (GDEs)数据集（30m分辨率）此星光明 GEE数据集专栏数据库人工智能 gee 地下水水数据集全球
目录地下水的全球生态系统(GDEs)简介代码代码链接APP链接结果引用许可网址推荐0代码在线构建地图应用机器学习地下水的全球生态系统(GDEs)简介地下水是最广泛的液态淡水来源，但它在支持多样化生态系统方面的关键作用却往往不被人们所认识。在许多地区，依赖地下水的生态系统（GDEs）的位置和范围在很大程度上仍不为人所知，导致保护措施不足。该数据集提供了一张高分辨率（约30米）的GDEs地图，揭示了全
农业物联网平台中的灌溉系统研究 sj52abcd 农业物联网和人工智能物联网数据分析 python 大数据毕业设计
研究目的本研究旨在开发一个基于Python语言的农业物联网平台，整合土壤墒情监测与精准灌溉系统，通过现代信息技术手段实现农业生产的智能化管理。系统将采用Python作为主要开发语言，结合MySQL数据库进行数据存储与管理，利用ECharts.js实现数据可视化展示，并引入机器学习和强化学习算法优化灌溉决策。具体目标包括：1)构建实时土壤墒情监测网络，通过物联网传感器采集土壤温湿度、电导率等关键参数
[读论文] Towards Machine Learning for Placement and Routing in Chip Design: a Methodological Overview SP FA #EDA+AI 机器学习人工智能
Abstract在现代芯片设计流程中，放置和布线是两个不可或缺且具有挑战性的NP-hard问题。与使用启发式算法或专家精心设计的算法的传统求解器相比，机器学习凭借其数据驱动的性质显示出了广阔的前景，它可以减少对知识和先验的依赖，并且通过其先进的计算范式具有更大的可扩展性(例如GPU加速的深度网络)。本调查首先介绍了基本的布局（Placement）和布线（Routing），并简要介绍了经典的无学习解
机器学习路径规划中的 net 和 netlist 分别是什么？勤奋的大熊猫 Machine Learning 机器学习人工智能自动寻路
机器学习路径规划中的net是什么？引言正文net含义netlist含义引言当我们使用机器学习训练自己的模型来进行自动寻路时，通常，我们会遇到一个名为net的词语，这里我们将对这个单词的意思进行解释。正文net含义net:中文翻译为网络，在机器学习中其中文应该翻译为连线任务。通常在连线任务中我们需要将给定的两个端点连接起来。比如给定的端点为：self.netlist=[('mmi:out1','mm
编程新手小白入门最佳攻略闲暇部落编程 java 新手入门开发语言
编程小白想要成为大神，并为大学新生的学习制定一份最佳入门攻略，可以遵循以下步骤：一、选择编程语言Python：被誉为最适合初学者的编程语言，语法简洁清晰，学习曲线平缓，广泛应用于数据分析、机器学习、Web开发、自动化脚本编写等领域。JavaScript：前端开发的核心语言，实现网页的动态效果，还能通过Node.js实现服务器端的编程，用于开发桌面应用和移动应用。Java：企业级开发中使用最广泛的语
【机器学习|学习笔记】特征选择（Feature Selection）和特征提取（Feature Extraction）都是用于降维、提升模型性能和泛化能力的重要手段。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记人工智能神经网络
【机器学习|学习笔记】特征选择（FeatureSelection）和特征提取（FeatureExtraction）都是用于降维、提升模型性能和泛化能力的重要手段。【机器学习|学习笔记】特征选择（FeatureSelection）和特征提取（FeatureExtraction）都是用于降维、提升模型性能和泛化能力的重要手段。文章目录【机器学习|学习笔记】特征选择（FeatureSelection）和
Python Pandas 数据的体育数据处理和分析 Python编程之道 Python人工智能与大数据 Python编程之道 python pandas 开发语言 ai
PythonPandas数据的体育数据处理和分析关键词：PythonPandas,体育数据分析,数据清洗,数据可视化,特征工程,机器学习,体育统计摘要：本文将深入探讨如何使用PythonPandas库进行体育数据的处理和分析。我们将从基础的数据导入和清洗开始，逐步深入到复杂的统计分析、可视化展示以及机器学习建模。文章将涵盖数据处理的全流程，包括数据获取、清洗、转换、分析和可视化，并结合实际体育数据
循环神经网络（RNN）：序列数据处理的强大工具 LNL13 rnn 人工智能深度学习
在人工智能和机器学习的广阔领域中，处理和理解序列数据一直是一个重要且具有挑战性的任务。循环神经网络（RecurrentNeuralNetwork，RNN）作为一类专门设计用于处理序列数据的神经网络，在诸多领域展现出了强大的能力。从自然语言处理中的文本生成、机器翻译，到时间序列分析中的股票价格预测、天气预测等，RNN都发挥着关键作用。本文将深入探讨RNN的工作原理、架构特点、训练方法、常见类型以及其
逻辑回归详解：从原理到实践
在机器学习的广阔领域中，逻辑回归（LogisticRegression）虽名为“回归”，实则是一种用于解决二分类（0或1）问题的有监督学习算法。它凭借简单易懂的原理、高效的计算性能以及出色的解释性，在数据科学、医学诊断、金融风控等诸多领域中得到了广泛应用。接下来，我们将从多个维度深入剖析逻辑回归，带你揭开它的神秘面纱。一、逻辑回归的基本概念在回归分析中，线性回归是通过构建线性方程来预测连续值，例如
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象