ldc1513

Machine Learning——A Probabilistic Approach学习笔记第二章概率

第二章概率(Probability)

2.1引言(Introduction)

在这一章，我们将会讲述关于概率论的更多细节。我们不会太过深入，但是我们至少会简要的了解一下我们在接下来的章节中所要涉及的思想。
让我们先来思考一下：什么是概率？
常见的解释有两种，第一种是frequentist解释。这种观点认为概率代表了一个事件发生的长期概率。例如，它对抛硬币的概率的解释是：如果抛很多次硬币，那么必然有一半左右是正面。另一种是贝叶斯解释，它认为概率是一种量化我们对事物的不确定性的认识。相比之下，它更加侧重信息表示而非重复试验。例如，它对抛硬币的解释则是：我们对硬币落下之后是正面或者反面的概率的期望相同。
贝叶斯解释的一个巨大的优势在于它可以被用来描述那些我们无法多次获取概率的事件。因此，我们在这本书中将会使用贝叶斯解释。好在，在不同的解释中，基本的概率论法则都是相同的，因此不会产生太大的影响。

2.2概率论初窥(a brief review)

这一部分是对于概率论的一个简单的介绍，为读者提供一个过渡。

2.2.1离散随机变量(discrete random variable)

：A发生的概率， $p\bar{(A)}$ ：A不发生的概率= A=1:A是真的 A=0:A是假的
我们可以通过定义一个离散随机变量X来延拓二元事件（即结果要么真要么假）的定义。X的取值范围可以是一个有限或可数无限集K。我们定义事件X=x的概率为，或者简记为，在这里p称为概率质量函数(probability mass function，简称pmf)，其满足 $0\leq p(x)\leq1$ ，且 $\sum _{x \in K} p(x)=1$

2.2.2基本法则

2.2.2.1两个事件同时发生的概率

$p(A \vee B)=p(A)+p(B)-p(A \wedge B)$

2.2.2.2联合概率(joint probabilities)

联合事件：（乘法原理：product rule）

$p(A,B)=P(A \wedge B)=p(A|B)p(B)$

边际分布(marginal distribution)：(加法原理：sum rule)

$p(A)=\sum _{b} p(A,b)=\sum _{b} p(A|B=b)p(B=b)$

2.2.2.3条件概率

$p(A|B)=\frac{p(A,B)}{p(B)},if \ p(B)>0$

2.2.3贝叶斯法则

2.2.3.1举例：医学诊断

一个人想要用X光检测自己有没有得乳腺癌。已知乳腺癌的患病率是0.004，如果得了乳腺癌，那么X光检测阳性的几率是0.8；如果没有得，那么假阳性的几率则是0.1，那么，如果检测为阳性，她得乳腺癌的几率是？

2.2.3.2举例：生成式分类器(generative classififier)

对上例的一般化：
这被称为生成式分类器，因为它规定(specify)了如何使用类条件密度(class conditional density) $p(\mathbf{x}|y=c)$ 和类先验(class prior)来获取信息。一个代替的方法是直接使用判别分类器求出(fit)类后验(class posterior) $p(y=c|\mathbf{x})$

2.2.4独立和条件独立(conditional independence)

若有，我们称X,Y无条件独立，记为 $X\bot Y$ ；一般地，如果集合里面的元素两两独立，我们也称其共同(mutal)独立
当然，在真实世界中变量太多，往往不能保证独立性，但是其他变量的干扰往往是间接的(mediated)而非直接的，因而我们可以使用条件概率进行描述：如果，则记 $X\bot Y|Z$
定理：如果存在函数g,h，使得对任意的x,y,z,p(z)>0，均有，则 $X\bot Y|Z$

2.2.5连续随机变量

如果X是一个连续的随机变量，那么定义函数 $F(q)=p(X\leq q)$ ，称为X的累积分布函数(cumulative distribution function,cdf)，显然为一个单调递增函数。再定义，称为概率密度函数(probability density function,pdf)，则
取间隔足够小，则
注意：在pdf中，p(x)可能会>1，因为它是F的导数，而只有F<1。而这里的p(x)并不是发生x的概率，因为x根本不是一个事件，发生的概率为0，这里的p(x)是在x附近的事件发生的密度。
笔者补充：事实上，一般的离散随机变量，通过定义定义域外的点处概率为0，可以延拓为连续随机变量。例如，在抛硬币的时候，p(X=0)=p(X=1)=1/2，则定义其余p(X=k)=0，我们得到了其cdf： $P(x)=\left\{\begin{matrix} 0 & {\ }x< 0 \\ \frac{1}{2} & 0\leqslant x < 1\\ 1 & x\geqslant 1 \end{matrix}\right.$ ，当然了，因为存在断点，其导函数(pdf)不存在。

2.2.6分位数(quantiles)

由于F单调递增，我们可以定义F的反函数 $F^{-1}(\alpha )$ ，称为 $\alpha$ 对的分位数。例如， $F^{-1}(0.5 )$ 即为X的分布的中位数‘；而 $F^{-1}(0.75 )$ 和 $F^{-1}(0.25 )$ 分别称为上下四分位数(quartiles)

2.2.7均值与方差(mean and variance)

一组数据中最为重要的指标就是均值，记为 $\mu$ ，描述了数据的期望：
方差记为 $\sigma^{2}$ ，描述了数据的广度(spread)，

2.3一些常见的离散分布(discrete distributions)

在这一部分，我们会回顾一些常见的定义在离散状态空间上的分布

2.3.1二项分布和伯努利分布(binomial&Bernoulli distribution)

假如我们投掷一个硬币n次，正面朝上的概率是 $\theta$ ，记正面朝上的次数为X，则X符合二项分布：
如果取n=1，则得到伯努利分布：

2.3.2多项分布和多项伯努利分布(multinomial)

抛一个K面体n次的概率分布记为多项分布：
n=1的时候得到多项伯努利分布：，也称为分类分布(catergorial distribution)，因此，我们记其为 $Cat(x|\boldsymbol{\theta })$

2.3.3泊松分布(Poisson distribution)

2.3.4经验分布(emperical distribution)

给定一组数据： $D=\left \{ {x_{1},x_{2},...,x_{N}} \right \}$ ，则其定义的经验分布为：，其中
此外，我们还可以为每一个样例加权后再求和。这样，我们就可以把权值和样例联系在一起，构成一个直方图

2.4一些常见的连续分布

2.4.1高斯分布(Gaussian distribution)

高斯分布：
我们经常讨论高斯分布的精确度(precision)，这里我们使用 $\lambda=\frac{1}{\sigma^{2}}$ 来表示，精确度越大则分布曲线越窄。
高斯函数的cdf：
这个积分并没有闭合形式表达式（closed form expression，即使用有限次初等运算得到的表达式），不过，我们可以用误差函数(error function, erf)对它进行估计：，其中 $z=(x-\mu)/\sigma$ ，
高斯分布是在统计中使用最为广泛的分布。一方面，它的两个变量都很容易进行解释，一个是方差，一个是均值；另一方面，中心极限定理(central limit theorem)告诉我们相互独立的随机变量的加和接近高斯分布，因此它在过滤噪声方面的效果非常优良；最后，高斯分布做出的预测的假设是最少的（可以操作的空间最大）；最后，它的数学形式很简洁，让结果易于进行调整。

2.4.2退化概率密度函数(degenerate pdf)

在高斯分布中，我们假设方差趋近于0，则其会变成一个类似“尖钉”的形状，中心为 $\mu$ ，可以表示为，称为狄拉克delta函数，其中 $\delta$ 为狄拉克函数(在自变量取0时值为无穷，在其他的时候取值为0)，并使得在实数域上的积分为1
delta函数的一个有用的性质就是它的筛性：
高斯分布的一个问题在于它对异常值比较敏感。这是因为它的log概率在远离中心点时以二次方速度衰减。因此，我们有一个鲁棒性更好的分布，即学生t分布(Student t distribution)：，其中 $\mu$ 为均值， $\sigma^{2}$ 为尺度参数， $\nu >0$ 为自由度。如下图的log-concave所示，边际点对高斯分布的影响显然更加明显（因为边际点很少，所以很小的边际波动就可以引发很大的扰动；而蓝色的student分布则明显好得多）

为了保证方差有限，我们需要自由度 $\nu>2$ ，因而常用 $\nu=4$ ，而当 $\nu\gg 5$ 时，student分布会向高斯分布收敛

2.4.3拉普拉斯分布(Laplace distribution)

另一个尾巴比较重(heavy tail，即异常值影响小)的分布是拉普拉斯分布，也被称为双边指数分布(double sided exponential distribution)。

，其中 $\mu$ 为位置参数，为规模参数

2.4.4伽马分布(gamma distribution)

，其中 $\Gamma$ 即为Gamma函数，由定义

一些特例分布：

指数分布：
Erlang分布：
$\chi^{2}$ (chi-squared)分布：
反Gamma分布：如果x满足Gamma分布，则1/x满足反Gamma分布

2.4.5beta分布

Beta分布：，为了保证积分为1，B(a,b)即为a,b定义的Beta函数：

2.4.6帕累托分布(Pareto distribution)

帕累托分布：

2.5联合概率分布

之前，我们一直着眼于单变量的概率分布。接下来我们将会讨论一个更具挑战性的问题：多个相关变量的分布；这也将会是本书的核心。

2.5.1协方差和相关系数(covariance&correlation)

协方差描述两个一维变量XY之间的线性相关程度，定义为：
如果x是d维的随机向量，记，那么x的协方差矩阵定义为，其中，为随机变量X的方差(variance)
注意这是一个半正定矩阵，证明可以看https://zhidao.baidu.com/question/920597155846911579.html，核心思路为： $y^Tcov[x]y=y^TE[(x-\mu)(x-\mu)^T]y=E[y^T(x-\mu)(x-\mu)^Ty]\ \ \ \ \ \ \\ \ \ =E[((x-\mu)^Ty)^T((x-\mu)^Ty)]$
协方差的取值可以为0到正无穷。有的时候我们希望使用一个有界的数值，因此会使用皮尔森(Pearson)的相关系数(correlation coefficient)
X和Y两个一维随机变量的相关系数定义为：
之后同样的定义d维变量x的相关矩阵：
容易发现，R中每一个corr[X,Y]的取值范围均在±1之间，且对角线全为1
（证明使用cauchy不等式可秒，并且可得出取±1条件即为X,Y正/负相关）
如果X和Y无关，那么p(X,Y)=p(X)P(y)，因此cov[X,Y]=corr[X,Y]=0
但是，corr[X,Y]=0不一定推出X,Y无关，如 $Y=X^2,X\sim U(-1,1)$ ，则，这实际上是因为协方差描述的是X,Y之间的线性相关程度，并不是一切相关程度

2.5.2多元高斯分布(multivariate Gaussian)

多元高斯分布，或者多元正态分布(multivariate normal,MVN)，是最为常用的连续变量的联合概率密度函数。
MVN的pdf的定义为：
其中 $\mu=E(X)$ 为D维均值向量， $\Sigma=cov[x]$ 为D阶协方差矩阵，有的时候我们会称其为精度矩阵(precision matrix)或浓缩矩阵(concentration matrix)， $\Sigma^{-1}$ 为协方差矩阵的逆矩阵，而前面的系数保证该分布的积分为1
关于多元高斯分布公式的来龙去脉，https://zhuanlan.zhihu.com/p/58987388解释的非常清楚，同时使用变量替换(Jacobi)给出了积分为1的证明。事实上，这就是协方差矩阵的本质之一：假设变换 $z=B^{-1}(x-\mu)$ 使得的各个变量变为相互无关，则‘： $cov[x]=E[(x-\mu)(x-\mu)^T]=E[(Bz)(Bz)^T]=Bcov[z,z]B^T=BB^T$ ，其中最后一步用到了z的无关性，同时我们便有 $|\Sigma|^{\frac{1}{2}}=|B|$
显然，不同的协方差矩阵定义了不同形状的多元正态分布，其中，满协方差矩阵有D(D+1)/2个参数，对角协方差矩阵有D个参数，球形(spherical)或各向同(isotropic)协方差矩阵有1个参数( $\sigma^2$ )

2.5.3多元学生t分布

与一元的情形相同，多元学生t分布的鲁棒性比多元正态分布更强，其pdf为：
其中 $\Sigma$ 称为尺度矩阵(scale matrix)，因为它不完全是协方差矩阵； $V=v\Sigma$
它的长尾性(即不受异常值影响的性质)比正态要好，而且越小就越好

2.5.4狄利克雷分布

对beta分布的一个自然推广即为狄利克雷分布，若，则其pdf为：
其中，其中

2.6随机变量的变量替换(transformation)

如果随机变量 $x\sim p()$ ，且，那么y的分布是怎么样的呢？这是本节将要解答的问题。

2.6.1线性变换

如果f是一个线性函数，即，则我们很容易算出y的方差和均值：
根据期望的线性性质(linearity of expectation)，我们知道 $E[y]=E[Ax+b]=A\mu+b$
对于方差，我们则有： $cov[y]=cov[Ax+b]=A \Sigma A^T$ ，证明使用直接分解法即可
当然了，只有高斯分布才被方差和均值完全确定，因此我们最好想个办法把y的整个分布求出来

2.6.2一般变换

如果X是一个离散变量，则
如果X是一个连续变量，则我们不能使用上面的等式，因为在pdf中p为密度，在单点处取值无意义，因此，我们使用cdf进行计算：
，之后我们再通过求导即可计算出y的pdf
若P为单调递增函数，则反函数存在，从而有，求导即得，其中 $x=f^{-1}(y)$
同时，由于pdf的非负性，我们两边取abs得到一个一般的表达式：，这个公式被称为变量替换公式(change of variables formula)，我们也可以用一下的方式更好地理解它：如果将 $(x,x+\delta x)$ 内的概率变为 $(y,y+\delta y)$ ，则有 $p_x(x)\delta x=p_y(y)\delta y$

2.6.2.1多元变量替换

与微积分相同，我们有Jacobi行列式：，从而我们有
例如，在变换 $(x,y)\rightarrow (r,\theta)$ 中，，
从而有

2.6.3中心极限定理(central limit theorem)

现在假设有N个随机变量，其pdf分别为，每一个的均值和方差都是 $\mu$ 和 $\sigma^2$ .我们假设每一个变量都是独立同分布的(independent and identically distributed,iid)，亦即在重复试验之间变量两两独立且分布函数相同。
https://zhuanlan.zhihu.com/p/52530189对iid进行了比较详细的解释，事实上iid本质上就是假设所有的样本都是由相同的随机分布产生的，只有这样才能明确机器学习的目标。（如果每一个样本的产生函数都不相同，那么要怎么才能学习这个函数？！）
令为所有随机变量的和，我们可以证明：随着N的增大，的分布趋近于正态分布：
也就是说，的分布收敛于标准正态分布
注：如果 $x\sim N(\mu,\sigma^2)$ ，则 $(x-\mu)/\sigma^2$ 符合标准正态分布
笔者注：那么，中心极限定理到底说了个什么东西呢？很简单，假如我们取一个[0,1]上随机分布（不一定均匀）的随机数N次，显然每次取数都是独立且相互同分布的，那么，根据中心极限定理，当N趋近于无穷的时候，这么多次取随机数的均值符合正态分布。但是，这个定理的诠释内容其实更加广泛。举个例子，假如我们随机地拍摄照片，每张照片上都有随机数量的鸟。我们假设鸟的数量的分布是独立同分布的，那么如果我们拍摄N次照片，把这些照片上的鸟的数量取平均值。即使我们不知道这些鸟的分布是什么，我们仍然可以知道这个平均值的分布一定符合正态分布。这就是中心极限定理的威力所在。
至于中心极限定理的证明，书上没有直接给出，但是https://zhuanlan.zhihu.com/p/85233692给出的证明非常简洁，可供参考。
图示为笔者对U(0,pi/2)做y=sin(x)的变换后进行30次求和后做10000次重复试验得到的分布，可以看出，非常符合正态分布。源码贴在这里：https://mp.csdn.net/console/editor/html/107770694

2.7蒙特卡洛近似(Monte Carlo Approximation)

通常情况下，给定 $x\sim p(x)$ 和，使用变量替换公式计算随机变量的分布函数是十分困难的。
这时，蒙特卡洛近似是一个简单高效的替代。
在蒙特卡洛近似中，我们将会使用S个样例的分布来估计的变量分布：，其中 $x_s\sim p(x)$
由于f的任意性，蒙特卡洛方法的应用非常广泛，例如：
取，得到
取 $f(x)=(x-\mu)^2$ ，得到 $f(x,y)=\Pi(x^2+y^2\leq r^2)$
取 $f(x)=\left\{\begin{matrix} x&x \leq c\\ 0& x >c \end{matrix}\right.$ ，得到

2.7.1举例：变量替换中的蒙特卡洛方法

假如 $x \sim U(-1,1)$ ，且，我们可以通过随机取样后求平方来计算的经验分布

2.7.2举例：用蒙特卡洛方法计算π值

半径为r的圆的面积为，我们要求 $\pi=I/r^2$
令 $f(x,y)=\Pi(x^2+y^2\leq r^2)$ 为指示函数，p(x),p(y)为[-r,r]上的均匀分布，则p(x)=p(y)=1/(2r)，则：
笔者注：为什么要取p(x),p(y)为[-r,r]上的均匀分布呢？其实并不是必须的。事实上，蒙特卡洛方法对p并没有什么要求，即使我们取x,y为μ=-100r的正态分布，也是可以成立的。但是，这样的话，均匀取样会是一个大问题，而增加系数把I转化为蒙特卡洛的形式也是另一个问题，所以，我们一般使用均匀分布。同样的，[-r,r]的选取也不是必须的。我们完全可以选择x,y为[-2r,5r]上的均匀分布，容易看出这不会影响我们得到的结果。但是，另一方面，我们不能选取[-r/2,r/2]，否则算出来的将会是正方形的面积。这则是因为在蒙特卡洛方法中我们对f(x,y)p(x)p(y)的积分的定义域事实上要求是 $[-\infty, \infty]$ ，只是本例中特征函数f(x,y)在[-r,r]²外一定取0，因此外面的部分略去不算罢了。

2.7.3蒙特卡洛近似的精度(Accuracy)

蒙特卡洛近似的精度随着样本数量的增大而增大。
如果我们假设样本数量为S，函数方差 $\sigma^2=var[f(X)]=E[f(X)^2]-E[f(X)]^2$ 实际均值为 $\mu=E[f(X)]$ ，并且蒙特卡洛估计的均值为 $\hat{\mu}$ ,则我们可以证明（这是中心极限定理的推论）
当然，虽然 $\sigma^2$ 是未知的，但是我们也可以使用MC(Monte Carlo)对其进行估计:
于是，我们有，其中被称为标准误差(standard error)，用以估计 $\mu$ 的不确定程度
因此，当我们希望在95%的数据上得到的精度在±ε之间时，我们应该令 $S\geq \frac{4\hat{\sigma}^2}{\epsilon^2}$

2.8信息论

信息论的目标是对数据进行压缩修饰(compact fashion)，即数据压缩(data compression)或者信息编码(source coding)；但是同时在传输和存储信息的时候，又要求容错率高(robust to errors)，即误差修正(error correction)或者信道编码(channel coding)。也就是说，即要求信息尽可能压缩，又要求保真度高。
这个任务看起来跟机器学习和概率论简直是风马牛不相及，但是它们其实有着密切的联系。在信息论中，我们的目标是把最短的密文分配给最常见的数据，而把较长的密文分配给不常见的数据。这一点与自然语言的情况完全相同—"a""the""and"是最为常用的单词，因此也最短。*另一方面，当我们将信息在噪声信道中传递时，我们希望建立一个良好的模型，以预测对方到底想要传达什么信息。这两种要求都需要我们建立一个可以预测数据类型的模型，而这正是机器学习的核心问题之一。
*笔者注：事实上汉语则不太是这样，这是因为英语等拼音文字的字母数量非常有限，事实上更加接近计算机中密文—明文的一一对应方式；而汉语等象形文字则基本上都是单字，一方面文字的结构和笔画有着特定的含义，不太容易更改；另一方面文字的笔画对书写时间的影响较小（在英语中长度为10个字母的单词的书写时间是1个字母的10倍，但是汉语因为单字的大小相同，10笔的汉字的书写时间至多是1笔的汉字的3倍，如果是拼音输入的话影响就更加有限了）
当然，我们不会介绍太多关于信息论的内容，只会介绍一些我们将要用到的基本概念。

2.8.1熵(entropy)

一个分布为p的随机变量X的熵定义为 $\mathbb{H}(x)$ ，用以描述它的不确定性。
特别的，一个存在K种状态的随机变量X的熵定义为：
一般我们使用以2为底的对数，此时单位元称为比特(bits,binary digits)；如果我们使用以e为底的对数，那么单位元则称为nat. 例如，如果X∈[1,2,3,4,5]的分布为p=[0.25,0.25,0.2,0.15,0.15]，则H=2.2855.
在离散变量中，熵值最大的是均匀分布。例如，若一个离散变量有K个取值，则其熵值的最大值在P(x=i, all i)=1/K时取得，值为；而其熵值的最小值为0，在某一状态处值为1，其余为0时取得（在连续取值时则用狄拉克delta函数取得），这样的分布不存在任何不确定性，称为确定分布(determintstic distribution)。

2.8.2KL散度(KL divergence)

通过KL散度(Kullback-Leibler divergence，又称相对熵relative entropy)，我们可以估计两个概率分布p和q的不相似程度。
KL散度定义如下：（如果连续，则求和变为pdf的积分），也可以记为
其中 $\mathbb{H}(p,q)=-\sum _k p_klogq_k$ 称为p,q的交叉熵(cross entropy)
注1：以上的 $\Sigma$ 在离散时均是对p的定义域求和。q的定义域不一定需要与p的相同
注2：KL散度恒大于0，但是具有不对称性(KL(P||Q)≠KL(Q||P))，因此不是距离的度量。如果需要具有对称性的表达，需要使用JS散度(Jensen-Shannon divergence)，定义为 $JS(p_1,p_2)=0.5\mathbb{K}\mathbb{L}(p_1||q)+0.5\mathbb{K}\mathbb{L}(p_2||q),{ }q=0.5p_1+0.5p_2$
交叉熵的实际含义为：分布为p的数据使用模型q进行编码时的平均比特数。而一般的熵 $\mathbb{H}(p)=\mathbb{H}(p,p)$ 则表示了使用真实模型模拟的时候我们所需要的比特数。因此，交叉熵的含义即为这两者之间的差值，也就是我们在编码数据时需要的额外的比特数。
下面我们证明KL散度恒≥0，取等当且仅当p=q：
使用琴生不等式(Jensen`s inequality)，结合 $\Sigma { }_{x\in A}p(x)=1$ ，我们有：
根据琴生不等式的取等条件： $\exists c,\forall x\in A,q(x)=cp(x)$ 和最后一步放缩的取等条件：p(x)的定义域与q(x)完全相同，结合和1性，显见p(x)=q(x)
这个定理的一个重要推论就是均匀分布的熵最大性：对任意的p(x)，代入q(x)为均匀分布，即可得到 $\mathbb{H}(x)\leq log|\chi |$ 的结论
这也是拉普拉斯的不充分推理原则(principle of insufficient reason)的表达方式之一：也就是说，当我们对分布的优劣没有什么直观感觉时，我们的先验分布应该取均匀分布。

2.8.3互信息(mutual information)

考虑两个随机变量X和Y，现在我们希望知道其中一个变量告诉了我们多少关于另一个变量的信息。我们可以使用相关系数来度量这种关系，即. 但是，根据我们之前的分析，相关系数度量的主要是两个变量之间的线性关系，即使是Y=X²这样紧密的关系也会被度量为不相关。
为此，我们引入互信息(mutual information, MI)的概念：（p(X,Y)：X,Y的联合概率，即同时发生X和Y的概率）；容易证明（真的只要展开一下），MI也可以写成下面的等价形式：，其中 $\mathbb{H}(Y|X)$ 为条件熵，定义为
变换后，我们就可以解释为什么互信息能够描述X和Y之间的相关性——它代表了X的不确定性和在观测到Y后X的不确定性的差值。
注：互信息确实是描述X，Y关系的极好工具——在相关系数中，我们只使用E[XY]-E[X]E[Y]来度量X,Y之间的差值。但是这样丢失了非常多的信息；而在互信息中，我们使用XY和X,Y的全空间分布的KL散度来度量X,Y的相关性，自然容纳了非常多的信息。
与MI紧密相关的一个数据为逐点互信息(pointwise mutual information, PMI)对于两个事件（不是随机变量）x,y，其PMI定义为：，这度量了x,y同时发生与分别发生的概率的差异

2.8.3.1连续随机变量的互信息

上面的关于MI的公式是为离散随机变量定义的。对于连续随机变量来说，最好的处理方式是将它们离散化(discretize/ quantize)，将每一个连续变量的取值范围分割成小的区间，然后计算这些区间上的频数分布(histogram)后转化为离散形式进行处理。
不幸的是，区间的数量、区间界限的选取，都可能会对结果造成非常显著的影响。因此，除了一开始就用密度估计以外，另一种方式是常数很多种不同的区间大小和位置，然后计算出获得的MI中的最大值。这种标准的统计方法称为最大信息系数法(maximal information coefficient)，用数学公式来写就是：
$\mathrm{MIC}={max}_{x,y:xy<B}m(x,y)$ ,其中 $m(x,y)=\frac{max_{G\in \vartheta (x,y)}\Pi (X(G);Y(G))}{logmin(x,y)}$ ，若我们将区间划分为x个×y个，且B为给定的xy的上界（不可能取得无限大），使用动态规划的方法很容易运算出这个最值问题。
这里的解释稍微有些贫瘠，因此可以观看https://www.omegaxyz.com/2018/01/18/mic/，通过一些例子学习如何计算MIC
笔者注：MIC的优点在于既能挖掘线性关系，又能挖掘非线性关系，和相关系数混合使用效果更佳。其本质我认为在于发掘x和y之间是否存在一一对应的关系。

论文阅读笔记：AI+RPA 几道之旅人工智能
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中，将机器人流程自动化（RPA）和人工智能（AI）集成用于欺诈检测是一项重大变革，既带来了挑战，也带来了机遇。随着金融机构面临日益复杂的欺诈企图，RPA和AI成为
@LoadBalanced注解的RestTemplate拥有负载均衡的能力享学源码 java基础 springcloud
关联阅读(必读)发送http请求(1):发送http请求的几种方式发送http请求(2):RestTemplate发送http请求SpringCloud源码阅读4:Ribbon客户端负载均衡(下)回顾当我在Ribbon的环境下使用RestTemplate发送请求时，通常我们会像下面这样注入一个restTemplate@Autowired@LoadBalancedRestTemplaterestTe
加菲工具格式化XML：让数据呈现更清晰卡其大帝工具网页开发 web xml格式化 xml
加菲工具格式化XML：让数据呈现更清晰在处理XML文件时，我们常常会遇到格式混乱、难以阅读的情况，这给数据的分析和处理带来了诸多不便。而加菲工具的XML格式化功能，就像是一位专业的数据整理师，能够迅速将杂乱无章的XML数据梳理得井井有条，让数据呈现更加清晰、直观。如果你也想体验这款强大的工具，可以访问加菲工具官方网站(www.orcc.online)获取更多信息。一、加菲工具简介加菲工具是一款功能
#渗透测试#网络安全# 一文搞懂什么是木马！！！独行soc 一文了解网络安全安全网络面试木马病毒
免责声明本教程仅为合法的教学目的而准备，严禁用于任何形式的违法犯罪活动及其他商业行为，在使用本教程前，您应确保该行为符合当地的法律法规，继续阅读即表示您需自行承担所有操作的后果，如有异议，请立即停止本文章读。目录一、什么是木马木马的定义木马的类型二、如何检测电脑是否感染木马？三、木马与病毒的区别是什么？四、常见的木马传播途径有哪些？五、木马病毒混合体案例分析案例1：CIH病毒与木马结合案例2：熊猫
Python 操作二进制文件昱晏 Python 1024程序员节 python
在计算机中，文件可以分为两种类型：文本文件和二进制文件。文本文件包含人类可读的字符，而二进制文件包含计算机指令或数据，无法直接阅读。常见的二进制文件包括图片、音频、视频、可执行文件等。Python提供了处理二进制文件的工具，允许你读写任意类型的数据。1以二进制模式打开文件在Python中，操作二进制文件时，需要使用'b'作为文件模式的一部分。常见的二进制文件模式有：'rb'：以二进制读取文件。'w
图书管理数据库简单sql语句空心木、 sql
已知某图书管理数据库有如下表格：用户表user、部门表dept、角色表role、图书表book、图书分类表book_classify、图书借阅表book_borrow、还书表book_return、借阅预约表book_appoint、图书遗失表book_lose;用户表user、部门表dept、角色表role、图书表book、图书分类表book_classify、图书借阅表book_borrow、
UML类图详解（全网最无敌详解版(自封的)）可乐泡枸杞· 面向对象设计模式 uml
UML类图详解鉴于很多同学反馈《面向对象设计模式》系列博客中的类图看不懂，所以博主贴心的单独写了一篇关于UML的文章在开始阅读之前，请点赞收藏关注，三连鼓励下博主UML（UnifiedModelingLanguage，统一建模语言）类图是面向对象建模的重要工具，用于描述系统的静态结构。类图通过展示类、接口及其之间的关系，帮助开发者理解和设计系统。本文将详细介绍类图中的各个元素及其线条和图像。类图的
【AI日记】25.01.06 AI完全体 AI日记人工智能机器学习 kaggle 比赛
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】AI参加：kaggle比赛ForecastingStickerSales读书书名：国家为什么会失败阅读原因：2024年诺贝尔经济学奖得主的力作，之前我已经读过他另一本书了《權力與進步》备注：有兴趣的建议读未删减版https://book.douban.com/subject/26388427/discussion
IDEA+Java+JSP+Mysql+Tomcat实现Web图书管理系统-添加管理员增删改查功能 omofun5541 java intellij-idea mysql
图书名称：图书价格：图书作者：出版公司：添加重置admin_delete.jsp删除图书欢迎您：安全退出admin_detail.jsp图书详情欢迎您：安全退出图书详情返回上一级图书编号图书名称图书价格图书作者图书封皮图书出版社图书列表admin_do_addbook.jsp处理新增图书欢迎您：安全退出admin_do_info.jsp书籍信息”);System.out.println(bookC
论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
JavaScript 运算符详解：各类运算符及优先级。前端基地 javascript 运算符优先级算数运算符逻辑运算符一元运算符比较运算符赋值运算符
目录非VIP用户可前往公众号“前端基地”进行免费阅读运算符介绍运算符优先级算数运算符赋值运算符比较运算符逻辑运算符介绍a&&b和a||b一元运算符非VIP用户可前往公众号“前端基地”进行免费阅读运算符介绍以下是各类运算符的详细介绍：运算符描述算术运算符加(+)、减(-)、乘(*)、除(/)、求余数并保留整数(%)、累加(++)、递减(--)赋值运算符=、+=(num+=5等同于num=num+5)
YOLOv10-1.1部分代码阅读笔记-model.py 红色的山茶花 YOLO 笔记深度学习
model.pyultralytics\engine\model.py目录model.py1.所需的库和模块2.classModel(nn.Module):1.所需的库和模块#UltralyticsYOLO,AGPL-3.0licenseimportinspectimportsysfrompathlibimportPathfromtypingimportUnionimportnumpyasnpim
《CPython Internals》阅读笔记：p177-p220 codists 读书笔记 python
《CPythonInternals》学习第11天，p177-p220总结，总计44页。一、技术总结1.memoryallocationinC(1)staticmemeoryallocationMemoryrequirementsarecalculatedatcompiletimeandallocatedbytheexecutablewhenitstarts.(2)automaticmemeorya
《CPython Internals》阅读笔记：p250-p284 python
《CPythonInternals》学习第14天，250-p284总结，总计25页。一、技术总结介于我觉得作者写得乱七八糟的，读完我已经不想说话了，所以今日无技术总结。二、英语总结(生词：2)1.spawn(1)spawn:来自于词根expandere。(2)expandere:ex-("out")+pandere("tospread")spawn原来的意思是“spreadingoutoffish
如何用python爬取公众号文章_如何使用 Python 爬取微信公众号文章 weixin_39524574
我比较喜欢看公众号，有时遇到一个感兴趣的公众号时，都会感觉相逢恨晚，想一口气看完所有历史文章。但是微信的阅读体验挺不好的，看历史文章得一页页的往后翻，下一次再看时还得重复操作，很是麻烦。于是便想着能不能把某个公众号所有的文章都保存下来，这样就很方便自己阅读历史文章了。话不多说，下面我就介绍如何使用Python爬取微信公众号所有文章的。主要有以下步骤：1使用Fiddler抓取公众号接口数据2使用Py
序与内容摘要：现代计算机技术书籍中的编写技巧嵌入式Jerry 写书开发语言 linux 物联网嵌入式硬件系统架构
在现代计算机类技术书籍中，序和内容摘要是两个重要但又经常被忽视的部分。这两部分不仅仅是为书籍“锦上添花”，更是吸引读者、引导理解的关键环节。好的序和内容摘要能够帮助读者快速抓住书籍的核心，同时激发阅读兴趣。本文将深入探讨如何编写清晰、合理且通俗易懂的序和内容摘要，并提供一些易于理解的例子。一、序的作用与编写技巧1.序的作用序，作为书籍的开篇，承担着多重作用：引入主题：序能帮助读者快速了解书籍的主题
电脑软件：推荐六款高效实用的PDF阅读器工具 IT技术分享社区电脑技巧 pdf 电脑软件微软技术办公软件
目录1.AdobeAcrobatReaderDC2.福昕阅读器（FoxitReader）3.SumatraPDF4.NitroPDFReader5.SlimPDFReader6.极速pdf阅读器总结在数字化办公日益普及的今天，PDF文件凭借其跨平台、格式稳定且易于分享的特点，成为了众多用户首选的文档格式。对于Windows用户而言，选择一款功能强大且操作便捷的PDF阅读器至关重要。本文将为您盘点并
YOLOv10-1.1部分代码阅读笔记-loaders.py 红色的山茶花 YOLO 笔记深度学习
loaders.pyultralytics\data\loaders.py目录loaders.py1.所需的库和模块2.classSourceTypes:3.classLoadStreams:4.classLoadScreenshots:5.classLoadImagesAndVideos:6.classLoadPilAndNumpy:7.classLoadTensor:8.defautocast
Delphi代码编写标准指南好大的牛角
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！·日月光华精华区文章阅读发信人:Delphii(Delphi),信区:VCL标题:Delphi编码规则发信站:日月光华站(FriSep712:03:072001),站内信件Delphi代码编写标准指南■■■■■■
如何快速入门VCU应用层软件开发？（34篇实例讲解+软件开发测试方法+工具使用）汽车电控研习室技术经验分享经验分享 matlab 汽车算法测试工具
最近，用一个多月的时间总结了VCU应用层软件开发的基本流程，架构，关键模块的控制策略及Simulink建模方法、测试方法及相关工具的使用。如何快速入门VCU应用软件开发层软件开发，通过本篇文章可以给你答案。文章标题为超链接，可直接点击进入文章阅读。目录一、VCU应用层软件开发流程及架构二、VCU应用层软件开发模块1、输入信号处理2、控制策略模块3、输出信号处理4、标定量设置5、代码生成三、VCU应
我的创作纪念日自由鬼行业发展纪念
机缘生命的旅程中，机缘如同一束微光，指引着我在困顿中寻找前行的方向。机缘说来就来，不可言语。收获没有想到，在2024年12月13日正式通过csdn.net发布博客到目前就有了1358个粉丝、97994阅读量、1734收藏，能够得到认同非常高兴。日常我的日常生活虽忙碌，却充满意义。除了工作和研究，我常反思自身与外界的关系，思考如何让IT这一生产力能够发挥更大的作用。成就尽管前行的道路上仍充满挑战，我
《小型开发者在鸿蒙Next上的成本与收益平衡之道》深度学习人工智能算法
学习成本鸿蒙Next系统与安卓、iOS在系统架构、API等方面存在一定差异，小型开发者需要花费时间和精力去熟悉和掌握。例如，开发者需要学习鸿蒙的分布式架构、原生智能等新技术概念和开发方法，这可能需要参加培训课程、阅读文档或在社区中与其他开发者交流学习。开发成本功能越复杂、UI/UX设计要求越高，开发成本就越高。小型开发者可能需要投入更多的人力和时间来进行应用的设计和开发。如果开发者经验不足，开发效
深入了解JSON：Python中JSON的全面应用指南 kdayjj966 开发语言 json python
JSON（JavaScriptObjectNotation）是一种广泛使用的数据交换格式，以其轻量级和易于阅读及解析的特性而备受欢迎。JSON起源于JavaScript，但已经被许多编程语言广泛支持，包括Python。本教程将深入探讨JSON的构造、数据类型，以及在Python中的多种操作方式。JSON的基础构造JSON由两种主要结构组成：对象（Object）和数组（Array）。对象（Objec
指派问题程序c语言,指派问题lingo程序样例 weixin_39917437 指派问题程序c语言
《指派问题lingo程序样例》由会员分享，可在线阅读，更多相关《指派问题lingo程序样例(1页珍藏版)》请在人人文库网上搜索。1、指派问题的样例：现在要在五个工人中确定四个人来分别完成四项工作中的一项工作。由于每个工人的技术特长不同，他们完成各项工作所需的工时也不同。每个工人完成各项工作所需工时如下表所示，试找出一个工作分配方案，使总工时最小。工作工人ABCDI9438II4653III5375
天童教育：课外阅读图书推荐 t05777 其他
新学期开始了，现在正是孩子培养良好的阅读习惯的关键时期。让孩子感受阅读，爱上阅读，无疑会丰富孩子的日常生活，开阔孩子的视野，帮助孩子更好地生活。今天西安天童教育就和大家推荐几本适合孩子看的课外阅读书目，让阅读常伴孩子！《一年级的小豌豆和小蜜瓜》这是著名儿童文学作家商晓娜专门为一年级的孩子们写的入学故事书，故事围绕一年级女孩和男孩的生活展开，一共有31个小故事，全彩注音，适合孩子和家长们共读，了解校
基于区块链的云上数据访问控制模型研究 XLYcmy 论文阅读阅读笔记网络安全论文阅读论文笔记区块链访问控制云数据
论⽂选择理由:汉语论⽂,对于新⼿⼊⼿阅读相对容易之前,进⾏过区块链⽅⾯的研究，有⼀定基础⽅便理解论⽂通读情况:①基本掌握论⽂所提出背景和要解决的问题②⼤致理解论⽂所提出的⽅案和优势收获:⼤致梳理出⼀篇做的架构:(我的理解)背景→现有⽅案不⾜→预备免识→提出⽅案→⽅案核⼼设计与算法→与其他⽅案对比→设计实验环境与实验指标进⾏⽅案验证→总结与展望
线上工单引发的思考：Spring Boot 中 @Autowired 与 @Resource 的区别 coding侠客 spring boot 后端 java
最近接手了离职同事负责的业务，在处理一个线上工单的时候，看了下历史逻辑，在阅读他们写的代码时，发现他们竟然把@Autowired和@Resource注解混用。今天就借此机会聊聊SpringBoot项目中这两者之间的区别。1.注解来源@Autowired：是Spring框架提供的注解。IOC特性的核心注解之一。@Resource：是Java的标准注解，属于JavaEE规范（JSR-250）。2.注入
《CPython Internals》阅读笔记：p232-p249 python
《CPythonInternals》学习第13天，p232-p249总结，总计18页。一、技术总结无。二、英语总结(生词：1)1.overhead(1)overhead:over-("above")+head(“toppart,uppermostsection”)overhead的字面意思是：abovethehead,后来演变成"representthingssituatedaboveormeta
【泡沫】追寻热爱：出书、写博客与自我突破的年度历程泡沫o0 c++开发语言 arm开发 arm 嵌入式博客之星 qt
泡沫年度总结1.引言:写作者的自白1.1年度“主旋律”与写作初衷1.2年终回顾的意义2.成长蜕变:从追赶到沉淀2.1心态进化：从追赶到反思2.2技能与认知的双重提升3.创作之路:写作背后的故事3.1出版首本图书的幕后故事3.2300+篇博客的持续动力4.平衡艺术:在写作与生活之间4.1时间管理与精力分配的难题4.2焦虑与压力的自我调适5.远航计划:2025我们启程5.12025规划：在稳步中寻求突
三星笔记备份指南【常见问题+介绍3种方法】 Coolmuster 三星手机安卓笔记 android
SamsungNotes是众多可用应用程序之一，但它对于记笔记、画草图和掌握重要信息特别有用。但如何保护这些笔记的问题经常出现。我们将在这个内容丰富的教程中回答有关SamsungNotes的一些常见问题，并提供高效备份的分步说明。阅读以了解它们！第1部分：有关SamsungNotes问题的简要解答为了提供全面知识的基础，让我们在详细了解SamsungNotes备份之前先解决这些基本问题：Q1.三星
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

Machine Learning——A Probabilistic Approach学习笔记 第二章 概率

第二章 概率(Probability)