郑瀚Andrew.Hann

关于概率分布理论的原理分析的一些讨论，以及经典概率分布的应用场景，以及概率统计其在工程实践中的应用

1. 随机变量定义

0x1：为什么要引入随机变量这个数学概念

在早期的古典概率理论研究中，人们基于随机试验的样本空间去研究随机事件，也发展出了非常多辉煌的理论，包括著名的贝叶斯估计在内。

但是随着研究的不断深入，遇到问题的不断复杂化，科学家们发现面对的问题也不仅仅是抛色子，口袋里摸球、抛硬币伯努利试验这样的简单问题，而是更加复杂的问题，例如

多个随机试验的组合问题：例如考虑n个伯努利随机试验中某个事件发生次数的随机变量
非实数型的样本空间：例如气候分析、水文模拟与预测等复杂问题，显然，这个时候样本空间就不一定都是数集了

继续使用随机事件样本空间这种集合论数学工具进行问题分析和定量研究遇到了越来越多的困难。

为了能对更复杂的问题进行抽象建模，进行定量的概率公式化处理，因此，通过引入随机变量，将样本空间这个集合概念转化为一个无量纲的数集（函数概念），使得能统一地处理各种随机现象。

同时因为随机变量本质是函数范畴体系内的定义，因此还可以借助函数分析相关的数学工具展开对随机事件的定量分析，这使得概率论的发展又跨了一个大的台阶。

需要注意的是，对于随机变量来说，样本空间中的样本不一定是等概的。在实际工程中，非等概模型才是更加普遍和一般的情况，随机事件的样本集空间中不同元素的发生概率一般不可能都是等概的。等概摡型只是离散型随机变量里一个特例。

0x2：随机变量的抽象定义

在随机试验E中，Ω是相应的样本空间，如果对Ω中的每一个样本点w，有唯一一个实数 X(w) 与之对应，那么就把这个定义域为Ω的单值实值函数 X=X(w) 称为(一维)随机变量。

函数 X(w) 的的定义域对应于随机变量的样本空间，记作，，当然，随机事件只会在一些区间内有概率的定义，在其他区间上概率为0。

站在试验前的立场看，我们不知道试验结果将出现样本空间Ω中的哪个样本点，即不知道随机变量将会取中的哪一个数。从这个意义上说，随机变量的取值是随机的。

概率论的一个基本任务就是研究随机变量取值的统计规律性，而引入概率分布函数的目的也是为了更好地研究统计规律的数学特性。

0x3：随机变量的分类

从严格理论定义上来看，随机变量可分为：

离散型随机变量：如果1个随机变量只可能取有限个或可列无限个值（即它的值域是1个有限集或可列无限集），那么便称这个随机变量为(一维)离散型随机变量。
非离散型随机变量：连续型随机变量的取值充满了数轴上的一个区间（或某几个区间的并），在这个区间里有无穷不可列个实数，因此当我们描述连续型随机变量时，用来描述离散型随机变量的分布律就没法继续使用，需要改用概率密度函数来表示。

在非离散型随机变量中，连续型随机变量是最常见也是占比最多的，我们本文主要讨论连续型随机变量。但读者要明白的是，并不是只有离散和连续型随机变量这两种。

Relevant Link:

《概率论与数理统计》同济大学数学系 第二章 - 第一节

2. 随机变量的概率密度与概率分布

0x1：为什么要研究随机变量的概率密度与概率分布PDF

1. 现实世界不是确定性的，而是概率性的 - 上帝会掷色子

现实世界中大量复杂问题其状态受到大量内在和外在因素的影响，想要彻底掌握这类事物的内在规律并对未来可能发生的状态变换作出预测，就需要数据科学家通过数据分析、概率建模等方式，寻找一个或一组概率分布公式。

那为什么一定是概率分布函数呢？而不能是一个像爱因斯坦质能方程那样的精确性的映射函数呢？

理解这个问题，需要回望一些历史，自从混沌理论和非线性动力学理论问世以来，动力学系统“内在随机性”的存在，使得确定论不再占统治地位，它与随机方法论之间的鸿沟已经逐步填补。从辨证唯物自然观来看，确定论的数学模型只是纷繁复杂的大自然现象因果规律的一种理想化描述。在现实世界中，“量”的方面的数学的无穷性，比起“质”的方面的无涯无尽性来说，是极为粗浅的。无论怎样复杂的方程式都不可能是实际现象的无限复杂性的等价反映，它们充其量不过是相对精确或相对逼真地描述了现象，而不是现象本身的全部写照。

接下来的问题就是，如何找到这种“概率分布函数”呢？或者说如何找到这个“上帝”呢？这就是接下来要谈的概率密度估计。

2. 概率密度估计 - 寻找概率分布函数的方法

对于给定的一个数据集合，我们认为这个数据集合来自于某个随机变量，并且这个随机变量具有某种概率分布P(X)。找到这个概率分布P(X)的过程叫做密度估计（density estimation）。

需要注意的是密度估计问题是一个很困难的问题，因为世界上的概率密度函数不计其数，能够近似拟合概率密度函数也是如此之多。选择一个合适的P(X)是模型选择问题，在机器学习领域经常遇见。

当然，这仅仅是生成式模型学派需要头疼的问题，如果忽略这些细节，通过设计深度神经网络得到一个判别式模型，只要关心最终的结果效果是否好，泛化能力是否强即可。

0x2：离散型随机变量的分布律与概率分布

1. 离散随机变量的概率(质量)函数（probability density function, PDF）/分布律

要掌握一个离散型随机变量取值的统计规律(即分布)，除了必须知道它的样本空间值域外，还需要知道它取各个可能值的概率，其实就是函数分析中的定义域和值域分析的概念。

设随机变量X的值域为，对于每个 i = 1，2，....，X的取值为ai的概率为：

按照概率的定义与性质，p1，p2，.... 需要满足下列性质：

非负性：
样本空间完备性：

我们称为随机变量 X 的概率(质量)函数或分布律。

2. 离散随机变量的概率分布函数

一般地，对一个随机事件E来说，对样本空间中任意一个子集合S，有：

上述计算公式本质上由概率的加法公式推出，因为诸事件{X =ai}(i=1，2，...)是两两互不相容的。

离散随机变量的分布函数就是离散分布律在某个样本集区间上的累加，只是这个样本区间是一个形如[-∞，Smax]的区间。

设X是一个随机变量，对于任意实数x，称函数为随机变量X的分布函数。

对任意的两个实数，有

因此，只要已知X的分布函数，就可以知道X落在任一区间 (a，b) 内的概率，可以看到，分布函数可以完整的描述一个随机变量的统计规律性。

相比于概率密度，分布函数度量的是区间的累计概率，是一个事件集合的总体发生概率。

可以看到，概率分布函数本质上是概率密度函数的积分，所以也叫累计概率函数（cumulative distribution function，CDF），也可以简称概率分布函数。

反过来，概率密度函数也是概率分布函数的导数。

3. 离散随机变量概率分布函数性质

我们通过一个例子来说明离散随机变量概率分布函数的性质。

设一个盒子中装有10个球，其中：

5个球上标有数字1
3个球上标有数字2
2个球上标有数字3

从中任取一球，记随机变量X表示为“取得的球上标有的数字”，求X的分布函数F(x)。

我们先来求其离散分布律，知道离散分布律后就可以自然得到分布函数。

根据题意可知，随机变量X可取 1，2，3，这个问题相对比较简单，摸球是一个等概事件，因此由古典概型的计算公式，可知对应的随机事件的概率值分别为：

取到数字1的球：0.5
取到数字2的球：0.3
取到数字3的球：0.2

接下来，分布函数的定义为F(x) = P(X <= x)，因此有：

x < 1：P（X <= x）= 0
1 <= x < 2：P（X <= x）= P（X = 1）= 0.5
2 <= x < 3：P（X <= x）= P（X = 1）+ P（X = 2）= 0.5 + 0.3 = 0.8
x >= 3：P（X <= x）= P（X = 1）+ P（X = 2）+ P（X = 3）= 0.5 + 0.3 + 0.2 = 1

F(x)的图形如下图所示，python生成代码为：

# -*- coding: utf-8 -*-

from pylab import *


if __name__ == '__main__':
    x = linspace(-2,8,200)

    y = []
    for i in x:
        if i<1:
            y.append(0.)
        elif (i>=1 and i<2):
            y.append(0.5)
        elif (i>=2 and i<3):
            y.append(0.8)
        else:
            y.append(1.)
     
     print y

    plot(x,y),show()

它是一条阶梯型的曲线，在X的每个可能取值处 1，2，3 处有连续的阶跃点，每次跳跃的高度就是X在该取值点的累计概率。

具体来说，任一分布函数F(x)有如下性质：

0 ≤ F(x) ≤ 1，
F(x)是单调不减的，即当x1
F(x) 在 (-∞，∞) 上每一点处至少右连续

4. 常见离散型随机变量的概率密度函数（分布律）

由于概率分布函数刻画了一个离散型随机变量取值的统计规律性，因此，物理世界中存在的概率分布函数可以说是无穷无尽的。科学共同体内的科学家根据自己的专业领域知识，寻找并建立了不同的概率解释模型，对本专业的实际物理现象进行解释以及预测。

笔者在这章会讨论一些常见的离散型概率分布函数，并简单讨论其在工程中的应用，对于在更复杂工业场景中概率分布函数的应用的讨论笔者会放在之后的章节中。

1）二项分布

1.1）二项分布数学定义

二项分布考察的是多次原子随机事件整体呈现出的统计概率特征。

设单次随机试验为伯努利试验（实验结果只有2种对立的可能，即样本空间只有2个元素），在n重独立伯努利试验中，设随机变量X表示n次试验中事件A发生的次数，所以有，X的概率密度函数（分布律）为：

称这个随机变量X服从参数为n，p的二项分布，记作，其中 0 < p < 1。二项分布函数的形态完全由（n，p）两个参数决定。

笔者认为，二项分布抽象的是这样一类事物：某系统的时域或空域状态由一系列的子步骤组成，每个子步骤都符合一个特定的二元对立的概率密度函数（即只有两种可能，且发生的概率固定），我们设这两个对立事件为事件A和事件B。现在假设系统在时域或空域上经过了n步，二项分布需要评估的是在这n步中，事件A和事件B分别发生了多少次，即这两个对立事件对最终系统状态的贡献度分别是多少。二项分布评估的是某系统达到某种状态时，各个基础随机事件的贡献比，不考虑内部过程，只看结果。

1.2）二项分布的函数分析意义

二项分布密度函数（分布律）是离散型分布，概率密度直方图是跃阶式的。

我们可以从二项式的平方公式分解的角度来看二项分布的分布律。

例如，p=q=1/2，各项的概率可写作：

上式就是二项分布分布律的累加式。

设p表示事件发生，q表示事件未发生。

当p=q时：概率密度直方图是对称的，例如下面的杨辉三角

当p≠q时：直方图呈偏态：

p>q：直方图朝左边倾斜，相反

如果n很大（当pq且nq≥5），即使p≠q，偏态逐渐降低，最终近似等于正态分布，二项分布的极限分布为正态分布，可以用正态分布的概率作为近似值。关于这个结论的证明，我们在后面讨论正态分布的时候会详细说明。

1.3）二项分布的应用条件

各观察单位只能具有相互对立的一种结果，如阳性或阴性，生存或死亡等，属于两分类资料
已知发生某一结果（阳性）的概率为π，其对立结果的概率为1-π，实际工作中要求π是从大量观察中获得比较稳定的数值
n次试验在相同条件下进行，且各个观察单位的观察结果相互独立，即每个观察单位的观察结果不会影响到其他观察单位的结果。如要求疾病无传染性、无家族性等

1.4）二项分布的简单案例

题目为：从积累的资料看，某条流水线生产的产品中，一级品率为90%，今从某天生产的1000件产品中，随机地抽取20件作检查。试求恰有18件一级品的概率。

题目看起来文字挺多，其实无用的信息很多，我们抽象为随机事件，可以概括为：

设产品抽检结果为随机试验E，抽检结果为离散随机事件X，样本空间为{合格、不合格}，随机事件X的分布律为P(X=合格) = 0.9，P(X=不合格) = 0.1。现在基于随机试验E进行n重伯努利实验Y，即X~B(n，p) = X~B(20，0.9)，并求P(Y=18)的概率值。

根据二项分布概率公式可得：

2）超几何分布

2.1）超几何分布的物理意义

要讨论超几何分布的物理意义，首先需要先回顾下二项分布的物理意义，我们可以从不同的角度来看二项分布：

抽样实验角度：二项分布是建立在有放回抽样的基础上的，也就是抽出一个样品测量或处理完后再放回去，然后抽下一个
信号冲击响应系统：二项分布代表的是时移不变性的信号，也就是说，随着时间的进行（随机试验的进行），信息系统本身的性质（概率密度）不会发生变化

现在我们将问题复杂化，即进行无放回抽样（概率密度随着时移而改变）的随机试验，这时，传统的二项分布无法处理这种情况。

超几何分布就是这种背景下被提出，用来计算在无放回抽样情况下，概率密度和概率分布的建模问题。

2.2）超几何分布数学公式

设随机变量X，假定在 N 件产品中有 M 件不合格品，即这批产品的不合格率 p= M/N。从这批产品中随机地抽取n件作检查，发现有X件是不合格品，则 X 的概率密度函数为

则称这个随机变量X服从参数为（N，M，n）的超几何分布。

这种抽样检查方法实质上等价于无放回抽样，如果采用有放回抽样的检查方法，那么，超几何分布会退化为二项分布，即当 M = Np 时，有：

在实际的工程开发中，当总体的容量N不大时，要用超几何分布来计算，如果N很大而n很小（N ≥10n），不管是否是放回抽样，都可以用二项分布来近似计算，也就是可以将无放回抽样近似看出有放回抽样，因为当N远大于n时，不放回导致概率密度函数的变化小到可以忽略不计，这种近似转化的思想在数学里很常见，在面对复杂问题的时候尤其有用。

3）泊松分布

3.1）泊松分布数学公式

泊松分布是1837年法国数学家泊松（Poisson，1781-1840年）首次提出的。

设随机变量X的取值为0，1，....，n，相应的分布律为：

称这个随机变量X服从参数为λ的泊松分布，记作X ~ P (λ)，其中，λ > 0。

公式本身很简单，咋一看是一个完全新的概率公式，但其实泊松分布是二项分布在大数定律下的近似等价，是大数定律的最好体现（小数世界的随机性和大数据世界的统计规律性），我们接下来一起推导分析下。

3.2）泊松定理推导分析

让我们以某段时间内发生的交通事故次数为例。我们把这段时间记为[0,1)，取一个很大的自然数n（大数定理），将时间段等分为n段，记每段的区间为=[,)。

根据试验后验统计，在整个时间区间内共发生λ起事件，因此当n足够大时，可以假定在每段小区间内，发生一次事故的概率为λ/n。又因为n很大，所以可以假定在每段小区间内至多发生一次事故，因此就有p = λ/n，np = λ。

同时，每段小区间内是否发生事故是相互独立的。

以上条件说明该事件满足二项分布的成立条件，因此可以用二项分布进行推导。

设随机变量X为在 [0,1)时间段内发生事故的总次数，则有：

X~B(n，λ/n)，P(X=i)=

根据假定，令n，则有如下近似等价式：

/==
==，：级数求和公式。

代入上面二项分布公式，二项分布概率分布表达式即化为泊松分布概率分布表达式。

可以看到，相比于二项分布，泊松分布的计算量更小，在超大数据的情况下，往往采用泊松分布来近似等价二项分布的计算。

笔者自己的观点认为，泊松分布和二项分布本质区别就是先天经验先验和后天试验经验的不同视角的体现，具体来说就是：

在小数世界中，实验次数较少，我们主要依靠先天经验来设置先验概率作为随机事件的概率，这就是二项分布
在大数世界中，实验次数较多，我们可以更多地依靠后天试验的后验结果作为随机事件的概率，这就是泊松分布

3.3）泊松分布的简单应用

某台仪器，由1000个元件装配而成，根据大量历史经验，每一元件在一年工作期间发生故障的概率为0.002，且各元件之间相互独立，求在一年内有2个元件发生故障的概率。

设X表示“发生故障的元件数”，则X~B(1000，0.002)。

由于n=1000较大，p=0.002较小，且np=2大小适中，所以可用泊松分布来近似计算该二项分布的值

Relevant Link:

https://zhuanlan.zhihu.com/p/26433704

4）几何分布

4.1）几何分布数学定义

在伯努利试验中，记每次试验中A事件发生的概率P(A) = p（0

称这个随机变量 X 服从参数为p的几何分布，记为X~Ge(p)。

4.2）几何分布的无记忆性

由几何分布的概率函数得到：

因此有：

这个推导过程反映了几何分布的一种特性，即无记忆性。

0x3：连续型随机变量的概率密度函数与概率分布

1. 连续型随机变量概率密度函数

设E是随机试验，Ω是相应的样本空间，X是Ω上的随机变量，F(x)是X的分布函数，若存在非负函数f(x)使得：

则称X为(一维)连续型随机变量，f(x)称为X的概率密度函数。

2. 连续型随机变量的概率分布函数

密度函数f(x)与分布函数F(x)之间的关系如下图所示.现在，F(x) = P (X ∈ (-∞，x])，即f(x)在区间(-∞，x]上的积分。

3. 连续型随机变量的性质

连续型随机变量具有下列性质：

F(x)是连续函数，且当f(x)在x=x0 处连续时，F′(x0)=f(x0)
对任意一个常数c，-∞ < c < ∞，P(X = c) = 0，需要注意的是，这个性质对离散型随机变量是不成立的，恰恰相反，离散型随机变量计算的就是“点点概率”。
对任意两个常数a，b，-∞ < a < b < ∞，

4. 连续型随机变量概率密度和分布函数性质

按照连续型随机变量分布函数的特征性质，连续型随机变量密度函数必须满足下列两个条件：

f(x) ≥ 0，-∞ < x < ∞

这两个条件刻画了密度函数的特征性质，即如果某个实值函数f(x)具有这两条性质，那么，它必定是某个连续型随机变量的密度函数，理论上概率密度函数是无限的。

例如，当f1(x)，f2(x)都是概率密度函数时，只要c1，c2 ≥0，c1+c2 =1。则c1f1(x)+c2f2(x)也是一个密度函数，因为不难验证它是满足上述两个条件的。这表明概率密度函数是可以进行线性组合的，这大大加强了使用概率分布函数对物理世界的具体现象进行建模分析的能力。

5. 常见连续型随机变量的概率密度函数

1）均匀分布

1.1）均匀分布数学定义

设X为随机变量，对任意的两个实数a，b（a

则称随机变量X服从区间（a，b）上的均匀分布，记为X~U（a，b）。

密度函数如下：

1.2）均匀分布概率分布函数

若X~U（a，b），则相应的概率分布函数为：

下图分别展示了均匀分布的概率密度函数与概率分布函数（导数与积分的关系）：

1.3）均匀分布的实际案例

2）指数分布

2.1）指数分布的概率密度与概率分布函数公式

如果随机变量 X 的密度函数为：

则称随机变量X服从参数为λ的指数分布，记为X~E(λ)。

相应的分布函数为：

密度函数和分布函数的函数图如下：

2.2）指数分布的无记忆性

因为，所以有下式：

因此可证，指数型随机变量满足无记忆性特征：

即条件概率值只与持续时间t有关，与起始点s无关。

2.3）指数分布和泊松分布公式的互相推导

一言以蔽之：泊松分布和指数分布都是评估单位时间内n次伯努利实验的统计概率性质的一种概率分布，但是它们的度量角度不同。在一段时间内，事件出现的次数问题，就是泊松过程；在一段时间内，两件事件发生之间要等待的时间问题，就是指数分布。

接下来我们通过泊松概率公式，推导得到指数分布的概率密度函数。

设随机变量表示在n重伯努利实验中，两次事件出现之间的时间间隔

我们先计算的概率，其对应的泊松分布试验结果是，在时间内，事件A并没有出现。

换种说法是在时间段内，事件A出现0次。在一段时间内，事件出现的次数问题，就是泊松过程。则有：

，所以其反事件概率分布函数为：

得到了概率分布函数，求其积分，得到其密度函数

这就是参数为λ的指数分布。

2.4）指数分布的函数性质

指数分布中的λ代表整个区间中总共发生的事件数，如果λ越大，也就是说区间内发生的总事件数越多，那么两个事件发生之间的时间间隔必然越短。当λ较小的时候，例如λ=1，也就是说区间内总共只发生1次事件，那么两个事件发生间隔时间大于1的可能性就很大（下图是指数分布的概率密度函数的图像，对应的概率是曲线下面积）：

2.5）指数分布和泊松分布的数学期望对比

同一个n重伯努利实验，他们的期望分别为：

可以看到，它们两者是倒数关系：区间内某事件发生的次数越多自然间隔时间越短，区间内某事件发生的次数越少自然间隔时间越长。

从某种程度上可以说，泊松分布和指数分布是同一个事物的正反两面。

2.6）指数分布和几何分布的互相推导

指数分布常常被用来描述电器产品或者生物的寿命等现象。

抽象来说，如果x服从指数分布，那么[x]就服从几何分布。[x]是x取整的意思。

简单来说，每一秒钟，电器坏的寿命都是相同的；每经过一秒，相当于扔了一次骰子，正面坏，反面不坏；直到扔出正面，这就是几何分布。

其实在概率分布函数中，这种互相推导转换的关系是非常普遍的，祭出一张非常经典图，有兴趣的读者朋友可以用草稿纸演算一遍。

Relevant Link:

https://www.zhihu.com/question/54525571 
https://www.zhihu.com/question/24796044

3）正态分布

正态分布是概率统计中非常重要的一种分布，是高斯（Gauss，1777-1855年）在研究误差理论时首先用正态分布来刻画误差的分布，所以正态分布又叫高斯分布。

3.1）正态分布数学定义

设X为随机变量，概率密度函数为：

那么，称这个随机变量X服从参数为μ，σ 的正态分布(或高斯(Gaus)分布)，记作X ~ N(μ，σ)，其中，-∞ < μ < ∞ ，σ > 0。

服从正态分布的随机变量统称为正态随机变量。

概率密度图和概率分布图如下：

3.2）正态分布的函数性质

正态分布概率密度函数有如下性质：

f(x) 关于x = μ对称，当x=μ时，f(x) 取到最大值
固定σ，改变μ的值，则曲线沿x轴平移，但不改变其形状，所以参数μ又称为位置参数
固定μ，改变σ的值，则曲线的位置不变，但随着σ的值越小，曲线越陡峭，所以参数σ又称为尺度参数

3.3）正态分布的应用场景

正态分布在理论上与实际应用中都是一个极其重要的分布，高斯在研究误差理论时曾用它来刻画误差的分布。

经验表明，当一个变量受到大量微小的、独立的随机因素影响时，这个变量一般服从或近似服从正态分布。

例如，某地区男性成年人的身高、自动机床生产的产品尺寸、材料的断裂强度、某地区的年降雨量，等等。

4）sigmoid概率函数

设随机变量为Z，则sigmoid是关于随机变量Z的概率函数，它的概率分布形式为：

函数图像如下：

可以看到，sigmoid不仅符合概率函数的基本性质，同时还有其他的函数性质，这使得sigmoid适合在机器学习中用作激活函数，将线性层的输出转化为概率值。

可以看到在趋于正无穷或负无穷时，函数趋近平滑状态，sigmoid函数因为输出范围（0，1），所以二分类的概率常常用这个函数，事实上logisti回归采用这个函数很多教程也说了以下几个优点

值域在0和1之间
函数具有非常好的对称性
函数对输入超过一定范围就会不敏感，对极端事件具备很好的鲁棒性

关于sigmoid损失函数的讨论，可以参阅这篇文章。

Relevant Link:

https://zlearning.netlify.com/computer/mlapp/mlappch2dot3-some-probability-distributions
https://www.cnblogs.com/LittleHann/p/10498579.html#_label2

3. 经典概率分布函数在工程分析中的作用

0x1：二项分布在心理学和教育领域中关于机遇问题的判断研究

所谓机遇问题，即指在实验或调查中，实验结果可能是受试者猜测造成的。比如，选择题中随便选择一个选项，对错判断中随便判断一个结果。

凡此类问题，教育工作者和研究人员的目标是：欲区分由猜测而造成的结果与真实的结果之间的界限区间，即在一张试卷中（多个独立题目组成），答对多少题及以上可以可以大概率证明受试者不是在随机蒙题。

特别要注意的是，在概率论中没有100%确定的结论，一切都是概率区间，按照假设检验的理论观点来重新阐述上面这句话，应该是：寻找猜测而造成的结果与真实结果之间的概率区间下界，即至少答对多少题才能达到至少95%的概率，与此同时，依然存在5%的置信区间（5%是常用的显著性检验的概率阈值），在这个5%概率区间中，真实情况与推测结论相反。

下面我们举具体例子，应用二项分布来解决机遇问题的判断。

已知有正误题10题，问答题者答对几题才能认为他是真会，或者说答对几题，才能认为不是出于猜测因素?

分析：对于蒙题的受试者来说，答对和打错的概率相同：

同时，

，故此二项分布接近正态分布：

根据正态分布概率，当Z=1.645时，该点以下包含了全体的95%。如果用原分数表示，则为

它的意义是，完全凭猜测，10题中猜对8题以下的可能性为95%，猜对8、9、10题的概率只5%。

因此可以推论说，答对8题以上者不是凭猜测，而是会答。

但应该明确：作此结论，也仍然有犯错误的可能，即那些完全靠猜测的人也有5%的可能性答对8、9、10道题。

Relevant Link:

https://baike.baidu.com/item/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83

0x2：二项分布在工厂零件供应质量抽检评估中的作用

1. 问题场景说明

在很多工厂里，通常都会跟零件供应商约定供货合格率，并对每批供货进行抽检，就是所谓的IQC。

现在摆在面前的问题是这样的，实际的货物可能成千上万，你不可能逐一检测效果，而且像食品这种商品本身还是不能检测的，你难道要亲自吃一口看坏没坏？那我们怎么通过抽检的方法来判断这批货物的合格率有多高呢？

一个简单的想法是：随机从这批货物中抽取100个，逐一检测是否是次品，假如出现了5个次品，则这批货物的次品率就是95%。

现在问题来了，这么做合理吗？

显然不合理，反对的理由很简单，尽管抽样是随机的，但是单次的实验并不能代表真实情况，换言之，不具备概率统计性。

改进一下，我们多做几个实验，每次还是随机抽100个，连做10次，将10次的总次品数加起来取平均。这样做比之前的做法稍微更合理一些了，其内核也蕴含了一些概率思维，但是依然不够合理！因为可以问10次实验就够了吗？10次实验同样存在一定的抽样不均匀的概率，那接下来怎么办呢？继续扩大实验，100次、1000次、100000次？那多大的实验次数算合理呢？怎么量化的去评估所谓的合理性呢？

2. 通过二项分布数学模型正确评估和决策该问题 - 假设检验

现在我们将问题纳入二项分布的概率统计范畴内，使用假设检验的理论框架来解决这个问题。

总体思路是这样的：我们将次品抽检会出现的结果抽象为一个随机事件，先假设一个随机试验概率（即供应商承诺的合格率），这就是假设检验中的假设过程，然后进行n次伯努利实验，并根据实际的n次伯努利实验结果。

现在假设供货商承诺的合格率为97%，我们抽检10个货物进行次品检验，检验结果后发现了x个次品。

则有p=0.97，n=10，X~B(n，p) = X(10，0.97)，知道了概率分布的参数，实际上我们也就得到了概率密度函数P(X=x)。

接下来就是根据实际的试验结果，查询其对应在概率密度函数上的概率值，进行置信检验。

1）x = 1：发现1个次品

P(X=1) = 10 * 0.97^9 * 0.03 = 0.228

计算结果表明按照我们的假设概率，在10次抽检中出现1个次品的概率为0.228，也就是说我们有22.8%的置信度可以相信这个假设概率，这就是假设检验中的检验过程。

一般来说，22.%的概率不算低了，在实际的工业实践中，工厂一般会选择接受这样的检验结果，即认可供货商这批货的合格率是97%。

2）x = 2：发现2个次品

我们继续讨论实验结果，那抽出2个不合格的呢？同样可以算出

P(X=2) = 45 * 0.97^8 * 0.03^2 = 0.032

可以看到，概率非常小，只有3.2%，继续推广，抽出超过2个以上不合格品的概率会更小。因此决策者应该拒绝该假设，即不认可供货商提供了97%的合格率。

3. 根据假设检验得到决策依据

因此如果10个样品中有2个或以上的不合格品，则整批的零件合格率肯定达不到97%，可以整批退货。

推而广之，如果约定的合格率是99.5%，则出现0个、1个、2个不合格品的概率分别为0.951、0.0478、0.001，如此10个只要抽出1个不合格品就可以整批退货了。这里省略计算过程。

4. 如何评估和选择适合自己的业务场景的抽检方案

接下来我们继续思考前面提的一个问题，到底应该抽多少样本合适呢？每次抽100个？每次抽10000个？显然抽的越多代表性越好，但是显然我们不可能无限地增加，抽样是有经济损失的，我们需要找一个损失与收益能平衡最大化的标准。如何用概率的思维量化地评估这个数字呢？我们接下来讨论这个问题。

假设你与供应商约定的接收合格率是99%，即AQL(接收质量限)=0.01，本批的总数量是1000只，现在我们现在准备了3种抽检方案：

国际方案GB/T2828标准：抽样量为80，Ac=2，即抽到2个及以下不合格品可接收该批，抽到3个及以上不合格品则拒绝接收
方案一：限于财力，稍微少抽样一些，抽20个，不合格品为0接收，大于0退回
方案二：财力还可以，多抽样一些，抽50个，不合格品不超过1则接收，大于1则退回

接下来，我们开始抽检，接受者根据抽检结果进行决策的结果只有两个：

实际批合格率低于约定合格率，仍被接收：接受者承担的风险属于使用者风险
实际合格率高于约定，仍然存在拒收的风险，虽然这个风险并不大：生产者承担的这一类的风险叫做生产者风险

如果这批来料合格率只有98%，按照以上抽检方案，接收的概率分别为：

国际方案GB/T2828标准：0.784419
方案一：0.6676
方案二：0.7357

如果这批来料合格率高于约定合格率，如99.5%，拒收的概率分别为：

国际方案GB/T2828标准：0.007712
方案一：0.09539
方案二：0.026132

咋一看这三种方案性能差不多，在面对“实际合格率低于承诺”和“实际合格率高于承诺”这两种情况时，都有较大的概率能支持决策者作出正确的决策。

要解决这个问题，需要借助函数分析的思维方式，即不同的抽检方法底层是不同的二项分布概率密度函数，不同的概率密度函数具有不同的函数分布于函数性质。我们不单是评估各个抽检方案在单个点上的表现，而是要看各个抽检方案在整个可能样本空间上的整体表现。

每一种方案的两类风险，都可以画出OC曲线。如下：

图中横坐标为实际的批不合格率，纵坐标为接收概率，曲线下方为接收概率，上方为拒收概率。

可以看出即使来料不合格率远高于约定，接收的概率还是很大的。

黄色的矩形框称为理想曲线，理想的情况下，批不合格率低于约定肯定接收，而超过约定则肯定拒收，但这种理想曲线是不可能达到的，只能尽可能接近。

下面我们再看看三种抽样方案的OC曲线之间的对比。

可以看到，国标方案的下降趋势要比另外两种要快，更接近理想曲线。

笔者认为，概率论不是给人100%精确的答案的，相反，概率论中所有结果都是一个概率分布，一切皆有可能。概率论的主要目的是给出一个事物结果的发生概率区间，以及置信度，给决策者一个清晰明确的决策依据，至于最终如何决策，还需要决策者自己结合自身具体情况而定。

Relevant Link:

https://zhuanlan.zhihu.com/p/24692791

4. 在各个学科领域里概率分布函数的应用于变化

概率分布与数理统计不仅是在纯机器学习领域的一个理论研究成果，在各个具体的应用学科里也被广泛的时候，其中也包括笔者所在的网络安全领域。笔者这里列举一些典型的概率统计的应用场景。

0x1：统计语言模型

在统计语言模型中，通过统计每个词组的词频（words group frequency）得到词组的词频直方图，这个直方图本质上就是一个离散型随机变量X，随机变量X代表每个词组的词频权重。

统计语言模型通过词组词频随机变量来抽象概括输入文本的文本语言特征。

关于统计语言模型的相关讨论，可以参阅另一篇文章。

0x2：基于数理统计方法的地质模型不确定性评价

王鹏飞，高振南，李俊飞，等．基于数理统计方法的地质模型不确定性评价［Ｊ］．地质科技情报

0x3：关于气象灾害笼罩面积与出现概率的一个定理

论文的主要讨论重点可以总结为：

气象灾害(现象) x 的出现概率是可以从当地的多年气象资料的统计中得到的, 它是时间域的问题。
气象灾害(现象) x 在同一时刻在面积 S 上占有的面积问题是可以通过天气图的分析而得到的, 它是空间域的问题。
文章从概率分布上证明了这两个随机变量的概率分布是近似相等的，将时间域问题和空间域这两种含义不同的统计联系到了一起。
简单来说，如果 24h 内有降水的事件的出现概率在全国各地的平均值等于 0.3 (各地平均 3d 有一场雨), 那么雨区占全国总面积的百分比的时间平均值也应当是 0.3, 即平均而言雨区占总面积的 30%。
建立起这两个随机变量之间的近似等价关系之后，就可以进行 t检验，即已知一个随机事件的概率后，检测另一个对应等价随机事件同样也发生的置信度。
简单来说，就是，N 年一遇的灾害如果某年在全国发生的面积为 1/N, 那么这应当属于正常年份。如果受灾面积超过 1/N，则说明该年不正常。

0x4：一种基于概率分布的投标报价方法

论文的主要观点可以总结为：

作者通过对企业的历史项目招投标以及运营收益的数据收集，并进行统计分析。对项目成本、投标价格、项目利润收益期望这几个随机变量进行建模。最后通过计算利润收益期望的极值，得到一个“投标价格和企业收益的概率分布函数推导公式”，得到一个相对准确的投标报价模型。

使得投资者可以根据自己的报价预估可能的利润收益，同时也可以根据预期的利润收益反推应该采取的报价策略和措施。

0x5：概率统计与数理分析在各个学科场景中的应用

有一点笔者希望提出的是，在工程实践的复杂场景中，不要总想着用我们已知的一些经典概率统计模型去“套用”，例如说“我尝试用正态分布来对一个现象进行建模，也不管实际数据拟合程度如何，就强行硬套”。在很多时候，经典的概率分布函数也不足以描述事物的所有规律与变化，这时候需要提出新的概率密度函数，或者基于经典概率分布函数进行组合改造，使其更加符合实际的数据分布表现。

Relevant Link:

http://xueshu.baidu.com/s?wd=%E6%A6%82%E7%8E%87%E5%88%86%E5%B8%83%E5%87%BD%E6%95%B0%E5%9C%A8%E5%90%84%E4%B8%AA%E5%AD%A6%E7%A7%91%E9%A2%86%E5%9F%9F%E7%9A%84%E5%BA%94%E7%94%A8&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_hit=1
http://xueshu.baidu.com/usercenter/paper/show?paperid=de08e07cdd644a2a4c90260a6056f011

5. 生成式模型和判别式模型的对立与统一

以概率分布函数为主的统计应用，主要是围绕生成式模型进行研究和开发，他们更注重了解事物的规律本身，以此来更好的指导决策。

另一方面，像深度神经网络这类机器学习算法，主要是围绕判别式模型进行研究和开发，他们更加注意数据和算法本身，主要的目标是获得一个泛化能力更好的模型，对模型的内部参数以及概率分布并不十分关心。

6. 基于系统在不同时域中的概率分布函数的状态变化进行异常检测

开题可行性调查：同一个系统，如果没有外力作用或内部状态发生巨变的情况下，特征函数应该稳定收敛为一个特定的概率分布函数上，相反，如果有异常发生，则该系统的特征函数会发生状态跃迁，具体的表现就是概率分布函数的参数发生变化。

具体的变换程度可以通过”变化显著性“进行量化度量。

相关话题讨论可以wechat或者emai和我交流。

你可能感兴趣的:(关于概率分布理论的原理分析的一些讨论，以及经典概率分布的应用场景，以及概率统计其在工程实践中的应用)

淘宝客劫持插件功能演示解析喵喵蜜
本文还有配套的精品资源，点击获取简介：淘宝客劫持插件通过改变用户购物链接为带有推广ID的链接，使推广者在用户购买后获得佣金。演示内容包括插件安装、链接转换机制、用户无感知操作、安全性与隐私、收益追踪、兼容性测试、源码说明、许可证和法律合规性，以及教程示例。该插件是一种网络营销工具，需在用户体验和合规性间找到平衡，对于推广者和浏览器扩展开发者具有实用价值。1.淘宝客劫持插件功能概述在电商行业竞争日益
exfat默认配置大小_U盘exFAT格式好不好？格式化分配单元大小多少合适？喵喵蜜 exfat默认配置大小
2019年9月1日通常，格式化分配单元越小，节省的空间越多。分配单元越大，节省的时间越多，但浪费空间。这看起来似乎分配单元小能节省空间，但事实并非如此。文件分割的块越多，特别是当这些存储器单元分散时，它会浪费一些时间来读取数据。分配单元大小是系统读取和写入磁盘，和可移动存储设备的最小单元。在极限速度内，分配单元的尺寸越大，读/写速度越快，反之亦然。但在这里我们必须注意一个问题，分配的单位越大，浪费
Adobe Premiere Pro2023配置要求小魚資源大雜燴 adobe windows
Windows系统最低配置处理器：Intel®第六代或更新版本的CPU，或AMDRyzen™1000系列或更新版本的CPU，需要支持AdvancedVectorExtensions2（AVX2）。操作系统：Windows10（64位）v20H2或更高版本。内存：8GB的RAM。GPU：2GB的GPU内存。存储：8GB可用硬盘空间用于安装，安装期间所需的额外可用空间，不能安装在可移动闪存存储器上，还
【商城实战(23)】筑牢安全防线，防范常见漏洞奔跑吧邓邓子商城实战安全商城实战 uniapp SpringBoot Element plus SQL注入 CSRF
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
Mina 框架武涛的技术博客 java 框架技术服务器 netty
java服务器端开发。J2SE、TCP/UDP协议。mina与netty都是TrustinLee的作品，异步的NIO框架,将UDP当成"面向连接"的协议一、组件管理Mina的底层依赖的主要是JavaNIO库，上层提供的是基于事件的异步接口(1)IoService(最底层[起点])作用：隐藏底层IO的细节，对上提供统一的基于事件的异步IO接口IOSocketAcceptor和IOSocketChan
全网最详细的Kafka应用教程【建议收藏】 Java布道者 kafka 分布式
Kafkakafka是什么？kafka仅仅是属于消息中间件吗？kafka在设计之初的时候开发人员们在除了消息中间件以外，还想吧kafka设计为一个能够存储数据的系统，有点像常见的非关系型数据库，比如说NoSql等。除此之外还希望kafka能支持持续变化，不断增长的数据流,可以发布和订阅数据流，还可以对于这些数据进行保存也就是说kafka的本质是一个数据存储平台，流平台，只是他在做消息发布，消息消费
数据分析面试全攻略：项目经验篇代码CC 数据分析（包括各种面试题）数据分析面试 python
引言：为什么项目经验是数据分析面试的“敲门砖”？在数据分析岗位的面试中，项目经验是最核心的竞争力证明。HR视角：80%的面试官会通过项目细节判断候选人的真实能力技术视角：项目是数据清洗、建模分析、业务落地的综合体现误区警示：单纯罗列工具名称（如Python/SQL）≠具备实战能力本文将系统讲解如何用STAR法则包装项目、如何选择高含金量数据集、以及如何通过和鲸社区快速积累实战经验。文末提供10个可
Rpm安装Docker 星光落入你灰蒙蒙的眼 Docker docker linux 运维容器 kubernetes
如果您不能使用Docker的存储库来安装Docker，您可以下载.rpm文件并手动安装。每次要升级Docker引擎时，都需要下载一个新文件。官方文档1、登录https://download.docker.com/linux/centos/并选择您的CentOS版本。然后浏览到x86_64/stable/Packages/，下载您想要安装的Docker版本的.rpm文件#已Centos7.9为例mk
vue2和vue3的diff算法有什么区别？浮生无聊 vue.js javascript 前端面试
1、diff算法是什么？diff算法是一种通过同层的树节点进行比较的高效算法。其有两个特点：只会在同层进行比较，不会跨层比较在diff比较过程中，循环从两边向中间比较diff算法在很多场景下都有应用，在vue中，作用于虚拟dom渲染成真实dom的新旧虚拟节点比较。diff整体策略为：深度优先，同层比较。Vue2和Vue3中的diff算法的主要区别：1、vue2的diff算法vue2使用了经典的di
HarmonyOS第21天：解锁分布式技术，开启跨设备协同新体验老三不说话、 HarmonyOS开发 harmonyos 分布式华为
一、HarmonyOS分布式技术：开启万物互联新时代在物联网蓬勃发展的今天，设备之间的互联互通不再是遥不可及的梦想，而是真切融入日常生活的现实。从智能家居设备的联动控制，到智能办公场景中的高效协作，再到智能出行中的无缝体验，我们越来越依赖设备之间的协同工作。HarmonyOS的分布式技术，正是这股万物互联浪潮中的关键力量，它打破了设备之间的界限，为用户带来了前所未有的跨设备协同体验，让多设备联动从
HarmonyOS第24天:鸿蒙应用安全秘籍：如何为用户数据筑牢防线？老三不说话、 HarmonyOS开发 harmonyos 华为
开篇引入在数字化时代，我们的生活越来越依赖各种应用程序。从社交娱乐到移动支付，从健康管理到工作学习，应用已经渗透到生活的方方面面。然而，随着应用使用的日益频繁，用户隐私数据泄露的风险也在不断增加。前几年，某知名社交平台被曝光数百万用户数据泄露事件，用户的个人信息、聊天记录等敏感数据被非法获取并在暗网上出售。这一事件引发了轩然大波，让人们深刻意识到应用安全与隐私保护的重要性。类似的案例还有很多，如某
一周热点：微软攻克语音输入、文本输出难题-Phi-4-multimodal 数据分析能量站机器学习人工智能
微软Phi-4-multimodal模型是人工智能领域的一个重要进展，它标志着微软在多模态人工智能技术上的突破。以下是对该模型的详细解释：模型概述微软Phi-4-multimodal是一个能够同时处理文本、图像和语音的多模态大型语言模型。它通过创新的架构和训练方法，实现了在不同模态之间的无缝交互，为用户提供更自然、更智能的交互体验。模型架构该模型采用多模态Transformer架构，通过LoRA（
MySQL批量数据处理与事务管理 Mr数据杨 Python 数据分析师 mysql 数据库
MySQL是一种广泛应用的关系型数据库管理系统，尤其在数据分析和业务逻辑处理方面具有重要地位。在数据量庞大的业务场景中，批量数据处理和事务管理是提高效率和保障数据一致性的重要手段。掌握高效的批量数据操作方法与事务管理技巧，不仅能够提升操作性能，还能有效降低数据处理的出错率。本教程将深入介绍MySQL数据分析中的批量数据处理与事务管理技巧，覆盖批量数据导入与更新、事务一致性与隔离级别等关键知识，帮助
Python-Django毕业设计医院门诊管理信息系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
centos 8 安装docker（RPM离线）——k8s和docker系列名栩 #容器 docker linux centos
如果无法使用Docker的存储库来安装Docker，可以下载.rpm版本的文件并手动安装。每次要升级DockerEngine时都需要下载一个新文件。前往https://download.docker.com/linux/centos/并选择CentOS版本。然后浏览x86_64/stable/Packages/并下载.rpm要安装的Docker版本的文件。笔记要安装每晚或测试（预发布）包，stab
【设计模式】（22）模板方法模式 xiyubaby.17 设计模式 Java教程设计模式模板方法模式
模板方法模式（TemplateMethodPattern）教程一、模式定义模板方法模式在父类中定义了一个算法的骨架，允许子类在不改变算法结构的前提下重写某些特定步骤。核心目标：复用公共流程，差异化实现细节，确保算法步骤的稳定性和扩展性。二、适用场景统一流程，差异细节：多个类有相同流程但某些步骤实现不同（如数据解析、文档生成）。框架设计：框架定义核心流程，用户通过子类扩展具体行为（如SpringJd
黑客最容易攻击的地方冬冬小圆帽 json
黑客最容易攻击的地方通常集中在应用程序的漏洞、配置错误或用户输入处理不当等方面。1.跨站脚本攻击(XSS)XSS攻击是黑客通过注入恶意脚本到网页中，使其在用户浏览器中执行。常见的XSS攻击点包括：反射型XSS：攻击者将恶意脚本作为参数注入到URL中，服务器未对输入进行过滤，直接将恶意脚本返回给用户。存储型XSS：恶意脚本被存储在服务器上（如数据库），当其他用户访问该页面时，脚本被执行。示例代码：/
二八定律学sed m0_53747349 #linux知识库 linux
sed（流编辑器）是一种强大的文本处理工具，常用于对输入流（文件或管道）进行基本的文本转换。初学者会有畏难情绪，但是我想这个命令的使用是遵循二八定律的，有一些最常见的命令，所以，在生产环境中，寻找什么是sed最常用的操作是有意义的：1.替换文本语法：s/原内容/替换内容/[选项]全局替换（每行所有匹配）:sed's/old/new/g'file.txt替换第N次出现的匹配：sed's/old/ne
CentOS 6 YUM源切换成国内yum源 longerxin2020 Linux centos linux 运维
由于CentOS6已于2020年11月进入EOL（EndofLife），官方软件源已不再提供更新，因此你可能会遇到`yummakecache`命令失败的问题。以下是解决该问题的详细步骤：###解决方案1.**备份原有yum源文件**```bashsudomv/etc/yum.repos.d/CentOS-Base.repo/etc/yum.repos.d/CentOS-Base.repo.back
鸿蒙 @ohos.arkui.componentUtils (componentUtils) 淼学派对 harmonyos 华为
鸿蒙@ohos.arkui.componentUtils(componentUtils)在鸿蒙开发中，@ohos.arkui.componentUtils模块提供了强大的功能，用于获取组件的绘制区域坐标和大小信息。这对于实现动态布局、交互效果以及用户界面测试等场景非常有用。本文将详细介绍如何使用@ohos.arkui.componentUtils模块，并提供一些实际代码示例。一、功能概述@ohos
matlab代码通过一系列的计算和绘图操作，将ZHLY空域的3D结构、跑道、中心点以及地形以可视化的方式展示出来神经网络15044 MATLAB专栏 matlab 3d 数据库
%完整版ZHLY空域3D可视化代码%定义中心点ZHLY的坐标lat_ZHLY=34+44/60+29/3600;%转换为十进制度数lon_ZHLY=112+23
MVC框架详解大王算法软件架构设计指南 mvc
目录一、背景二、MVC框架简介2.1、模型（Model）2.2、视图（View）2.3、控制器（Controller）三、Qt的MVC框架设计3.1、Qt中的模型（Model）3.2、Qt中的视图（View）3.3、Qt中的控制器（Controller）四、MVC架构的优缺点1、MVC的优点(1).分离关注点：(2).促进模块化：(3).代码重用：2、MVC的缺点(1).学习曲线(2).代码复杂性
Java 大视界 -- Java 大数据在智慧交通自动驾驶仿真与测试数据处理中的应用（136）青云交大数据新视界 Java 大视界 java 大数据自动驾驶智慧交通仿真测试数据处理数据存储
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
鸿蒙初级考试备忘肥喵蒙太奇鸿蒙
Module类型Module按照使用场景可以分为两种类型：Ability类型的Module：用于实现应用的功能和特性。每一个Ability类型的Module编译后，会生成一个以.hap为后缀的文件，我们称其为HAP（HarmonyAbilityPackage）包。HAP包可以独立安装和运行，是应用安装的基本单位，一个应用中可以包含一个或多个HAP包，具体包含如下两种类型。entry类型的Modul
mysql 只读事物 baidu_38558076 mysql 学习
MySQL版本:8网上搜了一下mysql的只读事物,说只读事物，只能读取到执行时间点前的内容，事物期间其他事物修改的内容不能读取到从mysql执行结果来看上面说的确实是这样。但这个不能读取其他事物修改的内容，真的是由只读来控制的吗？其实不然，事物读取其他事物变更的数据，还是由事物隔离级别来控制的，由于mysql默认的隔离级别是可重复读（其解决了不可重复读和幻读），所以就出现了”只读事物，只能读取到
清华大学《DeepSeek赋能家庭教育》深度解析：AI如何重塑现代家庭教育模式硅基打工人 AI 人工智能经验分享大数据开源语言模型
引言：家庭教育的困境与AI的破局在数字化与智能化浪潮下，家庭教育面临多重挑战：家长教育能力不足、教育资源分配不均、亲子沟通效率低下、个性化需求难以满足等。清华大学发布的《DeepSeek赋能家庭教育》系列报告（共56页）提出了一种基于人工智能的解决方案，通过深度学习平台DeepSeek，为家庭教育注入科技动能。本文将从技术原理、核心功能、应用场景、伦理安全及未来展望等多维度展开分析。一、DeepS
“震惊！这个小小改变，竟让无数人生活大不同！你绝对想不到！” 山峰999 人工智能计算机视觉
在这个快节奏的时代，每一天都有无数的信息冲击着我们的眼球，但真正能让我们眼前一亮、心头一动的却寥寥无几。今天，我要揭秘的，正是一个看似微不足道，实则威力无穷的“生活小妙招”。它不仅在网络上引起了轩然大波，更让无数实践者惊叹：“原来，幸福和便捷，真的可以如此触手可及！”你准备好迎接这份惊喜，让自己的生活也来个大变身了吗？那就继续往下读，保证让你大开眼界！在数字时代，照片已成为我们记录生活、分享美好瞬
一键解锁压缩烦恼！高效安全免费解压缩神器全面深度剖析山峰999 安全编辑器 microsoft 算法大数据推荐算法
❤亲爱的小伙伴们，我不定期分享好玩有趣的软件！部分小伙伴有这个需求，为了不错过我们的每一次分享，请大家记得回复互动留言，及时联系就能找到你需要的宝贝，这样大家每天都可以接收和享受到好玩有趣的推送了！❤❤❤你无需担心试用过期或反复提示购买的问题，解压缩神器国际版本承诺永久免费，让你可以无负担地享受压缩服务。在数据压缩与解压领域，一款高效、安全且易用的工具无疑是每位用户的首选。解压缩神器，作为一款的免
Python 入门『六哥』 Python python 开发语言
Python安装检测许多PC和Mac都已经安装了python。如果需要检查是否已在WindowsPC上安装了python，请在开始栏中寻找Python或在命令行（cmd.exe）上运行以下命令:C:\Users\YourName>python--version如果是检查是否在Linux或Mac上安装了python，请在Linux上打开命令行或在Mac上打开终端并键入:python--version
【蓝桥杯速成】| 4.递归最好的药物是乌梅算法 leetcode 数据结构
递归题目一：最大公约数问题描述1979.找出数组的最大公约数-力扣（LeetCode）给你一个整数数组nums，返回数组中最大数和最小数的最大公约数。两个数的最大公约数是能够被两个数整除的最大正整数。解题步骤需要返回数组中最大最小值的最大公约数那么首先需要求出最大最小值可以使用for循环遍历得到intminnum=INT_MAX,maxnum=INT_MIN;for(inti=0;imaxnum)
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu