好好学习的星熊

如何根据样本估计总体的均值、比例与方差？如何进行参数估计及选择对应公式？

本章内容：

相关专业名词解释

如何估计一个总体参数的范围，及如何选择对应的公式？

如何估计两个总体参数的范围，及如何选择对应的公式？

如何确定总体估计时需要的样本量？

7.1 涉及的专业名词解释

7.1.1 估计量与估计值_名词解释

参数估计
用样本统计量去估计总体的参数。

估计量
用来估计总体参数的统计量称为估计量，用 $\hat{\theta}$ 表示。样本均值、样本比例、样本方差都可以是一个估计量。

估计值
根据一个具体的样本计算出来的估计量的数值，称为估计值。比如用样本量计算出来的平均值作为总体的平均值，那么这个平均值在这时就称为估计值。

7.1.2 点估计与区间估计

excel中计算指定概率对应的面积公式：=normsinv(指定的概率)
例：当显著性为5%时， $Z_{\alpha/2}=normsinv(1-\frac{5\%}{2})=normsinv(0.975)$

点估计

用样本统计量 $\hat{\theta}$ 的某个取值直接作为总体参数 $\theta$ 的估计值。比如用样本均值 $\bar{x}$ ，作为总体均值 $\mu$ 的估计值。

在重复抽样条件下，点估计的均值可望等于总体真值。

由于样本是随机的，抽出一个具体的样本得到的估计值很可能不同于总体真值，所以在使用点估计代表总体参数值时，需要给出点估计值的可靠性，即说明点估计值与总体参数的真实值的接近程度。

由于点估计值的可靠性由抽样标准误差衡量，所以具体的点估计值无法给出估计可靠性的度量，故需要围绕点估计值构造总体参数的一个区间，这是区间估计。

区间估计
给出总体参数估计的一个区间范围，该区间通常由样本统计量加减估计误差得到。

与点估计不同，区间估计时，根据样本统计量的抽样分布可以对样本统计量与总体参数的接近程度给出一个概率度量。

置信区间
样本统计量所构成的总体参数的估计区间称为置信区间，其中区间的最小值称为置信下限，最大值称为置信上限。

可以理解为假设在需要估计GMV，估计的正确率需要达到95%，在95%的概率下计算出来GMV处于[100,101]，得出的这个区间就是置信区间。

置信水平
置信区间中包含总体参数真值的次数所占的比例称为置信水平，也称为置信度，表示为 $1-\alpha$ ，其中 $\alpha$ 表示错误率，也称为显著性水平。

可以理解为参数估计的正确率，如上述GMV例子中的95%。

样本量、置信水平与置信区间的关系
当样本量给定时，置信区间的宽度随着置信水平的增大而增大；
当置信水平固定时，置信区间的宽度随着样本量的增大而减小，即较大的样本所提供的有关总体的信息更多。

对置信区间的理解，有3点需注意：

怎么理解置信水平为95%的置信区间？
如果用某种方法构造的所有区间中有95%的区间包含总体样本的真值，5%的区间不包含总体参数的真值，那么用该方法构造的区间称为置信水平为95%的置信区间。
置信区间会因为样本不同而不同；
总体参数的真值是固定的、未知的，而样本构造的区间是不固定的。所以置信区间是一个随机区间，会因为样本的不同而不同，而且不是所有的区间都包含总体参数的真值。
置信水平是针对随机区域而言的；
不是用来描述某个特定区间包含总体参数真值的可能性。

比如某班级学生平均考试成绩置信水平为95%的置信区间为[60,80]，不能说60~80分以95%的概率包含全班学生平均考试的真值。我们只知道在多次抽样中，95%的样本得到的区间包含全班学生平均考试成绩的真值。

7.1.3 评价估计量的标准

无偏性

样本期望与总体参数无偏，即估计量抽样分布的数学期望等于被估计量总体参数；
设总体参数为 $\theta$ ，样本的估计量为 $\hat{\theta}$ ，如果 $E(\hat{\theta})=\theta$ ，则称 $\hat{\theta}$ 为 $\theta$ 的无偏估计。

当样本均值的期望值等于总体均值，样本比例的期望值等于总体比例，那么样本方差的期望值等于总体误差。

有效性
更小标准差的估计量更有效；对同一总体参数的两个无偏估计量，有更小标准差的估计量更有效。

一致性
估计量与总体一致；随着样本量的增大，估计量的值越来越接近被估总体的参数，即样本量越大，标准差应该越小

7.2 如何估计一个总体参数的范围，及如何选择对应的分布公式？

总体思路：
根据样本和总体数据集的情况，以及需要求的参数是什么，来选择不同的分布公式。将指标带入公式计算，则得到总体的参数估计量。

比如：想通过样本数据集，求总体的均值是多少。如果样本数据集是大样本，则选择Z分布的公式；如果是小样本，则需要看总体的方差是否已知，如果总体方差不可得，则选择t分布的公式。

☑️ 对不同的参数进行估计，对应选择的不同分布

7.2.1 如何对总体均值的区间进行估计？

不同情况下总体均值的区间估计公式

z分布区间计算的excel公式：

=avg(样本值)±normsinv(1-$\alpha/ $2) * 标准差 /$ \sqrt{样本数量}$

估计总体均值，等于样本均值±给定显著性水平下的面积*标准差/样本数量开平方。即样本均值±均值估计误差

excel中，t分布的临界值公式：=tinv(a,df)，其中a为对应与双尾t分布的概率，df为自由度。
例如求 $t_{\alpha/2}$ ，其中a=0.05，则公式为：=tinv(0.05,20)

☑️ 总体均值区间估计的考虑因素：

总体是否为正态分布
总体方差是否已知
估计量的样本是大样本（n≥30）还是小样本（n<30）

情况一：正态分布， $\sigma^2$ 已知；总体不是正态分布，大样本

样本均值 $\bar{x}$ 的抽样分布均为正态分布， $E(\bar{x})=\mu$ ， $D(\bar{x})=\frac{\sigma^2}{n}$ ，样本经过标准化以后的随机变量服从标准正态分布：

$z=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim{N(0,1)}$

根据以上条件，再加上正态分布的性质，可以得出总体均值 $\mu$ 在 $1-\alpha$ 置信水平下的置信区间为：

$\bar{x}\pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}}$

$\alpha$ 称为显著性水平，也就是错误率；
$1-\alpha$ 称为置信水平；
$z_{\alpha/2}$ 是当显著性水平为 $\alpha/2$ 时的总体面积；
$\frac{\sigma}{\sqrt{n}}$ 是总体标准误差；
$z_{\alpha/2}\frac{\sigma}{\sqrt{n}}$ 是估计总体均值时的估计误差；

情况二：正态分布， $**\sigma^2$ 未知；总体不是正态分布，大样本**

样本均值 $\bar{x}$ 的抽样分布均为正态分布， $E(\bar{x})=\mu$ ，使用样本方差 $s^2$ 代替总体方差 $\sigma^2$ ，样本经过标准化以后的随机变量服从标准正态分布：

$z=\frac{\bar{x}-\mu}{s/\sqrt{n}}\sim{N(0,1)}$

根据以上条件，再加上正态分布的性质，可以得出总体均值 $\mu$ 在 $1-\alpha$ 置信水平下的置信区间为：

$\bar{x}\pm z_{\alpha/2}\frac{s}{\sqrt{n}}$

$\alpha$ 称为显著性水平，也就是错误率；
$1-\alpha$ 称为置信水平；
$z_{\alpha/2}\frac{s}{\sqrt{n}}$ 是估计总体均值时的估计误差；

情况三：正态分布， $\sigma^2$ 未知，小样本

样本均值 $\bar{x}$ 的抽样分布均为正态分布， $E(\bar{x})=\mu$ ，样本均值经过标准化以后的随机变量则服从自由度为（n-1）的t分布：

$t=\frac{\bar{x}-\mu}{s/\sqrt{n}}\sim{t(n-1)}$

根据以上条件，再加上正态分布的性质，可以得出总体均值 $\mu$ 在 $1-\alpha$ 置信水平下的置信区间为：

$\bar{x}\pm t_{\alpha/2}\frac{s}{\sqrt{n}}$

$\alpha$ 称为显著性水平，也就是错误率；
$1-\alpha$ 称为置信水平；
$t_{\alpha/2}$ 是自由度为（n-1）时，t分布中右侧面积为 $\alpha/2$ 时的t值；

t分布
类似正态分布的一种对称分布，通常比正态分布平坦和分散，一个特定的t分布依赖于称之为自由度的参数。随着自由度的增大，t分布逐渐趋于正态分布。

7.2.2 如何对总体比例的区间进行估计？

本章内容的前提条件：
此节只讨论大样本情况的总体比例的估计问题。

对于总体比例的估计，确定样本是否足够大的一般经验规则是：
区间 $p\pm2\sqrt{p(1-p)/2}$ 中不包含0或1，或者要求np≥5和n(1-p)≥5

总体比例 $\pi$ 已知时：
由样本比例p的抽样分布可知，当样本量足够大时，样本比例p的抽样分布可用正态分布近似。p的数学期望为 $E(p)=\pi$ ；p的方差为 $\sigma_p^2=\frac{\pi(1-\pi)}{n}$ 。

样本比例经标准化后的随机变量服从标准正态分布，公式如下：

$z=\frac{p-\pi}{\sqrt{\pi(1-\pi)/n}}\sim{N(0,1)}$

总体比例 $\pi$ 在 $1-\alpha$ 置信水平下的置信区间为：

$p\pm z_{\alpha/2}\sqrt{\frac{\pi(1-\pi)}{n}}$

总体比例 $\pi$ 未知时：
如果 $\pi$ 未知，需要用样本比例p来代替 $\pi$ ，这时置信区间为：

$p\pm z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}$

案例：估算总体比例的置信区间

7.2.3 如何对总体方差的区间进行估计？

本节内容前提条件
此节只讨论正态总体方差的估计问题。

excel中， $\chi^2$ 分布概率计算公式为：=chiinv(概率，自由度)

$\chi^2$ 分布与总体方差区间估计公式

根据样本方差的抽样分布可知，样本方差服从自由度为n-1的 $\chi^2$ 分布。

在给定显著性水平 $\alpha$ ， $\chi^2$ 分布构造的总体方差 $\sigma^2$ 的置信区间如下图所示：

由于 $\frac{(n-1)s^2}{\sigma^2}\sim{\chi^2(n-1)}$ ，故可得：

$\chi_{1-\alpha/2}^2\le{\frac{(n-1)s^2}{\sigma^2}}\le{\chi_{\alpha/2}^2}$

从而推导出总体方差的置信区间为：

$\frac{(n-1)s^2}{\chi_{\alpha/2}^2}\le{\sigma^2}\le{\frac{(n-1)s^2}{\chi_{1-\alpha/2}^2}}$

7.3 如何估计两个总体参数的区间范围，及如何选择对应的分布公式？

7.3.1 如何估计两个总体的均值之差的区间范围？

情况一：独立大样本时
如果两个样本是从两个总体中独立抽取，且两个总体都为正态分布；或两个总体不服从正态分布，但两个样本都是大样本（n≥30）。

其中总体均值为 $\mu_1$ 、 $\mu_2$ ；样本均值为 $\bar{x}_1$ 、 $\bar{x}_2$ 。

那么两个样本均值之差 $\bar{x}_1-\bar{x}_2$ 的抽样分布服从期望值为 $(\mu_1-\mu_2)$ 、方差为 $(\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})$ 的正态分布。

两个样本均值之差经标准化后服从标准正态分布，即

$z=\frac {(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)} {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim{N(0,1)}$

当两个总体的方差 $\sigma_1^2$ 、 $\sigma_2^2$ 已知时，两个总体均值之差在 $1-\alpha$ 的置信水平下，置信区间为：

$(\bar{x}_1-\bar{x}_2)\pm z_{\alpha/2}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$

当两个总体的方差 $\sigma_1^2$ 、 $\sigma_2^2$ 未知时，可用样本方差 $s_1^2$ 、 $s_2^2$ 来代替，两个总体均值之差在 $1-\alpha$ 的置信水平下，置信区间为：

$(\bar{x}_1-\bar{x}_2)\pm z_{\alpha/2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}$

情况二：独立小样本时

当样本都为小样本时，需要假定：
1）两个总体都服从正态分布
2）两个随机样本独立地分别抽自两个总体

当两个总体方差未知但相等时，即 $\sigma_1^2=\sigma_2^2$ ，可以将两个样本的数据组合在一起，给出总体方差的合并估计量 $s_p^2$ ，公式为

$s_p^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2} {n_1+n_2-2}$

这时，两个样本均值之差标准化后服从自由度为 $n_1+n_2-2）$ 的t分布，公式为：

$t=\frac{(\bar{x}_1-\bar{x}_2)-(\mu_1-\mu_2)} {s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim{t(n_1+n_2-2)}$

两个总体均值之差在 $1-\alpha$ 的置信水平下的置信区间为：

$(\bar{x}_1-\bar{x}_2)\pm t_{\alpha/2}(n_1+n_2-2) \sqrt{ s_p^2(\frac{1}{n_1}+\frac{1}{n_2}) }$

当两个总体方差未知且不相等时，两个样本均值之差经标准化后近似服从自由度为 $v$ 的t分布，自由度 $v$ 的计算公式为：

$v=\frac{ (\frac{s_1^2}{n_1} +\frac{s_2^2}{n_2})^2 }{ \frac{(s_1^2/n_1)^2}{n_1-1} +\frac{(s_2^2/n_2)^2}{n_2-1} }$

两个总体均值之差在 $1-\alpha$ 的置信水平下的置信区间为：

$(\bar{x}_1-\bar{x}_2)\pm t_{\alpha/2}(v) \sqrt{ \frac{s_1^2}{n_1} +\frac{s_2^2}{n_2} }$

情况三：匹配样本时

由于独立样本的潜在弊端，可以使用匹配样本，即一个样本中的数据与另一个样本中的数据相对应。

举例：

独立样本时，每种方法随机指派12个工人，可能会将技术较差的12个工人指定给方法1，技术较好的工人指定给方法2，这种不公平的指派可能会掩盖两种方法组装产品所需时间的真正差异。

匹配样本时，先指定12个工人用第一种方法，然后再让这12个工人用第二种方法，这样得到的数据就是匹配数据。

匹配样本可以消除由样本指定的不公平造成的两种方法组装时间上的差异。

大样本条件下，均值之差 $\mu_d=\mu_1-\mu_2$ ，在 $1-\alpha$ 置信水平下的置信区间为：

$\bar{d}\pm {z_{\alpha/2}\frac{\sigma_d}{\sqrt{n}}}$

d表示两个匹配样本对应数据的差值， $\bar{d}$ 表示各个差值的均值；
$\sigma_d$ 表示各差值的标准差。
当 $\sigma_d$ 未知时，可用样本差值的标准差 $s_d$ 来代替。

小样本条件下，假定总体各观察值的配对差服从正态分布。

在 $1-\alpha$ 置信水平下的置信区间为：

$\bar{d}\pm {t_{\alpha/2}(n-1)\frac{s_d}{\sqrt{n}}}$

7.3.2 如何估计两个总体比例之差的区间范围？

由样本比例的抽样分布可知，从两个二项总体中抽出两个独立的样本，该样本比例之差的抽样分布服从正态分布。

两个样本的比例之差经标准化后服从标准正态分布，公式为：

$Z=\frac{ (p_1-p_2)-(\pi_1-\pi_2) }{ \sqrt{ \frac{\pi_1(1-\pi_1)}{n_1} +\frac{\pi_2(1-\pi_2)}{n_2} }} \sim{ N(0,1) }$

当两个总体比例 $\pi_1$ ， $\pi_2$ 未知时，可用样本比例 $p_1$ ， $p_2$ 代替。
即两个总体比例之差 $\pi_1-\pi_2$ 在 $1-\alpha$ 置信水平下的置信区间为：

$(p_1-p_2)\pm z_{\alpha/2} \sqrt{ \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2} }$

7.3.3 如何估计两个总体方差比的区间范围？

方差比的F分布
由于两个样本方差比的抽样分布服从 $F(n_1-1,n_2-2)$ 分布，因此可以用F分布来构造两个总体方差比 $\sigma_1^2/\sigma_2^2$ 的置信区间。图示如下：

由于 $\frac{s_1^2}{s_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2} \sim{F(n_1-1,n_2-1)}$ ，故可以用它来代替F，公式为：

$F_{1-\alpha/2} \le{\frac{s_1^2}{s_2^2}\cdot\frac{\sigma_2^2}{\sigma_1^2}} \le{F_{\alpha/2}}$

由上式可得，两个总体方差比在 $1-\alpha$ 置信水平下的置信区间为：

$\frac{s_1^2/s_2^2}{F_{\alpha/2}} \le{\frac{\sigma_1^2}{\sigma_2^2}} \le{\frac{s_1^2/s_2^2}{F_{1-\alpha/2}}}$

其中， $F_{\alpha/2}$ 和 $F_{1-\alpha/2}$ 是分子自由度为 $n_1-1)$ 和分母自由度为 $n_2-1)$ 的F分布的右侧面积为 $\alpha/2$ 和 $1-\alpha/2$ 的分位数。

可以利用F分布求得 $F_{1-\alpha/2}$ ，公式为：

$F_{1-\alpha/2}(n_1,n_2)=\frac{1}{F_{\alpha}(n_2,n_1)}$

$n_1$ 表示分子自由度； $n_2$ 表示分母自由度

7.4 如何确定总体估计时需要的样本量？

7.4.1 估计总体均值时样本量的确定

总体均值的置信区间由样本均值和估计误差两部分组成。

在重复抽样，或无限总体抽样条件下，估计误差为 $z_{\alpha/2}\frac{\sigma}{\sqrt{n}}$ 。
其中 $z_{\alpha/2}$ 的值和样本量n共同确定了估计误差的大小。
当确定 $1-\alpha$ 时， $z_{\alpha/2}$ 就可以确定。

如果给定 $z_{\alpha/2}$ 和总体标准差 $\sigma$ ，就可以求得任一指定估计误差所需要的样本量，公式如下：

$n=\frac{ (z_{\alpha/2})^2\sigma^2 }{ E^2 }$

其中E代表所希望达到的估计误差。

如果 $\sigma$ 未知，可以用样本的标准差来代替；也可以用试验调查的办法，选择一个初始样本，以该样本的标准差作为 $\sigma$ 的估计值。

样本量与置信水平成正比，置信水平越大，所需的样本量也就越大；
样本量与总体方差成正比，总体的差异越大，要求的样本量也越大；
样本量与估计误差的平方成反比，即可以接受的估计误差的平方越大，所需的样本量越小。

根据公式计算出来的样本数为非整数时，通常取成较大的整数，即样本量的圆整法则。

7.4.2 估计总体比例时样本量的确定

总体均值的置信区间由样本均值和估计误差两部分组成。

在重复抽样，或无限总体抽样条件下，估计误差为 $z_{\alpha/2} \sqrt{ \frac{\pi(1-\pi)}{n} }$ 。
其中 $z_{\alpha/2}$ 的值、总体比例 $\pi$ 、样本量n共同确定了估计误差的大小。
当确定 $1-\alpha$ 时， $z_{\alpha/2}$ 就可以确定。
总体比例的值是固定的，所以估计误差由样本来确定，样本量越大，估计误差就越小，估计的精度越好。

如果给定 $z_{\alpha/2}$ 和总体标准差 $\sigma$ ，就可以求得任一指定估计误差所需要的样本量，公式如下：

$n=\frac{ (z_{\alpha/2})^2\pi(1-\pi) }{ E^2 }$

其中E代表所希望达到的估计误差，大多数情况下，E＜0.10

如果 $\pi$ 未知，可以用类似样本的比例来代替；也可以用试验调查的办法，选择一个初始样本，以该样本的比例作 $\pi$ 的估计值。
当 $\pi$ 无法知道时，通常取使 $\pi(1-\pi)$ 最大时的0.5。

书籍：《统计学（第六版）》
书籍作者：贾俊平

思维导图

【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
【机器学习笔记Ⅰ】10 特征工程
特征工程（FeatureEngineering）详解特征工程是机器学习和数据科学中的核心环节，旨在通过对原始数据的转换、组合和提取，构建更适合模型的高质量特征。其质量直接决定模型性能上限（“数据和特征决定了模型的上限，而算法只是逼近这个上限”）。1.特征工程的核心目标提升模型性能：增强特征与目标变量的相关性。降低计算成本：减少冗余特征，加速训练。改善泛化能力：避免过拟合，提高鲁棒性。2.特征工程的
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习笔记Ⅰ】7 向量化巴伦是只猫机器学习机器学习笔记人工智能
向量化（Vectorization）详解向量化是将数据或操作转换为向量（或矩阵）形式，并利用并行计算高效处理的技术。它是机器学习和数值计算中的核心优化手段，能显著提升代码运行效率（尤其在Python中避免显式循环）。1.为什么需要向量化？(1)传统循环的缺陷低效：Python的for循环逐元素操作，速度慢。代码冗长：需手动处理每个元素。示例：计算两个数组的点积（非向量化）a=[1,2,3]b=[4
条件概率：不确定性决策的基石大千AI助手人工智能 Python #OTHER 决策树算法机器学习人工智能条件概率概率论
条件概率是概率论中的核心概念，用于描述在已知某一事件发生的条件下，另一事件发生的概率。它量化了事件之间的关联性，是贝叶斯推理、统计建模和机器学习的基础。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、定义与公式设(A)和(B)是两个随机事件，且(P(B)>0)：条件概率(P(A\midB))表示
机器学习笔记：MATLAB实践 techDM 机器学习笔记 matlab Matlab
在机器学习领域，MATLAB是一种功能强大且广泛使用的工具，它提供了许多内置函数和工具箱，方便开发者进行各种机器学习任务。本文将介绍一些常见的机器学习任务，并提供相应的MATLAB源代码示例。数据预处理在进行机器学习之前，通常需要对原始数据进行预处理。这包括数据清洗、特征选择、特征缩放和数据划分等步骤。%导入数据data=readmatrix('data.csv');%数据清洗cleaned_da
人工智能-基础篇-2-什么是机器学习？（ML，监督学习，半监督学习，零监督学习，强化学习，深度学习，机器学习步骤等） weisian151 人工智能人工智能机器学习学习
1、什么是机器学习？机器学习（MachineLearning,ML）是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析等数学理论。其核心目标是让计算机通过分析数据，自动学习规律并构建模型，从而对未知数据进行预测或决策，而无需依赖显式的程序指令。基本思想：通过数据驱动的方式，使系统能够从经验（数据）中改进性能，形成对数据模式的抽象化表达。基本概念：模型：模型是对现实世界现
概率密度基本概念 Summer_Anny 概率论
概率密度（ProbabilityDensity）是概率论中用于描述随机变量分布的一种方式，特别适用于连续随机变量。它并不是一个概率值，而是表示单位范围内的概率大小或“浓度”。更具体地说，概率密度表示在某个特定值附近，随机变量可能取到某个值的相对可能性。概率密度的几个关键点：概率密度与概率的关系：概率密度函数（PDF）本身并不能直接给出某个特定值发生的概率。因为对于连续随机变量，单一值的概率是零。然
线性代数和c语言先学哪个,线性代数和哪个更有用？段丞博线性代数和c语言先学哪个
一、从数学与应用数学这个专业来分析下“线性代数”和“高等数学”这两块的内容，无论哪块知识在“考研究生数学科目中的考试”都会涉汲到的，而且有些专业的考试也包括概率论与数理统计这块知识。线性代数和哪个更有用?1、线性代数内容：行列式、矩阵、向量、线性方程组、特征值和特征向量、二次型。2、高等数学内容：函数·极限·连续、导数与微分、不定积分、定积分及广义积分、中值定理的证明、常微分方程、一元微积分的应用
ICBDDM2025：大数据与数字化管理前沿峰会鸭鸭鸭进京赶烤学术会议大数据图像处理计算机视觉 AI编程人工智能机器人考研
在选择大学专业时，可以先从自身兴趣、能力和职业规划出发，初步确定几个感兴趣的领域。然后结合外部环境因素，如专业前景、教育资源和就业情况等，对这些专业进行深入的分析和比较。大数据专业：是一个热门且前沿的学科领域，它涉及到数据的收集、存储、处理、分析和应用等多个方面。课程设置基础课程数学基础：高等数学、线性代数、概率论与数理统计等。这些课程为大数据分析提供了必要的数学工具，例如线性代数在机器学习算法中
第九课：大白话教你朴素贝叶斯顽强卖力机器学习-深度学习-神经网络算法 python 大数据数据分析
这节课咱们来聊聊朴素贝叶斯（NaiveBayes），这个算法名字听起来像是个“天真无邪的数学小天才”，但其实它是个超级实用的分类工具！我会用最接地气的方式，从定义讲到代码实战，保证你笑着学会，还能拿去忽悠朋友！一：朴素贝叶斯是啥？——当概率论遇上“天真”假设1.1定义：贝叶斯定理的“偷懒版”问题：你想判断一封邮件是不是垃圾邮件，或者一条评论是不是好评。贝叶斯定理（原版）：[P(A|B)=\frac
贝叶斯算法：从概率推断到智能决策的基石 weixin_47233946 算法算法
##引言在人工智能与机器学习的蓬勃发展中，贝叶斯算法以其独特的概率推理方式和动态更新的特性，在垃圾邮件过滤、疾病诊断、推荐系统等关键领域展现出强大的应用价值。本文将从概率论基础出发，深入解析贝叶斯算法的核心思想及其实现方式，揭示这一统计学方法如何演变为现代智能系统的决策利器。---##一、贝叶斯定理：概率之门的钥匙###1.1基本公式表述贝叶斯定理的数学表达式揭示事件间的关联关系：$$P(A|B)
清风数学建模个人笔记--模糊综合评价 fvdj0 数学建模笔记
目录一、量二、分类三、模糊函数的三种表示方法四、应用：模糊综合评价（评判）一、量①确定性：经典数学（几何、代数）②不确定性：随机性（概率论、随机过程）灰性（灰色系统）模糊性（模糊数学）二、分类：偏小型：年轻、小、冷中间型：中年、中、暖偏大型：年老、大、热三、模糊函数的三种表示方法（1）模糊统计法（设计调查问卷，不推荐，主观性最弱）（2）借助已有的尺度（需要已有的指标，并能收集到数据）论域模糊集隶属
【西瓜书】机器学习（周志华）学习问题记录 _linyu__ 基础知识机器学习周志华西瓜书
简述西瓜书的鼎鼎大名早有耳闻，于是毫无疑问买来入门。写此文章的时候刚要做完第二章的练习题。在看的时候有一些感慨：需要一定的数理基础，尤其是概率论的内容。但是如果没学过也不建议直接去啃概率论，只要把相关的部分看看即可。周老师默认我们能力很强，所以有些地方说得不够详细，仅靠此书无法理解，需要自己另行查阅。有一些疑似谬误的地方，但是我自己能力较差，又苦于没有人佐证，所以并不敢说周老师一定错了。在看的过程
数学中的泛函分析与算子理论 AI天才研究院计算 AI大模型应用入门实战与进阶 ChatGPT 实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA 计算 AI大模型应用
1.背景介绍1.1数学的发展与泛函分析的产生数学作为一门科学，自古以来就在不断地发展和演变。从最初的算术、几何，到后来的微积分、线性代数，再到现代的拓扑学、概率论等，数学的研究领域不断扩展。泛函分析作为一门现代数学的分支，起源于20世纪初，它主要研究无限维空间中的函数和算子，为许多现代科学和工程问题提供了理论基础。1.2泛函分析与算子理论的关系泛函分析与算子理论密切相关。泛函分析主要研究无限维空间
机器学习笔记【Week9】 kuiini 人工智能机器学习人工智能
一、异常检测问题动机在现实中，我们经常会遇到“异常检测”的任务：识别罕见、异常、不符合正常模式的数据点。例：工业设备故障检测，银行欺诈识别，异常流量检测等。核心特点：异常样本稀少，难以用监督学习训练模型。二、高斯分布建立算法前，需要假设每个特征满足高斯（正态）分布。在单一特征xjx_jxj上：p(xj;μj,σj2)=12π σjexp⁡(−(xj−μj)22σj2)p(x_j;\mu_j,\si
【图像处理入门】8. 数学基础与优化：线性代数、概率与算法调优实战小米玄戒Andrew 图像处理：从入门到专家图像处理线性代数算法 python 计算机视觉概率论算法调优
摘要图像处理的核心离不开数学工具的支撑。本文将深入解析线性代数、概率论在图像领域的应用，包括矩阵变换与图像几何操作的关系、噪声模型的数学描述，以及遗传算法、粒子群优化等智能算法在参数调优中的实践。通过理论结合代码案例，帮助读者掌握从数学原理到工程优化的完整链路。一、线性代数：图像变换的数学基石1.矩阵运算与图像几何变换在图像处理入门3中，我们通过仿射变换矩阵实现图像平移、旋转与缩放。其本质是线性代
AI大模型从0到1记录学习大模型技术之机器学习 day27-day60 Gsen2819 算法大模型人工智能人工智能学习机器学习
机器学习概述机器学习（MachineLearning,ML）主要研究计算机系统对于特定任务的性能，逐步进行改善的算法和统计模型。通过输入海量训练数据对模型进行训练，使模型掌握数据所蕴含的潜在规律，进而对新输入的数据进行准确的分类或预测。机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。人工智能、机器学习与深度学习人工智能（AI）是计算机科学的一个广泛领域，
大数定律与中心极限定理：概率论的双子星 Algo-hx 概率论与数理统计概率论
目录引言5大数定律与中心极限定理5.1大数定律：频率的稳定性5.1.1辛钦大数定律定理内容5.1.2伯努利大数定律定理内容5.1.3切比雪夫大数定律定理内容对比总结表5.2中心极限定理：正态分布的普适性5.2.1独立同分布情形定理内容图释5.2.2李雅普诺夫定理定理内容核心思想图释5.2.3棣莫弗-拉普拉斯定理定理内容应用条件图释对比总结表5.3定理对比：LLNvsCLT引言当随机现象的个体行为无
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

如何根据样本估计总体的均值、比例与方差？如何进行参数估计及选择对应公式？

7.1 涉及的专业名词解释

7.1.1 估计量与估计值_名词解释

7.1.2 点估计与区间估计

7.1.3 评价估计量的标准

7.2 如何估计一个总体参数的范围，及如何选择对应的分布公式？

7.2.1 如何对总体均值的区间进行估计？

7.2.2 如何对总体比例的区间进行估计？

7.2.3 如何对总体方差的区间进行估计？

7.3 如何估计两个总体参数的区间范围，及如何选择对应的分布公式？

7.3.1 如何估计两个总体的均值之差的区间范围？

7.3.2 如何估计两个总体比例之差的区间范围？

7.3.3 如何估计两个总体方差比的区间范围？

7.4 如何确定总体估计时需要的样本量？

7.4.1 估计总体均值时样本量的确定

7.4.2 估计总体比例时样本量的确定

你可能感兴趣的:(机器学习笔记,概率论)