数据人的自我救赎

【抽样技术】CH2 简单随机抽样

前言

一、定义

二、概述

1.总体

2.单元

3.抽样比

4.样本抽取原则

5.在抽样理论中的地位与作用

三、参数估计

1.参数表示

2.对总体特征的估计思路

3.对总体均值的估计

（1）引理

（2）对总体均值的估计

4.方差和协方差的估计

5.区间估计

6.样本量的确定

（1）费用

（2）步骤

（3）精度(编辑编辑编辑)

（4）估计总体均值时样本量的确定方法

7.对总体比例的估计

（1）总体比例的估计量

（2）总体比例估计量的方差

（3）估计总体比例时样本量的确定

8.总体总值的简单估计

（1）总体总值的简单估计

（2）总体总值简单估计量的性质

（3）估计总体总值时估计量的确定

9.放回简单随机抽样的估计

10.设计效应（）

（1）定义

（2）的作用

（3）设计效应和样本量的确定

四、附表——抽样理论&数理统计的比较

前言

学习一种抽样方法必须掌握的五个要点：

该抽样方法的定义
实施抽样的方法
利用该抽样方法所得数据进行参数估计的方法
估计量的性质：期望、方差
估计量方差（精度）的估计方法

一、定义

1.从总体的个单元中，一次整批抽取个单元，使任何一个单元被抽中的概率都相等，任何n个不同单元组成的组合被抽中的概率也都相等，这种抽样成为简单随机抽样（s.r.s）。

2.从总体的个单元中，逐个不放回地抽取单元，每次抽到尚未入样的任何一个单元的概率都相等，直到抽足个单元为止，这样所得的个单元组成一个简单随机样本。（现实中采用的方法）

【注】

对于简单随机抽样，依次抽到一组特定样本单元的概率为：

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20P%28%20y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2C%20y_%7B2%7D%3DY_%7Bi_%7B2%7D%7D%2C%5Ccdots%20%2C%20y_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D$

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7D%20%7DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2Cy_%7B2%7D%3DY_%7Bi_%7B2%7D%7D%2C%5Ccdots%20%2Cy_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%29P%28y_%7B2%7D%3DY_%7Bi_%7B2%7D%7D%7Cy_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%29%5Ccdots%20P%28y_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%7Cy_%7B1%7D%3DY_%7Bi_%7B1%7D%2C%5Ccdots%20%2Cy_%7Bn-1%7D%3DY_%7Bi_%7Bn-1%7D%7D%7D%29%3D%5Cfrac%7B1%7D%7BN%7D*%5Cfrac%7B1%7D%7BN-1%7D*%5Ccdots%20*%5Cfrac%7B1%7D%7BN-n+1%7D%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D$

之前课本中为，为其具体值（非随机）；在抽样课程中，为总体真值（非随机），为样本值，是。前面提到的一般较大，若从种可能的样本中随机抽取一种，需要先列出所有可能的种样本，不现实。

不考虑顺序，则抽中一组特定样本的概率为：

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7Dn%21%3D%5Cfrac%7B1%7D%7BC_%7BN%7D%5E%7Bn%7D%7D$

对于样本量n=1和n=2两种特殊情形（N个总体单元中抽取n个样本单元的简单随机抽样）

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20P%28%20y_%7Bk%7D%3DY_%7Bs%7D%29%3D%5Cfrac%7B1%7D%7BN%7D%2CP%28%20y_%7Bk%7D%3DY_%7Bs%7D%2C%20y_%7Bj%7D%3DY_%7Bt%7D%29%3D%5Cfrac%7B1%7D%7BN%28N-1%29%7D$

，

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7D%20P%28y_%7Bk%7D%3DY_%7Bs%7D%29%3D%5Csum_%7Ball%28i_%7B1%7D%2C%5Ccdots%20%2Ci_%7Bn%7D%29%2Cbut%2Ci_%7Bk%7D%3Ds%7DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2C%5Ccdots%20%2Cy_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D%5Cbinom%7BN-1%7D%7Bn-1%7D%28n-1%29%21%3D%5Cfrac%7B1%7D%7BN%7D%7D$

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%7B%5Ccolor%7BBlue%7D%20P%28y_%7Bk%7D%3DY_%7Bs%7D%2Cy_%7Bj%7D%3DY_%7Bt%7D%29%3D%5Csum_%7Ball%28i_%7B1%7D%2C%5Ccdots%20%2Ci_%7Bn%7D%29%2Cbut%2Ci_%7Bk%7D%3Ds%2Ci_%7Bj%7D%3Dt%7DP%28y_%7B1%7D%3DY_%7Bi_%7B1%7D%7D%2C%5Ccdots%20%2Cy_%7Bn%7D%3DY_%7Bi_%7Bn%7D%7D%29%3D%5Cfrac%7B%28N-n%29%21%7D%7BN%21%7D%5Cbinom%7BN-2%7D%7Bn-2%7D%28n-2%29%21%3D%5Cfrac%7B1%7D%7BN%28N-1%29%7D%7D$

不计第几次抽样，抽中某特定单元的概率相等，都为 $gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cfrac%7B1%7D%7BN%7D$ 。

二、概述

1.总体

具体总体
有限总体
与抽样框存在一一对应关系的实际调查总体

2.单元

构成抽样总体的抽样单元并不总是等同于个体，个体是不可再分的单元，抽样单元可能包含很多个体。

3.抽样比

样本容量相对于总体规模的比例 $gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20f%3D%5Cfrac%7Bn%7D%7BN%7D$ 。

4.样本抽取原则

排除主观因素，按随机原则取样
每个抽样单元被抽中的概率都是已知或事先可以计算的
总体各单元的入样概率相等
对于不放回抽样，总体各单元的入样概率之和等于样本量

5.在抽样理论中的地位与作用

优点：

简单直观、理论成熟
抽样调查的基础

缺点：

N很大时难以获得抽样框
样本分散时不易实施
很少单独使用，除非没有其他信息（常结合其他抽样方法使用）

三、参数估计

1.参数表示

总体真值	样本值
$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbar%7BY%7D%3D%5Cfrac%7B1%7D%7BN%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7DY_%7Bi%7D%3D%5Cfrac%7BY_%7B1%7D+Y_%7B2%7D+%5Ccdots%20%2CY_%7BN%7D%7D%7BN%7D$	$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cbar%7By%7D%3D%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7Dy_%7Bi%7D%3D%5Cfrac%7By_%7B1%7D+y_%7B2%7D+%5Ccdots%20%2Cy_%7Bn%7D%7D%7Bn%7D$

$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20P%3D%5Cfrac%7BA%7D%7BN%7D%3D%5Cfrac%7B1%7D%7BN%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7DY_%7Bi%7D$ 示性变量或（当符合条件时取值为1）
$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20R%3D%5Cfrac%7B%5Csum_%7Bi%3D1%7D%5E%7BN%7DY_%7Bi%7D%7D%7B%5Csum_%7Bi%3D1%7D%5E%7BN%7DX_%7Bi%7D%7D%3D%5Cfrac%7B%5Cbar%7BY%7D%7D%7B%5Cbar%7BX%7D%7D$	$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Chat%7BR%7D%3D%5Cfrac%7B%5Csum_%7Bi%3D1%7D%5E%7Bn%7Dy_%7Bi%7D%7D%7B%5Csum_%7Bi%3D1%7D%5E%7Bn%7Dx_%7Bi%7D%7D%3D%5Cfrac%7B%5Cbar%7By%7D%7D%7B%5Cbar%7Bx%7D%7D$
$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Csigma%20%5E2%3D%5Cfrac%7B1%7D%7BN%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7D%28Y_%7Bi%7D-%5Cbar%7BY%7D%29%5E2$	$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20s%20%5E2%3D%5Cfrac%7B1%7D%7Bn-1%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%28y_%7Bi%7D-%5Cbar%7By%7D%29%5E2$
$gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20S%20%5E2%3D%5Cfrac%7B1%7D%7BN-1%7D%5Csum_%7Bi%3D1%7D%5E%7BN%7D%28Y_%7Bi%7D-%5Cbar%7BY%7D%29%5E2%3D%5Cfrac%7BN%7D%7BN-1%7D%5Csigma%20%5E2$

【注】总体参数上面带符号“^”表示由样本得到的总体参数的估计。估计量的方差用大写的表示，对的样本估计值用表示。

2.对总体特征的估计思路

利用样本的目标变量观测值对其总体参数进行直接估计
借助与目标变量高度相关的辅助变量对目标变量总体参数进行区间估计，如比率估计、回归估计等

3.对总体均值的估计

（1）引理

【引理2.1】从大小为的总体中抽取一个样本量为n的简单随机样本，则总体中每个特定单元入样的概率为 $gif.latex?%5Cdpi%7B100%7D%20%5Csmall%20%5Cfrac%7Bn%7D%7BN%7D$ ，两个特定单元都入样的概率为 $\pi _{i}=\frac{n(n-1)}{N(N-1)}$ 。

${\color{Blue} proof:}$

${\color{Blue} \pi_{ij}=\frac{\binom{2}{2}\binom{N-2}{n-2}}{\binom{N}{n}}=\frac{n(n-1)}{N(N-1)}}$

【注】简单随机抽样下，所有可能的 $\binom{N}{n}$ 个样本中，包含某个特点单元的样本数为？同时包含两个特定不同单元的样本数为？

【引理2.2】从总体规模为N的总体中抽取一个样本量为n的简单随机样本。若对总体中的每个单元 $Y_{i}$ ，引入随机变量 $a_{i},i=1,2,\cdots ,N$ ，如下， $a_{i}=\left\{\begin{matrix} 1\\ 0 \end{matrix}\right.$ ，1表示 $Y_{i}$ 被抽中，0表示未被抽中。则：

$E(a_{i})=\frac{n}{N}=f,i=1,2,\cdots ,N$

$V(a_{i})=\frac{n}{N}\frac{N-n}{N}=f(1-f),i=1,2,\cdots ,N$

$cov(a_{i},a_{j})=-\frac{n}{N(N-1)}(1-\frac{n}{N})=-\frac{f(1-f)}{N-1},i=1,2,\cdots ,N;i\neq j$

（2）对总体均值的估计

【定理2.1】对于简单随机抽样， $\bar{y}$ 是 $\bar{Y}$ 的无偏估计（估计量无偏性），即 $E(\bar{y})=\bar{Y}$

证明：从总体规模为N的总体中抽取一个样本量为n的简单随机样本。若对总体中的每个单元 $Y_{i}$ ，引入随机变量 $a_{i},i=1,2,\cdots ,N$ ，如下， $a_{i}=\left\{\begin{matrix} 1\\ 0 \end{matrix}\right.$ ，1表示 $Y_{i}$ 被抽中，0表示未被抽中。则 $\bar{y}$ 可表达为 $\bar{y}=\frac{1}{n}\sum_{i=1}^{N}a_{i}Y_{i}$ ，式中 $Y_{i},i=1,2,\cdots ,N$ 是常数，故 $E(\bar{y})=\frac{1}{n}\sum_{i=1}^{N}Y_{i}E(a_{i})=\frac{1}{n}\sum_{i=1}^{N}Y_{i}\frac{n}{N}=\frac{1}{n}\frac{n}{N}\sum_{i=1}^{N}Y_{i}=\bar{Y}$

【推论2.1】对于简单随机抽样， $\hat{Y}=N\bar{y}$ 的期望为 $E(\hat{Y})=E(N\hat{y})=N\hat{Y}=Y$

【推论2.2】对于简单随机抽样， $\hat{P}=p$ 的期望为 $E(\hat{P})=E(p)=p$

【推论2.3】对于简单随机抽样，n较大时， $\hat{R}=r$ 的期望为 $E(\hat{R})=E(r)\approx R$

【定理2.2】对于简单随机抽样， $\bar{y}$ 的方差 $V(\bar{y})=\frac{N-n}{Nn}S^2=\frac{1-f}{n}S^2$ ，式中 $f=\frac{n}{N}$ 为抽样比，为有限总体校正系数（fpc）

${\color{Blue}proof: }$

【注】简单估计量估计精度影响因素 $V(\bar{y})=\frac{N-n}{Nn}S^2=\frac{1-f}{n}S^2$ 。估计量的方差 $V(\bar{y})$ 是衡量估计量精度的度量。影响估计量方差的因素包括样本量，总体大小和总体方差。通常N很大，当时，可将近似取为1。总体方差是我们无法改变的，因此在简单随机抽样的条件下，只有通过加大样本量来提高估计量的精度。

4.方差和协方差的估计

【Th】 $s^2=\frac{1}{n-1}\sum_{i=1}^{N}(y_{i}-\bar{y})^2$ 是的无偏估计

${\color{Blue} proof:}$

【 $\Rightarrow1$ 】对于简单随机抽样， $v(\bar{y})=\frac{1-f}{n}s^2$ 是 $V(\bar{y})$ 的无偏估计

【 $\Rightarrow 2$ 】 $v(\hat{Y})=v(N\bar{y})=N^2\frac{1-f}{n}s^2$ 是 $V(\hat{Y})=N^2\frac{1-f}{n}s^2$ 的无偏估计

5.区间估计

由中心极限定理， $\small \frac{\bar{y}-\bar{Y}}{\sqrt{V(\bar{y})}}\sim N(0,1)$ ， $\small P(\left |\frac{\bar{y}-\bar{Y}}{\sqrt{V(\bar{y})}} \right |\leqslant u _{\frac{\alpha }{2}})=P(\left |\bar{y}-\bar{Y} \right |\leqslant u _{\frac{\alpha }{2}}\sqrt{V(\bar{y})})=1-\alpha$ 。总体均值的置信区间为 $\small \bar{y}-u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}\leqslant \bar{Y}\leqslant \bar{y}+u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}$ ，其中 $\small u_{\frac{\alpha }{2}}$ 是标准正态分布的上 $\small \frac{\alpha }{2}$ 分位数， $\small d=u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}$ 称为绝对误差限。用 $v(\bar{y})=\frac{1-f}{n}s^2$ 估计 $\small V(\bar{y})=\frac{1-f}{n}s^2$ ，因而 $\small \bar{Y}$ 的置信区间为 $\small \left [ \bar{y}-u_{\frac{\alpha }{2}}\sqrt{\frac{1-f}{n}}s, \bar{y}+u_{\frac{\alpha }{2}}\sqrt{\frac{1-f}{n}}s\right ]$ 。进行多次抽样后，根据各次的样本算得的置信区间包含总体均值 $\small \bar{Y}$ 的比例约为 $\small 1-\alpha$ 。 $\small 1-\alpha$ 称为置信水平或置信度，反应抽样调查的信度水平。绝对误差限 $\small d=u_{\frac{\alpha }{2}}\sqrt{\frac{1-f}{n}}s$ 为置信区间的半长。

$\small Var(\bar{y})$ 的估计： $\small var(\bar{y})=\frac{1-f}{n}s^2$ ， $\small Var(\bar{Y})$ 的估计： $\small var(\bar{Y})=N^2\frac{1-f}{n}s^2$ 。

$\small \bar{y}$ 的区间估计： $\small \left [ \bar{y}-u_{\frac{\alpha }{2}}\sqrt{\frac{1-f}{n}}s, \bar{y}+u_{\frac{\alpha }{2}}\sqrt{\frac{1-f}{n}}s\right ]$

$\small \hat{Y}$ 的区间估计： $\small \left [ N\bar{y}-u_{\frac{\alpha }{2}}N\sqrt{\frac{1-f}{n}}s, N\bar{y}+u_{\frac{\alpha }{2}}N\sqrt{\frac{1-f}{n}}s\right ]$

6.样本量的确定

（1）费用

$\small C=c_{0}+c_{1}n$ 。即总费用=固定费用+可变费用。固定费用包含设计费、分析费、办公费、管理费、场租费……； $\small c_{1}$ ，即平均调查一个样本单元的费用包括访问员费、交通费、礼品费、电话费……

（2）步骤

明确估计量的精度要求（绝对误差限 $\small d$ 或相对误差限 $\small r$ ）
找出样本量与精度之间的关系
估计所需的样本量数值，即求解 $\small n$
如超出预算，调整精度值重新计算样本量

（3）精度( $\small margin$ $\small of$ $\small error$ )

允许最大绝对误差（绝对误差限） $\small d=u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}$
以相对误差限 $\small r$ 来表示 $\small r=\frac{d}{\bar{Y}}=\frac{u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}}{\bar{Y}}$

$\small P(\left | \frac{\bar{y}-\bar{Y}}{\bar{Y}} \right |\leqslant r)=1-\alpha$ ， $\small P(\left | \frac{\bar{y}-\bar{Y}}{\sqrt{V(\bar{y})}} \right |\leqslant u_{\frac{\alpha }{2}})=1-\alpha \Rightarrow P(\left | \frac{\bar{y}-\bar{Y}}{\bar{Y}} \right |\leqslant \frac{u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}}{\bar{Y}})=1-\alpha$

绝对误差限与估计量标准差的关系为： $\small d=u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}=u_{\frac{\alpha }{2}}S(\bar{y})$
相对误差限与绝对误差限（估计量方差）的关系为： $\small r=\frac{d}{\bar{Y}}=\frac{u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}}{\bar{Y}}=u_{\frac{\alpha }{2}}\frac{\sqrt{V(\bar{y})}}{E\bar{y}}=u_{\frac{\alpha }{2}}C(\bar{y})$ 。 $\small E\bar{y}=\bar{Y}$ 在估计量无偏可以替换，其中 $\small C(\bar{y})$ 称为变异系数。

（4）估计总体均值时样本量的确定方法

按绝对误差限确定样本量

设在 $\small 1-\alpha$ 置信度下，给定绝对误差限为 $\small d=u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}$ ，即 $\small d^2={u_{\frac{\alpha }{2}}}^2\frac{1}{n}(1-\frac{n}{N})S^2$ ，得出 $\small n=\frac{{{u_{\frac{\alpha }{2}}}^2}S^2}{d^2+\frac{1}{N}{{u_{\frac{\alpha }{2}}}^2}S^2}=\frac{n_{0}}{1+\frac{n_{0}}{N}}$ ，N很大时， $\small n\approx n_{0}=\frac{{{u_{\frac{\alpha }{2}}}^2S^2}}{d^2}$ 。其中， $\small n_{0}$ 为有放回抽样或无限总体条件下达到该精度至少需要的样本量。

按相对误差限确定样本量

设在 $\small 1-\alpha$ 的置信度下，给定相对误差限为 $\small r=\frac{d}{\bar{Y}}=\frac{u_{\frac{\alpha }{2}}\sqrt{V(\bar{y})}}{\bar{Y}}$ ，平方得 $\small r^2{\bar{Y}}^2={{u_{\frac{\alpha }{2}}}^2}\frac{1}{n}(1-\frac{n}{N})S^2$ ，得出 $\small n=\frac{{{u_{\frac{\alpha }{2}}}^2S^2}}{r^2{\bar{Y}}^2+\frac{1}{N}{{u_{\frac{\alpha }{2}}}^2S^2}}$ ， $\small N$ 很大时， $\small n\approx \frac{{{u_{\frac{\alpha }{2}}}^2S^2}}{r^2{\bar{Y}}^2}$ 。

7.对总体比例的估计

估计具有某类特征的单元占总体单元数N中的比例P。

将总体单元按是否具有这种特征划分为两类，设总体中有A个单元具有这个特征，如果对每个单元都定义指标值 $\small Y_{i}=\left\{\begin{matrix} 1\\ 0 \end{matrix}\right.$ ，1表示第 $\small i$ 个单元具有所考虑的特征。 $\small P=\frac{A}{N}=\frac{1}{N}\sum_{i=1}^{N}Y_{i}=\bar{Y}$ 。

（1）总体比例的估计量

总体比例 $\small P=\frac{A}{N}=\frac{\sum_{i=1}^{N}Y_{i}}{N}$ 的估计量为样本比例 $\small p=\frac{a}{n}=\frac{\sum_{i=1}^{n}y_{i}}{n}$ ，其中 $\small y_{i}=\left\{\begin{matrix} 1\\ 0 \end{matrix}\right.$ ，1表示第 $\small i$ 个单元具有所考虑的特征。

样本比例 $\small p$ 是总体比例 $\small P$ 的无偏估计。 $\small Ep=E\bar{y}=\bar{Y}=P$

（2）总体比例估计量的方差

总体比例的估计量 $\small p=\frac{a}{n}=\frac{\sum_{i=1}^{n}y_{i}}{n}$ 的方差 $\small V(p)=\frac{PQ}{n}\frac{N-n}{N-1}$ 。

总体比例估计量 $\small p=\frac{a}{n}=\frac{\sum_{i=1}^{n}y_{i}}{n}$ 的方差 $\small V(p)=\frac{PQ}{n}\frac{N-n}{N-1}$ 用 $v(p)=\frac{1-f}{n-1}pq$ 估计。（抽样比很小时近似为 $\frac{pq}{n-1}$ ）

总体比例的区间估计为 $\left [ p-{u_{\frac{\alpha }{2}}\sqrt{\frac{(1-f)pq}{n-1}}} , p+{u_{\frac{\alpha }{2}}\sqrt{\frac{(1-f)pq}{n-1}}}\right ]$ 。

（3）估计总体比例时样本量的确定

当待估参数是时，估计量是。

给定的绝对误差限

$d^2={{u_{\frac{\alpha }{2}}}^2}V(p)={{u_{\frac{\alpha }{2}}}^2}\frac{PQ}{n}\frac{N-n}{N-1}$

$n(N-1)d^2={{u_{\frac{\alpha }{2}}}^2}PQN-{{u_{\frac{\alpha }{2}}}^2}PQn$

$n=\frac{{{u_{\frac{\alpha }{2}}}^2}PQN}{{{u_{\frac{\alpha }{2}}}^2}PQ+(N-1)d^2}=\frac{\frac{{u_{\frac{\alpha }{2}}}^2}{d^2}PQ}{1+\frac{1}{N}(\frac{{u_{\frac{\alpha }{2}}}^2PQ}{d^2}-1)}$

若 $n_{0}=\frac{{u_{\frac{\alpha }{2}}}^2}{d^2}PQ$ ，则 $n=\frac{n_{0}}{1+\frac{n_{0}-1}{N}}$

$n_{0}$ 为放回抽样或无限总体情形下达到该精度最少所需样本量

8.总体总值的简单估计

总体总值为总体均值的N倍，即 $Y=N\bar{Y}=\sum_{i=1}^{N}Y_{i}$ ，只要有了总体均值的估计结果，就可以很容易地推出总体总值的估计结果。

（1）总体总值的简单估计

N倍的样本均值是总体总值的简单估计量，即 $\hat{Y}=N\bar{y}=\frac{N}{n}\sum_{i=1}^{n}y_{i}$ 。

（2）总体总值简单估计量的性质

由于总体总值是总体均值的N倍，其简单估计量也是总体均值估计量的N倍，而N是固定常数，所以总体总值的简单估计量的性质由总体均值的简单估计量的性质来决定。

容易证明：

$E(\hat{Y})=E(N\bar{y})=NE(\bar{y})=N\bar{Y}=Y$

$V(\hat{Y})=N^2V(\bar{y})=\frac{N^2(1-f)}{n}S^2$ 的无偏估计为 $v(\hat{y})=N^2v(\bar{y})=\frac{N^2(1-f)}{n}s^2$

（3）估计总体总值时估计量的确定

$d=u_{\frac{\alpha }{2}}\sqrt{Var(\hat{Y})}=Nu_{\frac{\alpha }{2}}\sqrt{var(\bar{y})}$

$d^2=N^2{{u_{\frac{\alpha }{2}}}^2}var(\bar{y})=N^2{{u_{\frac{\alpha }{2}}}^2}(\frac{1}{n}-\frac{1}{N})s^2$

$n=\frac{{{u_{\frac{\alpha }{2}}}^2}s^2}{\frac{{u_{\frac{\alpha }{2}}}^2s^2}{N}+\frac{d^2}{N^2}}$

9.放回简单随机抽样的估计

现实中有许多情况下，抽样是放回的，即从总体中抽中的单元每次都要放回总体中去。例如在城市中对行人、车辆的调查等抽样都是有放回的，有可能重复抽中某些单位。

对于每次抽到的结果（视为随机变量） $y_{i}$ 都有

$E(y_{i})=\sum_{i=1}^{N}\frac{1}{N}Y_{i}=\bar{Y}$
$V(y_{i})=\sum_{i=1}^{N}\frac{1}{N}(Y_{i}-\bar{Y})^2=\sigma ^2$
方差 $Var(\bar{y})=\frac{1}{n}\sigma ^2$ （与无限总体情形下均值估计量方差结果相同）
样本方差 $s^2=\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\bar{y})^2$ 是无限总体方差 $\sigma ^2$ 的无偏估计量
方差 $V(\bar{y})$ 的一个无偏估计是 $v(\bar{y})=\frac{s^2}{n}$

10.设计效应（）

（1）定义

所采用抽样技术的参数估计量方差与相同样本量下简单随机抽样的参数估计量方差之比。

值越大，说明估计效率越低

（2）的作用

评价抽样设计的一个依据

如果，则抽样设计比简单随机抽样的效率高

如果，则抽样设计比简单随机抽样的效率低

计算样本量

如多阶段抽样的大约在 $2\sim 2.5$ 之间。 $n=n^{'}(deff)$ ， $n^{'}$ 为简单随机抽样下满足估计量精度要求所需样本量。

（3）设计效应和样本量的确定

有放回抽样的方差： $V_{srswr}=\frac{N-1}{N}\frac{s^2}{n}$

不放回抽样的方差： $V_{srswr}=\frac{N-n}{N}\frac{s^2}{n}$

有放回抽样的设计效应： $deff=\frac{N-1}{N-n}>1$

所以，要满足一定的估计精度，采用放回简单随机抽样比采用不放回简单随机抽样需要更大的样本量。

常用于复杂抽样样本量的确定；在一定精度条件下，简单随机抽样所需的样本量 $n^{'}$ 比较容易得到。

所考虑的抽样设计的样本量=简单随机抽样时满足方差要求时的样本量*

$n=n^{'}*deff$

四、附表——抽样理论&数理统计的比较

	抽样理论	数理统计
假设	有限总体，样本之间不独立有 $\binom{N}{n}$ 种可能的样本	无限总体，样本之间独立，可取无限种可能的样本
符号	$\bar{y}$	$\bar{y}$
定义	$\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}$	$\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}$
期望	$E(\bar{y})=E(\frac{1}{n}\sum_{i=1}^{n})=\frac{1}{n}\sum_{i=1}^{n}E(y_{i})=\frac{1}{n}[n\mu ]=\mu$	$E(\bar{y})=E(\frac{1}{n}\sum_{i=1}^{n})=\frac{1}{n}\sum_{i=1}^{n}E(y_{i})=\frac{1}{n}[n\mu ]=\mu$
方差	$V(\bar{y})=\frac{1-f}{n}S^2$	$V(\bar{y})=E[\bar{y}_{i}-\mu ]=E[\frac{1}{n}\sum_{i=1}^{n}-\mu ]=\frac{1}{n}{E(y_{i}-\mu )}^2=\frac{\sigma ^2}{n}$

抽样

理论

数理

统计

相同之处

不同之处

定义

都是根据从一个总体中

抽样得到的样本，然后

定义样本均值为：

$\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}$

抽样理论中样本是从有限总体中按不放回的抽样方法得到的，样本中的样本点不会重复；

数理统计中的样本是从无限总体中利用有放回的抽样方法得到的，样本点有可能是重复的。

性质

(1)样本均值的期望都等于总体均值，也就是抽样理论和数理统计中的样本均值都是无偏估计

(2)不论总体原来是何种分布，在样本量足够大的条件下，样本均值近似服从正态分布

(1)抽样理论中，各个样本之间是不独立的；数理统计中的各个样本之间是相互独立的

(2)抽样理论中的样本均值的方差为 $V(\bar{y})=\frac{1-f}{n}S^2$ ，其中 $S^2=\frac{1}{N-1}\sum_{i=1}^{N}(Y_{i}-\bar{Y})^2=\frac{N}{N-1}\sigma ^2$

(3)数理统计中样本均值的方差为 $\frac{\sigma ^2}{n}$ ，其中 $\sigma ^2=\frac{1}{N}\sum_{i=1}^{N}(Y_{i}-\bar{Y})^2$

你可能感兴趣的:(抽样技术,数据分析)

AR眼镜——软件技术栈的必经之路 Julian.zhou 人机交互未来思考人工智能 ar 人工智能交互空间计算语言模型
AR眼镜软件技术栈的必经之路：从操作系统到生态构建的深度解析摘要AR眼镜作为下一代人机交互入口，其软件技术栈的成熟度直接决定了用户体验与市场渗透率。本文基于行业最新技术动态与头部企业布局，深度剖析AR眼镜软件行业必须突破的七大技术方向，揭示从底层框架到应用生态的全栈技术储备路径。一、操作系统与底层框架：实时性与轻量化的双重革命AR眼镜软件生态的根基在于操作系统的定制化与优化，需满足三大核心需求：实
鸿蒙HarmonyOS应用开发 |鸿蒙技术分享HarmonyOS Next 深度解析：分布式能力与跨设备协作实战一键难忘 harmonyos 分布式华为 HarmonyOS Next
鸿蒙技术分享：HarmonyOSNext深度解析：分布式能力与跨设备协作实战随着万物互联时代的到来，操作系统作为连接设备、应用与用户体验的核心，扮演着不可或缺的角色。华为最新发布的HarmonyOSNext（鸿蒙操作系统下一代版本）不仅在技术架构上实现了颠覆性升级，更在生态体验上迈向了一个新的高度。本文将从技术架构、生态优势和开发实践三个方面深入探讨HarmonyOSNext的技术特点，并通过一个
钉钉发布“AI创新N次方计划”，为AI生态免除佣金、保证金和算力费用量子位
3月20日，钉钉在北京举办了“AI创业N次方”生态创新大会。会上，钉钉发布了一系列全新生态政策，为AI创业者、AI转型者提供助力：包括免除佣金、免除入驻保证金和免除算力费用，并在销售、品牌、技术和投资等方面提供支持，为生态伙伴提供AI应用创业创新的全方位助力。发布AI创新扶持计划：“三免四助力”钉钉副总裁、开放平台总经理王铭在会上表示：“开放是钉钉一直以来的信仰。AI时代大幕拉开，钉钉生态也进入新
golang是如何回收goroutine的 double12gzh golang golang
目录1.写在前面2.生命周期3.必备条件1.写在前面微信公众号：[double12gzh]关注容器技术、关注Kubernetes。问题或建议，请公众号留言。本文是基于golang1.13Goroutines易于创建，堆栈小，上下文切换快。由于这些原因，开发人员喜欢它们，并经常使用它们。然而，一个程序如果产生许多这样生命周期很短的goroutine，那将会花费相当多的时间来创建和销毁它们。2.生命周
112：vue+cesium 设置镜头光晕效果还是大剑师兰特 #cesium综合教程200+大剑师 cesium教程 cesium示例 cesium高级 Cesium API
作者：还是大剑师兰特，曾为美国某知名大学计算机专业研究生，现为国内GIS领域高级前端工程师，CSDN知名博主，深耕openlayers、leaflet、mapbox、cesium，canvas，echarts等技术开发，欢迎加微信（gis-dajianshi），一起交流。查看本专栏目录-本文是第:112`篇文章文章目录一、示例效果图:二、示例介绍三、配置说明四、示例源代码（共171行）五、核心方法
非技术 bfwj520 非技术情感
莫言对年轻人的一百条忠告，看到哪句你哭了1、假如你想要一件东西，就放它走。它若能回来找你，就永远属于你；它若不回来，那根本就不是你的。2.一个人会落泪，是因为痛；一个人之所以痛，是因为在乎；一个人之所以在乎，是因为有感觉；一个人之所以有感觉，仅因为你是一个人！所以，你有感觉，在乎，痛过，落泪了，说明你是完整不能再完整的一个人。难过的时候，原谅自己，只不过是一个人而已，没有必要把自己看的这么坚不可摧
充气泵方案｜便携式充气泵方案【天吉智芯】天吉智芯充气泵一体机打气泵单片机嵌入式硬件人工智能安全
便携车载充气泵方案的使用范围其实不仅仅是汽车轮胎，它在设计时工程师选取高性能和存储芯片，可实现汽车轮胎、篮球、自行车、摩托车、零模式等多种场景应用。其原理便是通过马达运转工作，当抽气时连通器的阀门被大气的气压冲开，气体进入气筒中；当向轮胎打气时，阀门又被气筒的气压关闭，所以气体由此进入轮胎中。这其实就是利用大气压的原理来充气。以下是便携车载充气泵方案的功能设计介绍。深圳天吉芯技术king-chip
LInux内核学习 -- perCPU变量 lagransun linux 学习运维
文章目录环境关于perCPU变量perCPU变量：__entry_task环境linux4.19关于perCPU变量percpu变量的介绍，这位老哥做了介绍，包括为什么要有这样的变量以及优势：linux内核之Per-CPU变量，我把这个老哥的总结复制下来：通过Per-cpu变量除了可以分配内存，还有一个最大的好处就是不需要考虑同步。最好的同步技术就是把不需要同步的内核放在首位，因为每种显示的同步原
Linux内核学习之 -- epoll()一族系统调用分析笔记 lagransun linux 学习笔记
背景linux4.19epoll()也是一种I/O多路复用的技术，但是完全不同于select()/poll()。更加高效，高效的原因其他博客也都提到了，这篇笔记主要是从源码的角度来分析一下实现过程。作为自己的学习笔记，分析都在代码注释中，后续回顾的时候看注释好一点。相关链接：Linux内核学习之–ARMv8架构的系统调用笔记Linux内核学习之–系统调用open()和write()的实现笔记Lin
景联文科技入选中国信通院发布的“人工智能数据标注产业图谱” 景联文科技科技人工智能
近日，由中国信息通信研究院、中国人工智能产业发展联盟牵头，联合中国电信集团、沈阳市数据局、保定高新区等70多家单位编制完成并发布《人工智能数据标注产业图谱》。景联文科技作为人工智能产业关键环节的代表企业，入选图谱中技术服务板块。图谱按照国家数据局技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等六个方面任务展开，由上游资源提供方、中游数据标注核心服务方、下游配套支撑方三部分组成。其中上游
Python 数据分析实战：宠物经济行业发展洞察萧十一郎@ python python 数据分析宠物
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1宠物用品用户满意度分析2.4.2宠物用品销售与价格关系分析2.4.3宠物经济行业未来发展预测三、主要的代码难点解析3.1数据收集3.2数据清洗-销售数据处理3.3数据分析-宠物用品用户满意度分析3.4数据分析-宠物用品销售与价格关系分析3.5数据可视化四、可能改进的代码4.1数据收集改进4.2数据清
信号传输与通信：光纤通信中的信号处理_（11）.相干光通信技术 kkchenkx 信号处理技术仿真模拟信号处理
相干光通信技术相干光通信技术是一种在光纤通信系统中广泛应用的技术，通过使用相干检测方法来提高信号的传输性能。与传统的强度调制/直接检测（IM/DD）系统相比，相干光通信技术能够实现更高的数据传输速率和更长的传输距离，这是因为相干检测技术能够有效地提取信号的相位和幅度信息，从而在接收端实现更精确的信号恢复。1.相干光通信的基本概念相干光通信系统的核心在于相干检测，通过使用本地振荡器（LocalOsc
光影香江聚四海，蓝陵科技扬帆数字内容新蓝海 LhcyyVSO 人工智能大数据
3月20日，第29届香港国际影视展（FILMART）圆满收官，这场亚洲顶级行业盛会吸引了34个国家和地区逾760家机构参展，搭建起全球影视产业深度对话的桥梁。蓝陵科技携三大创新数字解决方案惊艳亮相，与各国行业领袖共探影视工业化转型路径，开启文化科技出海新篇章。数字基建赋能构建全球合作生态在1B-D17展区，蓝陵科技通过影视动漫渲染、vLive虚拟直播、AI跨境电商直播数字人三大技术矩阵，向国际客商
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平强化学习曾小健机器人
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平PNP机器人PNP机器人2025年02月10日21:04上海本文来自：公众号智元机器人https://sites.google.com/view/enerverse，出于学术/技术分享进行转载，如有侵权，联系删文。EnerVerse的科研核心团队由智元机器人研究院的具身算法精英组成。黄思渊，作为上海交通大学与
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
【自学笔记】Web3基础知识点总览-持续更新 Long_poem 笔记 web3
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Web3基础知识点总览（Markdown格式）1.引言2.区块链基础3.智能合约4.去中心化应用（DApps）5.数字货币与钱包6.跨链技术7.Web3生态与工具代码块示例（Solidity智能合约）总结Web3基础知识点总览（Markdown格式）1.引言Web3，也称为第三代互联网或去中心化互联网，旨在通过区块链技术实现更
无人机硬件技术研发突破方向与技术解析 yychen_java 无人机
无人机硬件技术研发突破方向与技术解析副标题：从仿生机翼到氢能动力系统的创新路径一、机翼设计优化1.仿生结构创新技术原理：模仿蜻蜓翅脉网格结构（图1），通过Cl=2Lρv2SC_l=\frac{2L}{\rhov^2S}Cl=ρv2S2L（升力系数公式）实现低雷诺数下的高效气动性能典型案例：北京航空航天大学研发的仿蝗虫折叠翼无人机，展开后翼展增加40%，抗风能力提升25%哈佛大学微型蜜蜂无人机采用高
装配式建筑4.0：城市发展的绿色引擎与智能未来资讯新鲜事大数据人工智能
在城市化进程不断加速的今天，传统建筑业面临着效率低下、资源浪费、环境污染等多重挑战。装配式建筑4.0的出现，为城市可持续发展提供了革命性解决方案。这一建筑模式通过智能化、绿色化、数字化技术的深度融合，重构了建筑全生命周期的生产方式，成为推动城市高质量发展的核心动力。装配式建筑4.0通过工厂化预制和现场组装，大幅提高了建设效率，缩短了工期。相比传统建筑方式，装配式建筑4.0能够在工厂内完成大部分施工
SQLMesh SCD Type 2 深度解析：时间戳与列级跟踪的实战指南梦想画家数据分析工程 #python 数据工程分析工程 sqlmesh
在数据仓库架构中，缓慢变化维度（SlowlyChangingDimensions,SCD）是处理历史数据追踪的核心技术。SQLMesh作为新一代数据编织平台，其支持的SCDType2模型通过valid_from和valid_to双时间戳机制，为开发者提供了灵活的历史状态管理能力。本文将深入解析SQLMeshSCDType2的两种实现模式（基于时间戳与列级变更检测）、关键配置项及删除操作处理逻辑，让
http与https的区别哥谭居民0001 网络安全服务器
加密方式：加密技术是对信息进行编码和解码的技术，编码是把原来可读信息（又称明文）译成代码形式（又称密文），其逆过程就是解码（解密），加密技术的要点是加密算法，加密算法可以分为三类：对称加密，如AES基本原理：将明文分成N个组，然后使用密钥对各个组进行加密，形成各自的密文，最后把所有的分组密文进行合并，形成最终的密文。优势：算法公开、计算量小、加密速度快、加密效率高缺陷：双方都使用同样密钥，安全性得
Jira获取story信息更新子任务状态脚本技术实现吾爱乐享 w w w w .f e n
title:Jira获取story信息更新子任务状态脚本技术实现tags:-Jiracategories:-Jira一、项目背景在Jira项目管理系统中，当story主任务处于特定状态（如“READYFORPM”或“已关闭”）时，需要对其所有子任务的状态进行更新。为了实现这一自动化操作，编写了一个Python脚本，以提高工作效率和准确性。二、技术选型编程语言：Python，因其简洁易读的语法和丰富
JAVA————十五万字汇总 MeyrlNotFound java 开发语言
JAVA语言概述JAVA语句结构JAVA面向对象程序设计（一）JAVA面向对象程序设计（二）JAVA面向对象程序设计（三）工具类的实现JAVA面向对象程序设计（四）录入异常处理JAVA图形用户界面设计JAVA系统主界面设计JAVA图形绘制JAVA电子相册JAVA数据库技术（一）JAVA数据库技术（二）JAVA数据库技术（三）拓展：JAVA导入/导出——输入/输出JAVA网络通信JAVA多线程编程技
解锁区块链智能合约的未来：构建支持仿真测试的MySQL环境墨夶数据库学习资料1 区块链智能合约 mysql
在区块链技术快速发展的今天，智能合约作为其核心组件之一，正在改变我们处理交易、管理资产乃至构建商业逻辑的方式。然而，对于许多开发者而言，在正式部署之前如何有效地测试和验证智能合约的行为仍然是一个不小的挑战。本文将详细介绍如何设计并实现一个基于MySQL的支持智能合约仿真执行的环境，使您能够在传统的关系型数据库中体验到智能合约的强大功能。一、为什么选择MySQL？尽管以太坊等平台提供了专门用于编写和
解锁区块链智能合约版本管理的新纪元——MySQL架构下的革新之道墨夶数据库学习资料1 区块链智能合约 mysql
在区块链技术蓬勃发展的今天，智能合约作为去中心化应用（DApps）的核心组件，其版本管理和升级机制的重要性日益凸显。然而，传统的智能合约一旦部署便难以更改的特性给开发者带来了不小的挑战。面对这一难题，如何构建一个既能够保障数据安全又便于维护和更新的智能合约管理系统成为了业界关注的焦点。本文将深入探讨基于MySQL数据库设计支持智能合约版本控制的解决方案，旨在为读者提供一套完整的、易于实施的技术框架
法律行业——合同审查与AI律师 zhouyaowei1983 人工智能人工智能
一、引言：AI技术重构法律行业新格局‌随着AI技术从实验室走向规模化应用，法律行业正经历从“经验驱动”向“数据驱动”的范式转变。这一变革的核心驱动力源于法律服务的两大根本矛盾：‌传统人工服务效率瓶颈‌与‌市场对高精度、低成本法律产品的迫切需求‌‌。‌1.法律行业数字化转型的底层逻辑‌‌技术革命推手‌：以DeepSeekR1大模型为代表的开源AI技术，让法律文本解析、案例推理等复杂任务实现平民化应用
Tomcat从入门到精通：全方位深度解析与实战教程墨瑾轩一起学学Java【一】运维 tomcat java
一、Tomcat入门1.Tomcat简介ApacheTomcat，简称Tomcat，是一个开源的轻量级应用服务器，专为运行JavaServlet和JavaServerPages(JSP)技术设计。它是JavaWeb开发中最常用的Servlet容器之一，遵循JavaServlet和JavaServerPages规范，为开发者提供了一个稳定的、易于使用的部署环境。2.安装与启动安装下载最新版Tomca
专利信息管理知识产权基于Spring Boot SSM QQ1978519681计算机程序 java 前端数据库毕业设计计算机毕业设计 spring boot
目录一、需求分析1.1系统用户角色与权限1.2专利信息管理功能二、数据分析与报表生成三、系统性能与安全性四用户体验与界面设计五扩展性与可维护性六、法律法规与合规性七.技术选型与实现‌7.1技术选型‌：‌7.2实现方式‌：随着科技的不断发展和知识产权保护意识的提升，专利信息管理系统的需求日益增加。基于SpringBoot的专利信息管理系统旨在提供一个高效、便捷的平台，帮助用户全面管理专利信息。该系统
如何加快制造业数字化转型九河智造云制造云计算
加速制造业数字化转型的五大战略支点制造业数字化转型已进入深水区。工信部数据显示，2025年我国规模以上工业企业数字化研发工具普及率达88%，但全流程数字化覆盖率不足35%。破解转型困局需要构建“政策引导-技术突破-场景落地-生态协同”的加速机制，通过五大核心战略实现质效突破。一、强化顶层设计：构建转型制度保障体系政策创新需突破三大瓶颈：专项资金引导：设立2000亿元制造业数字化专项基金，对智能工厂
人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
使用Wolfram Alpha API在LangChain中的应用 shuoac langchain python
在AI技术应用中，WolframAlpha以其强大的计算能力和信息检索功能，被广泛应用于各类智能系统中。本文将为您介绍如何结合LangChain使用WolframAlphaAPI，以实现功能强大的计算和信息查询服务。技术背景介绍WolframAlpha是由WolframResearch开发的问答引擎，它通过计算从外部数据源中获取答案，实现对事实性问题的解答。在开发智能应用时，我们可以利用Wolfr
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

【抽样技术】CH2 简单随机抽样

前言

一、定义

二、概述

1.总体

2.单元

3.抽样比

4.样本抽取原则

5.在抽样理论中的地位与作用

三、参数估计

1.参数表示

2.对总体特征的估计思路

3.对总体均值的估计

（1）引理

（2）对总体均值的估计

4.方差和协方差的估计

5.区间估计

6.样本量的确定

（1）费用

（2）步骤

（3）精度( )

（4）估计总体均值时样本量的确定方法

7.对总体比例的估计

（1）总体比例的估计量

（2）总体比例估计量的方差

（3）估计总体比例时样本量的确定

8.总体总值的简单估计

（1）总体总值的简单估计

（2）总体总值简单估计量的性质

（3）估计总体总值时估计量的确定

9.放回简单随机抽样的估计

10.设计效应（ ）

（1）定义

（2）的作用

（3）设计效应和样本量的确定

四、附表——抽样理论&数理统计的比较

你可能感兴趣的:(抽样技术,数据分析)

（3）精度( $\small margin$ $\small of$ $\small error$ )

10.设计效应（）