xia ge tou lia

统计推断——假设检验——t 检验(总体的标准差未知)

一、t检验的概念

以 t 分布( $\large \sigma$ 未知)为基础的一类比较均数的假设检验方法，t 分布的发现使得小样本统计推断成为可能。

二、t 检验的应用条件

随机样本；
来自正态分布总体（小样本时）；
两独立样本比较时，要求两总体方差相等（方差齐性），单样本不需要方差齐性。

三、t检验的分类

1、单样本资料的t 检验

推断样本所属总体的均数是否已知值有差异。

例某研究人员在东北某县抽取36名儿童，得到前囟门闭合月龄的均值（ $\large \overline{X}$ ）和标准差（ $\large S$ ），要研究该县儿童前囟门的闭合月龄是否大于一般儿童（一般儿童总体的均值 $\large \mu _{0}$ 已知）？

检验的假设： $\large H_{0}$ ： $\large \mu =\mu _{0}$ $\large H_{1}$ ： $\large \mu \neq \mu _{0}$ (双侧)

统计量： $\large t=\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}$

分子：样本均数与 $\large \mu _{0}$ 的差距

分母：样本均数的标准误

$\large t$ ：用标准误来度量样本均数与 $\large \mu _{0}$ 的差距，没有量纲

理论依据： $\large H_{0}$ 成立时，统计量 $\large t=\frac{\overline{X}-\mu _{0}}{S/\sqrt{n}}\sim t(\nu )$ ， $\large \nu =n-1$

理论： $\large H_{0}$ 成立时，统计量 $\large t$ 服从自由度为 $\large \nu =n-1$ 的 $\large t$ 分布，根据这一知识来计算相应的 $\large P$ 值。

统计推断: 事先规定一个“小”的概率 $\large \alpha$ （检验水准），

若 $\large P$ 值小于 $\large \alpha$ ，拒绝零假设；

若 $\large P$ 值不小于 $\large \alpha$ ，则不拒绝零假设。

2、配对设计资料（特殊的单样本检验）的t 检验

配对设计资料其实是一种特殊的单样本资料，配对设计资料的 $\large t$ 检验，实际上就是检验配对资料差值的总体均值是否为0。

配对设计（paired design）是一种特殊的设计方式，能够很好地控制非实验因素对结果的影响，有自身配对和异体配对之分。

自身配对：

（1）某组同质被试对象接受两种不同的处理。例如，抽取一个年级的同学作为被测试对象，分别取得他们的身高和体重数据，试问他们的平均身高和体重是否存在显著差异？

（2）某组同质被试对象接受处理前后是否存在差异。例如，某公司推广了一种新的促销方式，实施前后分别统计了员工的业务量，得到数据，试问这种促销方式是否有效？

异体配对（同源配对）

同源配对也就是同质的被测试对象分别接受两组不同的处理。例如，为了验证某种记忆方法对改善儿童对词汇的记忆是否有效，先随机抽取40名学生，再随机分为两组。一组使用该训练方法，一组不使用，3个月后对这两组学生进行词汇测验，得到数据。试问该训练方法是否对提高词汇记忆量有效？

在配对的t检验中，强调被测试对象一定要同质，其目的就是为了消除额外变量的影响，更能反映自变量和因变量之间的关系。配对样本t检验的过程，是对两个同质的样本分别接受两种不同的处理或一个个体先后接受不同的处理来判断不同的处理是否有差别。这种检验的目的在于根据样本数据对样本来自的配对总体的均值是否有显著差异进行判断的。

配对设计资料的分析着眼于每一对观察值之差，这些差值构成一组资料，用 $\large t$ 检验推断“差值的总体均数是否为 0”。

例为研究孪生兄弟中, 先出生者的出生体重与后出生者的出生体重是否相同，共收集了15对孪生兄弟的出生体重:

检验的假设： $\large H_{0}$ ： $\large \mu_{d} =0$ ，即差值的总体均数为 0

$\large H_{1}$ ： $\large \mu_{d} \neq 0$ (双侧) ，即差值的总体均数不为 0

其中： $\large \mu_{d}$ 等于两个配对样本的总体均值之差

确定检验水准： $\large \alpha =0.05$

统计量： $\large t=\frac{\overline{d}-0}{S_{d}/\sqrt{n}}$ ，此题中 $\large n$ =15， $\large \overline{d}=0.06$ ， $\large S_{d}=0.10$ ，计算出 $\large t=2.33$

分子：样本均差值 $\large d$ 的均值与0的差距

分母：样本均差值 $\large d$ 的均值的标准误

$\large n$ ：对子数

理论依据： $\large H_{0}$ 成立时，统计量 $\large t=\frac{\overline{d}-0}{S_{d}/\sqrt{n}}\sim t(\nu )$ ， $\large \nu =n-1$

理论： $\large H_{0}$ 成立时，统计量 $\large t$ 服从自由度为 $\large \nu =n-1$ 的 $\large t$ 分布，根据这一知识来计算相应的 $\large P$ 值。

统计推断: 事先规定一个“小”的概率 $\large \alpha$ （检验水准），

若 $\large P$ 值小于 $\large \alpha$ ，拒绝零假设；

若 $\large P$ 值不小于 $\large \alpha$ ，则不拒绝零假设。

故此题中，查 t 界值表，0.02< $\large P$ <0.05，在 $\large \alpha$ =0.05 的水准上拒绝 $\large H_{0}$ ，可认为孪生兄弟的出生体重与出生顺序有关，先出生者的体重大于后出生者。

3、两独立样本资料的t 检验

python实现检验均值差检验-《统计推断——假设检验——python代码检验两均值差（置换法）》

中心思想：当两个总体分布分别为 $N(\mu _{1},\sigma _{1}^{2})$ 和， $N(\mu _{2},\sigma _{2}^{2})$ 时，两样本均值差的抽样分布仍为正态分布。

3.1、抽样

从同一对象群，随机抽取两组，各接受不同处理。

或者，从两个对象群，各随机抽取一组，接受相同处理。

3.2、数据

两独立样本的资料

3.3、目的

检验两个总体均数是否相等

3.4、假定

①两个总体均服从正态分布，方差相等（方差齐性）

例某医师要观察两种药物对原发性高血压的疗效，将诊断为Ⅱ期高血压的 20 名患者随机分为两组（两组患者基线时血压之间的差别没有统计学意义）;

一组用卡托普利治疗，另一组用尼莫地平治疗; 3 个月后观察舒张压下降的幅度（mmHg）

结果如下:

试比较两药平均降压效果（总体的均值）有无差异。

经检验, 两组舒张压下降值均服从正态分布、方差齐性。 $\large X_{1}\sim N(\mu _{1},\sigma ^{2})$ ， $\large X_{2}\sim N(\mu _{2},\sigma ^{2})$

建立假设，确定检验水准

$\large H_{0}$ ： $\large \mu _{1}=\mu _{2}$ 或 $\large \mu _{1}-\mu _{2}=0$

$\large H_{1}$ ： $\large \mu _{1}\neq \mu _{2}$ 或 $\large \mu _{1}-\mu _{2}\neq 0$

$\large \alpha =0.05$

计算统计量

$\large \overline{X}_{1}\sim N(\mu _{1},\frac{\sigma ^{2}}{n_{1}})$ ， $\large \overline{X}_{2}\sim N(\mu _{2},\frac{\sigma ^{2}}{n_{2}})$ ， $\large \overline{X}_{1}-\overline{X}_{2}\sim N(\mu _{1}-\mu _{2},\frac{\sigma ^{2}}{n_{1}}+\frac{\sigma ^{2}}{n_{2}})$

检验统计量为： $\large t=\frac{\overline{X}_{1}-\overline{X}_{2}}{\sqrt{S_{c}^{2}(\frac{1}{n_{1}}+\frac{1}{n_{2}})}}$ ，其中 $\large S_{c}^{2}(\frac{1}{n_{1}}+\frac{1}{n_{2}})$ 表示两组标准误平方之和。

其中 $\large S_{c}^{2}$ 是利用两样本联合估计的方差 $\large S_{c}^{2}=\frac{(n_{1}-1)S_{1}^{2}+(n_{2}-1)S_{2}^{2}}{n_{1}+n_{2}-2}$ （两组方差的加权平均）， $S_{1}^{2}$ 表示第一组的方差， $S_{2}^{2}$ 表示第二组的方差。

已知，当 $\large H_{0}$ 成立时，统计量服从自由度 $\large \nu =n_{1}+n_{2}-2$ 的 $\large t$ 分布。

$\large \begin{align}S_{c}^{2} & =\frac{(n_{1}-1)S_{1}^{2}+(n_{2}-1)S_{2}^{2}}{n_{1}+n_{2}-2} \\ &=\frac{(10-1)\times3.58^{2}+(10-1)\times 4.27^{2}}{10+10-2} \\ &=15.52 \end{align}$

$\large t=\frac{\overline{X}_{1}-\overline{X}_{2}}{\sqrt{S_{c}^{2}(\frac{1}{n_{1}}+\frac{1}{n_{2}})}}=\frac{10.20-9.40}{\sqrt{15.52\times (\frac{1}{10}+\frac{1}{10})}}=0.454$

确定 P 值，作出推断

按照 $\large \alpha =0.05$ 的水准， $\large t_{0.05/2,18}=2.101$ （双侧检验）； $\large t=0.454< t_{0.05/2,18}$ ， $\large P> 0.5$ ，不拒绝 $\large H_{0}$ ，差异无统计学意义；

结论：尚不能认为这两种药物降压效果有差别。

注意：“尚不能”的含义，很可能现状样本量不够，样本量增大之后得到的t值又不一样，则得到的 $\large P$ 值也不一样，则样本可能存在差别。

②两样本所属总体方差不等——>> 近似 t 检验（Satterthwaite近似法）

例为比较特殊饮食与药物治疗改善血清胆固醇（mmol/L）的效果，将 24 名志愿者随机分成两组，每组 12 人，甲组为特殊饮食组，乙组为药物治疗组。

受试者试验前后各测量一次血清胆固醇，差值见下表

请比较两种降血清胆固醇措施的效果是否相同？

方差齐性检验（统计量遵循F分布）——后面章节有详细的齐性检验步骤

建立检验假设，确定检验水准

$\large H_{0}$ ： $\large \sigma _{1}^{2}=\sigma _{2}^{2}$ $\large H_{1}$ ： $\large \sigma _{1}^{2}\neq \sigma _{2}^{2}$ $\large \alpha =0.05$

计算统计量

$\large F=\frac{S_{1}^{2}}{S_{2}^{2}}=\frac{0.5110^{2}}{0.1107^{2}}=21.308$ ， $\large \nu_{1} =n_{1}-1=12-1=11$ ， $\large \nu_{2} =n_{2}-1=12-1=11$

确定 $\large P$ 值，作出推断

查F分布的双侧临界值表， $\large F_{0 . 05 / 2 ( 11 , 11)}=3.47$ , $\large P$ <0.05，在 $\large \alpha$ =0.05的水准上拒绝 $\large H_{0}$ ，两个样本方差的差异具有统计学意义（即样本方差的差异反映了总体方差的差异）。

结论：可以认为两个总体方差不相等。

两组血清胆固醇差值均服从正态分布条件，经以上方差齐性检验；此资料视为总体方差不相等。

$\large N(\mu _{1},\sigma _{1}^{2})$ ， $\large N(\mu _{2},\sigma _{2}^{2})$ ， $\large \sigma _{1}^{2}\neq \sigma _{2}^{2}$

$\large \overline{X}_{1}\sim N(\mu _{1},\frac{\sigma_{1}^{2}}{n_{1}})$ ， $\large \overline{X}_{2}\sim N(\mu _{2},\frac{\sigma_{2}^{2}}{n_{2}})$

$\large \overline{X}_{1}-\overline{X}_{2}\sim N(\mu _{1}-\mu _{2},\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}})$

$\large H_{0}$ ： $\large \mu _{1}=\mu _{2}$ $\large H_{1}$ ： $\large \mu _{1}\neq \mu _{2}$

统计量 $\large {t}'=\frac{\overline{X}_{1}-\overline{X}_{2}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}$

当 $\large H_{0}$ 成立时， $\large {t}'=\frac{\overline{X}_{1}-\overline{X}_{2}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}$ 的分布比较复杂，需要对自由度进行校正，校正之后的 $\large {t}'$ 分布近似为 $\large t$ 分布。

$\dpi{100} \large \nu =\frac{(\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}})^{2}}{(\frac{S_{1}^{2}}{n_{1}})^{2}/(n_{1}-1)+(\frac{S_{2}^{2}}{n_{2}})^{2}/(n_{2}-1)}$ ，分子是两组样本均数标准误平方之和的平方。

据此近似的得到相应的 $\large P$ 值。

建立检验假设，确定检验水准

$\large H_{0}$ ： $\large \mu _{1}=\mu _{2}$ $\large H_{1}$ ： $\large \mu _{1}\neq \mu _{2}$ $\large \alpha =0.05$

计算统计量

$\large {t}'=\frac{\overline{X}_{1}-\overline{X}_{2}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}=\frac{0.5592-0.1467}{\sqrt{\frac{0.5110^{2}}{12}+\frac{0.1107^{2}}{12}}}=2.733$

$\large \begin{align} \nu &=\frac{(\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}})^{2}}{(\frac{S_{1}^{2}}{n_{1}})^{2}/n_{1}-1+(\frac{S_{2}^{2}}{n_{2}})^{2}/n_{2}-1} \\&= \frac{(\frac{0.5110^{2}}{12}+\frac{0.1107^{2}}{12})^{2}}{(\frac{0.5110^{2}}{12})^{2}/12-1+(\frac{0.1107^{2}}{12})^{2}/12-1} \\&=12.03 \approx 12 \end{align}$

确定 P 值，作出推断

查 $\large t$ 界值表，得 $\large t_{0.05/2,12}=2.179$ （双侧检验）， $\large t_{0.01/2,12}=3.055$ ， $\large t_{0.02/2,12}=2.681$ ， $\large t=2.733$ 时， $\large 0.02> P> 0.01$ ， $\large P$ 值为犯假阳性错误的概率。

故在 $\large \alpha =0.05$ 水平上拒绝 $\large H_{0}$ 。

两组样本降血清胆固醇效果的差异具有统计学意义；

结论：可以认为两种降血清胆固醇措施的效果不同。

③两独立样本资料的方差齐性检验

某口腔医院选择所在城市 4050 岁慢性牙周炎患者 36 例，测得吸烟组（18 人）菌斑指数（PLI）均值为 84.71、标准差为 8.14；非吸烟组（18 人）菌斑指数的均值为 82.20、标准差为 6.18，试检验两总体方差是否相等?

$\large N(\mu _{1},\sigma _{1}^{2})$ ， $\large N(\mu _{2},\sigma _{2}^{2})$ ， $\large \sigma _{1}^{2}\neq \sigma _{2}^{2}？$ ？

建立检验假设，确定检验水准

$\large H_{0}$ ： $\large \sigma _{1}^{2}=\sigma _{2}^{2}$ $\large H_{1}$ ： $\large \sigma _{1}^{2}\neq \sigma _{2}^{2}$ $\large \alpha =0.05$

计算统计量

$\large F=\frac{S_{1}^{2}}{S_{2}^{2}}$ ， $\large \nu_{1} =n_{1}-1$ ， $\large \nu_{2} =n_{2}-1$ （有两个自由度：分子自由度 $\large \nu_{1}$ 和分母自由度 $\large \nu_{2}$ ）， $\large S_{1}^{2}$ 表示较大方差。

$\large F=\frac{S_{1}^{2}}{S_{2}^{2}}=\frac{8.14^{2}}{6.18^{2}}=1.7349$ ， $\large \nu_{1} =n_{1}-1=18-1=17$ ， $\large \nu_{2} =n_{2}-1=18-1=17$

确定 $\large P$ 值，作出推断

查F分布的双侧临界值表， $\large F_{0 . 05 / 2 ( 17 , 17 )}=2 . 67$ , $\large P$ >0.05，在 $\large \alpha$ =0.05的水准上不能拒绝 $\large H_{0}$ ，两个样本方差的差异不具有统计学意义。

结论：不能认为两个总体方差不相等。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
认识世界陈陈_19b4
9月16日，雨。阅读书目:《真相》。作者:瑞典统计学家和医学教授汉斯·罗斯林，他的儿子奥拉·罗斯林，google公共数据团队的负责人。汉斯·罗斯林还是一位全球知名的教育家，是世界健康组织和联合国儿童基金会的顾问。他与儿子儿媳共同创办了Gapminder基金会，开发了Trendalyzer软件，将国际统计数据转化成交互式的生动有趣的图表，帮助人们以事实为基础来观察世界，被称为“可视化数据之父”。图片
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【Python・统计学】威尔科克森符号秩检验/Wilcoxon signed-rank test（原理及代码） TUTO_TUTO 统计学 python python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎百度等）本文重点：威尔科克森符号秩检验(英文名：Wilcoxonsigned-ranktest)【1.简单原理和步骤】【2.应用条件】【3.数据实例以及Python代码】1.简单原理和步骤威尔科克森符号秩检验是一种非参数检验的方法,需要数据
【Python・统计学】Kruskal-Wallis检验/H检验（原理及代码） TUTO_TUTO python 统计学 python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎百度等）本文重点：Kruskal-Wallis检验(Kruskal-Wallistest),也称H检验【1.定义和简单原理】【2.应用条件】【3.数据实例以及Python代码】【4.多重比较（例：Dunn检验）】1.定义和简单原理Krusk
【Python・统计学】单因素方差分析（简单原理及代码） TUTO_TUTO 统计学 python python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～本文重点：单因素方差分析（以下：方差分析）【1.方差分析简单原理和前提条件】【2.方差分析和t检验的区别】【3.方差分析代码（配对/独立+事后检验+效应量）】1.方差分析简单原理方差分析（ANOVA）又称“变异数分析”或“F检验”，是由罗纳德·费雪爵士发明的，用
【统计学】参数检验和非参数检验的区别和基本统计学 TUTO_TUTO 统计学 python python
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～本文重点：参数检验和非参数检验的区别以及对应的常用统计学方法（这是需要根据自己的数据类型搞清楚用哪种统计学方法的关键）【1.参数检验】【2.非参数检验】【3.参数检验和非参数检验的区别】【4.常用统计学方法】1.什么是参数和参数检验参数(parameter)的概
看《碟中谍6》之前你不得不知道的天花 Mingo布克
8月31日《碟中谍6》再中国上映，鸣哥提前一天买了下午的票，准备看阿汤哥如何全面瓦解。图片发自App在这里就不剧透了，但是要说一个事情，在看电影之前各位不得不知道的事，关于天花。因为电影中，反派在克什米尔地区散步天花，造成了大量妇女和儿童死亡。OK，以下内容和电影再没关系了。2018年高考全国I卷作文题“战机防护”，“统计学家沃德坚持加强对飞机上弹痕少的地方的防护，而不是哪里弹痕多修复哪里，因为弹
日记2021-3-8 思考z
今天开课第一天，对于今天的目标完成的还不错早上起床赖了一下，下午去图书馆呆了2个多小时，晚自习看了概率论与统计学，单词：talent天赋，才能，thick厚的，obstacleto对……障碍，introduce介绍，传入，thin瘦的，稀薄的，thorough彻底的，完全的，occurredto想到，invent发明，throat喉咙，ofcourse当然，thunder雷，雷声，tide潮汐，o
PDF和CDF 薛定谔的猫_大雪概率论
在概率论和统计学中，PDF和CDF是两种描述随机变量分布的重要函数：ProbabilityDensityFunction(PDF)：概率密度函数是用来描述连续随机变量可能取值的概率分布的函数。对于一个连续型随机变量X，其PDFf(x)定义为在某个取值x处的概率密度，即X在该值附近出现的概率密度。PDF的积分可以得到概率，即在某个区间内随机变量出现的概率。CumulativeDensityFunct
Python 数学建模——方差分析 Desire.984 Python 数学建模数学建模 python 概率论
文章目录前言单因素方差分析原理核心代码双因素方差分析数学模型分析依据典型代码前言方差分析也是概率论中非常重要的内容，有时数学建模需要用到。方差分析是干什么的？如果说假设检验用于分析两个总体之间的均值μ1,μ2\mu_1,\mu_2μ1,μ2是否存在显著的差别，那么方差分析就是分析两个以上总体之间的均值是否存在显著的差别。单因素方差分析用途：已知一个量AAA可能会影响XXX，AAA的不同取值可能
几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩... weixin_39848097 几何分布的期望和方差公式推导均值定理六个公式概率论方差公式
我们天天都可以接触很多随机现象，比如每天的天气不一样气温是我们最直接的感受，我们很难预测明天的精确问题，但是这些随机现象又体现出了一定的规律性。比如上海7月份平均35度左右，冬天的平均温度在5度左右。所以35、5这些数字体现了某种稳定性。所以除了前面几章中讲到的分布律和概率密度函数可以表征随机变量外，还可以用一组数字来表达随机变量的一般特性。这就是我们今天要讲到的随机变量的数字特征。通过对数字特征
数据分析面试【概率论与统计学】总结之-----统计学常见面试题整理天阑的芋头 #数据分析—统计学知识数据分析统计学数据分析面试
阅读之前看这里：博主是正在学习数据分析的一员，博客记录的是在学习过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。博客地址：天阑之蓝的博客，学习过程中不免有困难和迷茫，希望大家都能在这学习的过程中肯定自己，超越自己，最终创造自己。目录1.用简洁的话语阐述随机变量的含义2.划分连续型随机变量和离散型随机变量的依据3.常见的分布函数/概率密度函数，以
每日小计划小糊涂神
活到老学到老到，学习永无止境，我坚持每天学习，我的学习计划如下：1.每天学习五个英语单词，和正在学习英语的儿子共同进步，方便辅导他。2.学习一节统计学或者一节线性代数课程，在此基础上进一步学习数据的处理软件。3.每天微信步数达到1万步，每天饭后过一下二人世界，不到沟通感情，而且还能强身健体！4.学习两节税务师课件，中级会计师已经通过，距离考高级还有几年，空档期考取税务师，充实自己的专业知识。5.坚
最大熵模型（Maximum entropy model） Fang Suk 机器学习最大熵模型最大熵最大熵原理指数族分布
最大熵模型（Maximumentropymodel）本文你将知道：什么是最大熵原理，最大熵模型最大熵模型的推导（约束最优化问题求解）最大熵模型的含义与优缺点1最大熵原理最大熵原理：在满足已知约束条件的模型集合中，选择熵最大的模型。熵最大，对应着随机性最大。最大熵首先要满足已知事实，对于其他未知的情况，不做任何的假设，认为他们是等可能性的，此时随机性最大。2最大熵模型最大熵原理是统计学习的一般原理，
Python 数学建模——假设检验 Desire.984 Python 数学建模 python 数学建模概率论
文章目录前言参数假设检验单个总体均值的假设检验σ\sigmaσ已知σ\sigmaσ未知两个总体均值的假设检验参考代码非参数假设检验分布拟合检验——卡方检验KS检验（Kolmogorov-Smirnov检验）Wilcoxon检验Wilcoxon符号秩检验Wilcoxon秩和检验前言假设检验是概率论中相当重要的内容。一般是先提出一个原假设H0H_0H0和一个对立的备择假设H1H_1H1，通过数学方
【统计学习方法读书笔记】（四）朴素贝叶斯法 Y.G Bingo 统计学习方法人工智能统计学习概率概率论
终于到了贝叶斯估计这章了，贝叶斯估计在我心中一直是很重要的地位，不过发现书中只用了不到10页介绍这一章，深度内容后，发现贝叶斯估计的基础公式确实不多，但是由于正态分布在生活中的普遍性，贝叶斯估计才应用的非常多吧！默认输入变量用XXX表示，输出变量用YYY表示概率公式描述：P(X=x)P(X=x)P(X=x)：表示当X=xX=xX=x时的概率P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣
时间序列分析技巧（二）：ARIMA模型建模步骤总结小墨&晓末时间序列分析算法机器学习人工智能程序人生
CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍:研一｜统计学｜干货分享擅长Python、Matlab、R等主流编程软件累计十余项国家级比赛奖项，参与研究经费10w、40w级横向文章目录1目的2ARIMA模型建模流程图解3ARIMA模型建模实操1目的该篇为针对时间序列ARIMA模型建模系列技巧：ARIMA模型
数学基础 -- 线性代数之矩阵的迹 sz66cm 线性代数机器学习决策树
矩阵的迹什么是矩阵的迹？矩阵的迹（TraceofaMatrix）是线性代数中的一个基本概念，定义为一个方阵主对角线上元素的总和。矩阵的迹在许多数学和物理应用中都起着重要作用，例如在矩阵分析、量子力学、统计学和系统理论中。矩阵迹的定义对于一个n×nn\timesnn×n的方阵AAA：A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮an1an2⋯ann)A=\begin{pmatrix}a_{1
【统计学习方法】感知机 jyyym ml苦手机器学习
一、前言感知机是FrankRosenblatt在1957年就职于康奈尔航空实验室时所发明的一种人工神经网络。它可以被视为一种最简单的前馈神经网络，是一种二元线性分类器。Seemoredetailsinwikipdia感知机.本篇blog将从统计学习方法三要素即模型、策略、算法三个方面介绍感知机，并给出相应代码实现。二、模型假设输入空间是x∈Rnx\in{R^n}x∈Rn，输出空间是y∈{−1,+1
2024 数学建模国赛 C 题模型及算法（无废话版）不染53 数学建模数学建模算法 python
目录写在开始需要掌握的数学模型/算法评价体系/评价类问题时间序列处理数据降维聚类问题（无监督）分类问题（有监督）集成学习（Bagging/Boosting）回归问题关联分析统计学方法/统计模型智能优化算法需要掌握的Python专业库需要掌握的软件/工具写在开始本人获2023年数学建模国赛C题国家级一等奖，备赛期间专攻C题。本文总结了在备赛期间总结的模型和算法，足以应对90%国赛C题中涉及到的问题。
每天一个数据分析题（五百一十四）- 决策树算法跟着紫枫学姐学CDA 数据分析题库算法数据分析决策树
决策树由节点和边两种元素组成的结构，决策树中不包含一下哪种结点？A.根结点（rootnode)B.内部结点（internalnode）C.外部结点（externalnode）D.叶结点（leafnode）数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练
零基础入门生信数据分析——导读呆猪儿生信之转录组——上游分析生信之转录组——下游分析学习方法 r语言数据分析数据库数据挖掘需求分析大数据
零基础入门生信数据分析——导读生信数据分析，即生物信息学数据分析，是一个涵盖了生物学、计算机科学、数学和统计学等多个领域的交叉学科。它主要利用计算机算法和统计方法对生物学数据进行处理、分析和解释，以揭示生物分子、细胞、组织和生物体等各个层次的生物学规律和机制。本帖主要是为生信数据分析的各个分析点提供跳转链接（简单说就是提供了一个目录供大家选择自己想要的知识点可以直接跳转）关联的生信数据分析的分析点
2024国赛数学建模备战-数学建模思想方法大全及方法适用范围 V建模忠哥V 2024国赛数学建模
第一篇：方法适用范围一、统计学方法1.1多元回归1、方法概述：在研究变量之间的相互影响关系模型时候，用到这类方法，具体地说：其可以定量地描述某一现象和某些因素之间的函数关系，将各变量的已知值带入回归方程可以求出因变量的估计值，从而可以进行预测等相关研究。2、分类分为两类：多元线性回归和非线性线性回归；其中非线性回归可以通过一定的变化转化为线性回归，比如：y=lnx可以转化为y=uu=lnx来解决；
数学漫步——贝叶斯估计思想罗泽坤
统计学中有两个大的学派：频率学派(也称经典学派)，和贝叶斯学派总所周知统计推断是根据样本信息对总体分布或者是总体特征数进行推断，经典学派和贝叶斯学派就是通过统计推断的不同方式划分的，经典学派的统计推断是依据样本信息和总体信息来进行推断，而贝叶斯学派认为除了依据以上两种信息来进行推断以外还可以应该加上先验信息来进行统计推断。样本信息：样本信息即抽取样本观测其值所得到的信息，譬如在等到一组样本值之后可
科研绘图系列：R语言基础图形合集生信学习者2 R语言可视化其他 r语言
基础图形可视化数据分析的图形可视化是了解数据分布、波动和相关性等属性必不可少的手段。不同的图形类型对数据属性的表征各不相同，通常具体问题使用具体的可视化图形。R语言在可视化方面具有极大的优势，因其本身就是统计学家为了研究统计问题开发的编程语言，因此极力推荐使用R语言可视化数据。散点图散点图是由x值和y值确定的点散乱分布在坐标轴上，一是可以用来展示数据的分布和聚合情况，二是可通过分布情况得到x和y之
每天一个数据分析题（五百一十二）- 数据标准化跟着紫枫学姐学CDA 数据分析题库数据分析数据挖掘
在完整的机器学习流程中，数据标准化（DataStandardization）一直是一项重要的处理流程。不同模型对于数据是否标准化的敏感程度不同，以下哪个模型对变量是否标准化不敏感？A.决策树B.KNNC.K-MeansD.SVM数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，S
新书推荐 |《广告数据定量分析：如何成为一位厉害的广告优化师》 hzbooks
新书推荐《广告数据定量分析：如何成为一位厉害的广告优化师》长按二维码了解及购买资深广告优化师和数据分析师撰写，宋星、吴俊等近10位专家推荐，快速提升广告优化师数据分析能力，总结SEM、移动广告、信息流广告等各种广告数据分析方法论。名人推荐这本书立足统计学和广告优化的交叉领域，既有科学的数据分析理论作支撑，又和广告优化实践相结合，兼具理论意义和现实价值，可读性较强。在诸如应用商店广告位效果评估、信息
机器学习入门：机器学习的基本概念 Louis0687
姓名：高亦凡学号：19020100056学院：电子工程学院转载自：原文链接【嵌牛导读】机器学习（MachineLearning）是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科，研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能，是人工智能技术的核心。【嵌牛鼻子】机器学习【嵌牛提问】什么是机器学
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

统计推断——假设检验——t 检验(总体的标准差未知)

一、t检验的概念

二、t 检验的应用条件

三、t检验的分类

1、单样本资料的t 检验

2、配对设计资料（特殊的单样本检验）的t 检验

自身配对：

异体配对（同源配对）

3、两独立样本资料的t 检验

3.1、抽样

3.2、数据

3.3、目的

3.4、假定

你可能感兴趣的:(假设检验,统计学)