奔跑的蜗牛君666

推断统计 | 学习笔记 (全)

一.概率与概率分布

概率论：为解决不确定性问题提供方法

1.随机事件及其概率

基本概念

试验：在相同条件下，对事物或现象所进行的观察。特点是可以在相同的条件下重复进行；每次试验的可能结果不止一个，但试验的所有可能结果在试验之前是确切知道的；在试验结束之前，不能确定该次试验的确切结果

事件：随机试验的每一个可能结果

随机事件：每次试验可能出现也可能不出现的事件

基本事件：实验中每一个可能出现的结果（最简单的事件）

必然事件：每次试验一定出现的事件

不可能事件：每次试验一定不出现的事件

样本空间：一项实验中，可以罗列出实验的所有可能结果（基本事件）的集合

样本点：样本空间中每一个特定的实验结果，是样本空间的组成元素

事件的概率

定义：可能性大小

2.离散型随机变量及其分布

随机变量：一次试验结果的数值性描述。特点是变量的取值是随机的；变量出现某个数值的概率是确定的。根据取值情况的不同分为离散型随机变量和连续型随机变量

分布函数：设X是一随机变量，x是任意实数，则称函数F(x)=P{X<=x}为X的分布函数

离散型随机变量：随机变量X取有限个值或所有取值都可以逐个列举出来X1,X2...以确定的概率取这些不同的值

离散型随机变量的概率分布：列出离散型随机变量X的所有可能取值和随机变量取这些值的概率，然后用表格表示出来

两点分布（0 - 1 分布）

均匀分布

一个离散型随机变量取各个值的概率相同

列出随机变量取值及其取值的概率

二项分布

n重伯努利试验满足下列条件：

一次实验只有两种结果，即成功和失败，这里的成功是指感兴趣的某种特征

一次实验成功的概率是p，失败的概率是q=1-p，而且概率p对每次实验都是相同的

实验是相互独立的

实验可以重复进行n次

在n次试验中，成功的次数对应一个离散型随机变量

泊松分布

所考察的事件在任意两个长度相等的区间里发生一次的机会均等

所考察的事件在任何一个区间里发生与否和在其它区间里发生与否没有相互影响，即是独立的

泊松分布另一个重要用途是作为二项概率分布的近似。对一个n重伯努利实验，p代表每次伯努利实验成功的概率，当实验次数n相对很大，成功概率p相对很小，而乘积np大小适中时，泊松分布的一般表达式与二项分布的一般表达式近似相等

3.连续型随机变量及其分布

连续型随机变量：随机变量X取无限个值，所有可能取值不可以逐个列举出来，而是取数轴上某一区间内的任意点

连续型随机变量的概率分布：连续型随机变量可以取某一区间或整个实数轴上的任意一个值，它取任何一个特定值的概率都等于0，不能列出每一个值及其相应的概率，通常研究它取某一区间值的概率

正态分布

描述连续型随机变量的最重要的分布

可用于近似离散型随机变量的分布（例：二项分布）

经典统计推断的基础

正态分布是概率论中最重要的一种分布，大量的自然现象，经济现象和社会现象，看似毫无规则，但它们总体上都服从或近似服从正态分布

通常若影响某一随机现象的因素很多，且其中又没有哪种因素的影响起决定性作用，则该随机现象就服从或近似服从正态分布（中心极限定理），这是统计推断中通常可以假定总体服从正态分布的原因

标准正态分布

二.统计量及其抽样分布

1.统计量

用来描述样本特征的概括性数字度量，它是根据样本数据计算出来的一些量，是样本的函数

是样本的一个函数，统计推断的基础

常用统计量

2.由正态分布导出的几个重要分布

抽样分布：样本统计量的概率分布，是一种理论分布。在重复选取容量为n的样本时，由该统计量的所有可能取值形成的相对频数分布；样本统计量是随机变量；结果来自容量相同的所有可能样本；提供了样本统计量长远而稳定的信息，是进行推断的理论基础，也是抽样推断科学性的重要依据

3.样本均值的分布与中心极限定理

4.抽样分布

样本比例：指样本中具有某种特征的单位所占的比例

样本比例的抽样分布：所有样本比例的可能取值形成的概率分布

三.参数估计

1.参数估计的一般问题

估计量：用于估计总体参数的随机变量

估计值：估计参数时计算出来的统计量的具体值

点估计：用一个特定样本对总体未知参数所作的估计，仅是所有可能估计值中的一个点。目的是根据样本数据求出非常接近于总体参数的估计值。局限性是无法给出估计值接近总体参数程度的信息，由于样本是随机的，抽出一个具体的样本得到的估计值很可能不同于总体真值

区间估计：在点估计的基础上，给出总体参数估计的一个区间范围，该区间由样本统计量加减估计误差而得到，根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。基本步骤是确定待估参数和置信水平（置信度），置信水平由1-α给出，α称为显著性水平，置信度越高，置信区间越大 → 确定估计量，并找出估计量的抽样分布 → 利用股计量的抽样分布，给出置信区间

置信区间：由样本统计量所构造的总体参数的估计区间

置信水平：将构造置信区间的步骤重复很多次，置信区间包含总体参数真值的次数所占的比例

评价估计量的标准：无偏性（估计量的数学期望等于被估计的总体参数），有效性（对同一总体参数的两个无偏点估计量，有更小标准差的估计量更有效），一致性（随着样本容量增大，估计量越来越接近被估计的总体参数）

2.一个总体参数的区间估计

3.两个总体参数的区间估计

4.样本量的确定

基本原则：在满足所需的置信度和允许误差条件（置信区间的d值）下，确定所需的最低样本容量

四.假设检验

概念：先对总体的参数（或分布形式）提出某种假设，然后利用样本信息判断假设是否成立的过程

类型：有参数检验和非参数检验

特点：逻辑上运用反证法，统计上依据小概率原理

基本思想：小概率事件原理（小概率事件在一次试验中基本上不会发生）

统计推断方法：带有某种概率性质的反证法（先提出检验假设，再用适当的统计方法，利用小概率原理，确定假设是否成立。即为了检验一个假设H0是否正确，首先假设该假设H0正确，然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了小概率事件发生，就应该拒绝假设H0，否则不拒绝假设H0）

1.步骤

①提出原假设H0和备择假设H1

②从所研究的总体中抽出一个随机样本

③确定适当的检验统计量，并利用样本数据算出其具体数值

④规定显著性水平α，并计算出其临界值，指定拒绝域

⑤计算检验统计量的值

⑥利用P值做出统计决策

2.一个总体参数的检验

3.总体均值的检验

4.总体比例的检验

5.总体方差的检验

6.两个总体参数的检验

7.两个总体均值之差的检验（独立大样本）

8.两个总体比例之差的检验

9.两个总体方差比的检验

10. 两类错误（决策风险）

第一类错误：弃真错误，原假设为真时拒绝原假设，第一类错误概率为α，被称为显著性水平

第二类错误：取伪错误，原假设为假时接受原假设，第二类错误概率为β

两类错误的控制

一般来说，对于一个给定的样本，如果犯第一类错误的代价比犯第二类错误的代价相对较高，则将犯第一类错误的概率定得低些较为合理

一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。但由犯第一类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第一类错误的发生概率

11.P-value

如果原假设为真，所得到的样本结果会像实际观测结果那么极端或者更极端的概率

P值告诉我们：如果原假设是正确的话，我们得到目前这个样本数据的可能性有多大，如果这可能新很小，就应该拒绝原假设

被称为观察到的（或实测的）显著性水平

决策规则：若P值<α，拒绝H0

12.参数估计和假设检验的区别和联系

①区别

参数估计是以样本信息估计总体参数的可能范围，假设检验是先对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立

区间估计求得的是求以样本估计值为中心的双侧置信区间，假设检验既有双侧检验，又有单侧检验

区间估计立足于大概率，通常以较大的可信度（1-a）去估计总体参数的置信区间。假设检验立足于小概率，通常是给定很小的显著性水平a去检验总体参数的先验假设是否正确

②联系

都是根据样本信息推断总体参数

都以抽样分布为理论依据，建立在概率论基础之上的推断，推断结果都有风险

对同一问题的参数进行推断，使用同一样本，同一统计量，同一分布，两者可相互转换

13.单双侧检验的区别

单侧检验可以分为左单侧检验（下限检验）和右单侧检验（上限检验），它们都只有一个拒绝区域

双侧检验的目的是观察在规定的显著性水平下所抽取的样本估计量是否显著高于或低于假设的总体参数

备择假设具有特定的方向性，并含有“<”或“>”的假设检验，称为单侧检验或单尾检验

备择假设没有特定的方向性，并含有符号“≠”的假设检验，称为双侧检验或双尾检验

在单侧检验中，由于研究者感兴趣的方向不同，又可以分为左侧检验和右侧检验

14.显著性水平的局限性

显著性水平α是在实验之前确定的，这也就意味着我们事先确定了拒绝域

不论检验统计量的值是大还是小，只要它的值落入拒绝域就拒绝原假设，否则不拒绝原假设

这种固定的显著性水平α对检验结果的可靠性起一种度量作用。但不足的是，α是犯第一类错误的上限控制值，它只能提供检验结论可靠性的一个大致范围，而对于一个特定的假设检验问题，却无法给出观测数据与原假设之间不一致程度的精确度量，也就是说，仅从显著性水平比较，若选择的α值相同，所有的检验结果的可靠性都一样

15.P值较小时为什么要拒绝原假设？

P值是指在原假设为真的条件下，检验统计量的观察值大于或等于其计算值的概率

P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小，说明实际观测到的数据与H0之间不一致的程度就越大，检验的结果也就越显著

16.显著性水平与P值的区别

α的含义是当原假设正确时却被拒绝的概率或风险，即假设检验中放弃真错误的概率，是有人们根据检验的要求确定的，通常α = 0.05 或 0.01。而P值是原假设为真时所得到的样本观察结果或更极端结果出现的概率，它通过计算得到的，P值的大小取决于三个因素：样本数据与原假设之间的差异，样本量，被假设数据的总体分布

α只能提供检验结论的可靠性的一个大致范围，而对于一个特定的假设检验为题，却无法给出观测数据与原假设之间不一致程度的精确度量。即仅从显著性水平来比较，如果选择的α值相同，所有检查结果的可靠性都一样。而P值可以测量出样本观察数据与原假设中假设的值的偏离程度

五.分类数据分析

1.分类数据与卡方统计量

分类数据的观测值以类别的形式出现，具体观测数值反映出的是相应类别出现的次数

分类数据的统计分析

①适合度检验：目的是检验所观察到的次数或频数分配是否与理论上的或者所期望的分布一致

②独立性检验：目的是通过一个样本得到的两个类别变量的观测值，来检验这两个类别变量之间是否具有相互关联

③同质性检验：目的是检验在不同总体之间，对同一个变量的反应或次数分配是否具有显著差异

④改变的方向性检验：目的是检验同一个总体在某一政策或事件的影响下，次数分配是否发生显著变化

卡方检验基本原理

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度就决定卡方值的大小

如果卡方值越大，二者偏差程度就越大，若两个值完全相等时，卡方值为0，表明理论值完全符合

用于变量间拟合优度检验和独立性检验

卡方统计量

检验步骤

2.拟合优度检验

又称为适合度检验，目的是检验所观察到的次数或频数分配是否与理论上的或者所期望的分布一致

特点：检验的内容仅涉及一个变量，是一种单因子检验

拟合优度检验是检验期望频数和观察频数是否有显著性差异

3.列联分析：独立性检验

相关性分析方法

定性变量之间的相关性分析：列联表检验，相应分析

定性与定量之间的相关性分析：方差分析，多重比较

定量变量之间的相关性分析：相关系数，回归分析

相关性分析研究现象之间是否存在某种依存关系，对具体有依存关系的现象探讨相关方向及相关程度

相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法，可以分析包括变量间的关系情况以及关系强弱程度等

列联表

独立性检验

4.列联表中的相关度量

5.V相关系数

六.方差分析

1.方差分析

在生产经营管理过程中，我们常常会遇到需要对两个或两个以上总体均值是否存在显著差别进行检验的问题，从而判断某一种因素对我们研究的对象是否产生了显著的影响。方差分析是解决这类问题的一种很好的统计分析方法

方差分析是指检验多个总体均值是否相等的统计方法，所采用的方法就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它研究的是多个总体均值是否相等的统计方法，但本质是研究分类型自变量对数值型因变量的影响

相关术语

因素/因子：所要检验的对象

水平/处理：因子的不同表现

观察值：在每个因素水平下得到的样本数据

总体：因素的每一个水平可以看作是一个总体

样本数据：被投诉次数可以看作是从这些总体中抽取的样本数据

基本思想和原理

通过分析研究不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小

方差分析将一组样本数据所发生的总变差，依可能引发变差的来源分解成若干个部分，即将总变差的每一部分归因于某种原因，而这些原因分为若干种因素的影响和随机误差的影响。通过测度这些不同原因所导致的变差是否存在差异，来判断总体均值之间是否存在显著差异

两类误差

①随机误差：在因素的同一水平（同一个总体）下，样本的各观察值之间的差异

②系统误差：在因素的不同水平（不同总体）下，各观察值之间的差异

误差平方和

数据的误差用平方和表示

组内平方和：因素的同一水平下数据误差的平方和，只包含随机误差

组间平方和：因素的不同水平之间数据误差的平方和，包括随机误差和系统误差

均方

平方和除以相应的自由度

若原假设成立，组间均方和组内均方的数值就应该很接近，它们的比值就会接近1

若原假设不成立，组间均方会大于组内均方，它们之间的比值就会大于1

当这个比值大到某种程度时，就可以说不同水平之间存在显著差异，即自变量对因变量有影响

内容

单因素方差分析，双因素方差分析

基本假定

每个总体都应该服从正态分布：对于因素的每一个水平，其观察值是来自服从正态分布总体的简单随机样本

各个总体的方差必须相同：各组观察数据是从具有相同方差的总体中抽取的

观察值是独立的

问题的一般提法

方差分析的一般步骤

①建立方差分析的数学模型

②检查方差分析的前提条件是否成立

③建立检验的原假设和备择假设

④根据样本值计算检验统计量F

⑤做出方差分析表

⑥根据F检验结果做出决策

2.单因素方差分析

分析步骤

①提出假设

②构造检验统计量

需要计算：水平的均值，全部观察值的总均值，误差平方和，均方

③统计决策

关系强度的测量

方差分析中的多重比较

通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异

可采用Fisher提出的最小显著差异方法，简写为LSD

LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正（用MSE来代替）而得到的

多重比较的步骤

3.双因素方差分析

双因素方差分析及其类型

方差分析中涉及两个分类型自变量

基本假定：每个总体都服从正态分布，对于因素的每一个水平，其观察值是来自正态分布总体的简单随机样本；各个总体的方差必须相同，对于各组观察数据，是从具有相同方差的总体中抽取的；观察值是独立的

无交互作用的双因素方差分析：如果两个因素对试验结果的影响是相互独立的，分别判断行因素和列因素对试验数据的影响

有交互作用的双因素方差分析：如果除了行因素和列因素对试验数据的单独影响外，两个因素的搭配还会对结果产生一种新的影响

你可能感兴趣的:(统计学,概率论)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
认识世界陈陈_19b4
9月16日，雨。阅读书目:《真相》。作者:瑞典统计学家和医学教授汉斯·罗斯林，他的儿子奥拉·罗斯林，google公共数据团队的负责人。汉斯·罗斯林还是一位全球知名的教育家，是世界健康组织和联合国儿童基金会的顾问。他与儿子儿媳共同创办了Gapminder基金会，开发了Trendalyzer软件，将国际统计数据转化成交互式的生动有趣的图表，帮助人们以事实为基础来观察世界，被称为“可视化数据之父”。图片
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【Python・统计学】威尔科克森符号秩检验/Wilcoxon signed-rank test（原理及代码） TUTO_TUTO 统计学 python python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎百度等）本文重点：威尔科克森符号秩检验(英文名：Wilcoxonsigned-ranktest)【1.简单原理和步骤】【2.应用条件】【3.数据实例以及Python代码】1.简单原理和步骤威尔科克森符号秩检验是一种非参数检验的方法,需要数据
【Python・统计学】Kruskal-Wallis检验/H检验（原理及代码） TUTO_TUTO python 统计学 python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎百度等）本文重点：Kruskal-Wallis检验(Kruskal-Wallistest),也称H检验【1.定义和简单原理】【2.应用条件】【3.数据实例以及Python代码】【4.多重比较（例：Dunn检验）】1.定义和简单原理Krusk
【Python・统计学】单因素方差分析（简单原理及代码） TUTO_TUTO 统计学 python python 学习笔记
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～本文重点：单因素方差分析（以下：方差分析）【1.方差分析简单原理和前提条件】【2.方差分析和t检验的区别】【3.方差分析代码（配对/独立+事后检验+效应量）】1.方差分析简单原理方差分析（ANOVA）又称“变异数分析”或“F检验”，是由罗纳德·费雪爵士发明的，用
【统计学】参数检验和非参数检验的区别和基本统计学 TUTO_TUTO 统计学 python python
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～本文重点：参数检验和非参数检验的区别以及对应的常用统计学方法（这是需要根据自己的数据类型搞清楚用哪种统计学方法的关键）【1.参数检验】【2.非参数检验】【3.参数检验和非参数检验的区别】【4.常用统计学方法】1.什么是参数和参数检验参数(parameter)的概
看《碟中谍6》之前你不得不知道的天花 Mingo布克
8月31日《碟中谍6》再中国上映，鸣哥提前一天买了下午的票，准备看阿汤哥如何全面瓦解。图片发自App在这里就不剧透了，但是要说一个事情，在看电影之前各位不得不知道的事，关于天花。因为电影中，反派在克什米尔地区散步天花，造成了大量妇女和儿童死亡。OK，以下内容和电影再没关系了。2018年高考全国I卷作文题“战机防护”，“统计学家沃德坚持加强对飞机上弹痕少的地方的防护，而不是哪里弹痕多修复哪里，因为弹
日记2021-3-8 思考z
今天开课第一天，对于今天的目标完成的还不错早上起床赖了一下，下午去图书馆呆了2个多小时，晚自习看了概率论与统计学，单词：talent天赋，才能，thick厚的，obstacleto对……障碍，introduce介绍，传入，thin瘦的，稀薄的，thorough彻底的，完全的，occurredto想到，invent发明，throat喉咙，ofcourse当然，thunder雷，雷声，tide潮汐，o
PDF和CDF 薛定谔的猫_大雪概率论
在概率论和统计学中，PDF和CDF是两种描述随机变量分布的重要函数：ProbabilityDensityFunction(PDF)：概率密度函数是用来描述连续随机变量可能取值的概率分布的函数。对于一个连续型随机变量X，其PDFf(x)定义为在某个取值x处的概率密度，即X在该值附近出现的概率密度。PDF的积分可以得到概率，即在某个区间内随机变量出现的概率。CumulativeDensityFunct
Python 数学建模——方差分析 Desire.984 Python 数学建模数学建模 python 概率论
文章目录前言单因素方差分析原理核心代码双因素方差分析数学模型分析依据典型代码前言方差分析也是概率论中非常重要的内容，有时数学建模需要用到。方差分析是干什么的？如果说假设检验用于分析两个总体之间的均值μ1,μ2\mu_1,\mu_2μ1,μ2是否存在显著的差别，那么方差分析就是分析两个以上总体之间的均值是否存在显著的差别。单因素方差分析用途：已知一个量AAA可能会影响XXX，AAA的不同取值可能
几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩... weixin_39848097 几何分布的期望和方差公式推导均值定理六个公式概率论方差公式
我们天天都可以接触很多随机现象，比如每天的天气不一样气温是我们最直接的感受，我们很难预测明天的精确问题，但是这些随机现象又体现出了一定的规律性。比如上海7月份平均35度左右，冬天的平均温度在5度左右。所以35、5这些数字体现了某种稳定性。所以除了前面几章中讲到的分布律和概率密度函数可以表征随机变量外，还可以用一组数字来表达随机变量的一般特性。这就是我们今天要讲到的随机变量的数字特征。通过对数字特征
数据分析面试【概率论与统计学】总结之-----统计学常见面试题整理天阑的芋头 #数据分析—统计学知识数据分析统计学数据分析面试
阅读之前看这里：博主是正在学习数据分析的一员，博客记录的是在学习过程中一些总结，也希望和大家一起进步，在记录之时，未免存在很多疏漏和不全，如有问题，还请私聊博主指正。博客地址：天阑之蓝的博客，学习过程中不免有困难和迷茫，希望大家都能在这学习的过程中肯定自己，超越自己，最终创造自己。目录1.用简洁的话语阐述随机变量的含义2.划分连续型随机变量和离散型随机变量的依据3.常见的分布函数/概率密度函数，以
每日小计划小糊涂神
活到老学到老到，学习永无止境，我坚持每天学习，我的学习计划如下：1.每天学习五个英语单词，和正在学习英语的儿子共同进步，方便辅导他。2.学习一节统计学或者一节线性代数课程，在此基础上进一步学习数据的处理软件。3.每天微信步数达到1万步，每天饭后过一下二人世界，不到沟通感情，而且还能强身健体！4.学习两节税务师课件，中级会计师已经通过，距离考高级还有几年，空档期考取税务师，充实自己的专业知识。5.坚
感悟文是很容易写的林天歌
生活感悟是很容易写的，只要你生活中稍稍关注一下周围在发生什么，随便什么事情都可以，甚至编一件事都可以，然后为之赋予一个意义。举例子的话，比如说我可以写我的概率论老师，每节课三小时，两小时都是在讲课堂无关的事情，都是在讲一些她以为的人生道理，却不知道因为她讲得太多，加上她使用互联网的能力不足，她讲得已经完全不能触动到学生的神经，反倒还促进了一些学生的逃课。这就是典型的以己度人，她以为她在分享自己认为
深度学习算法，该如何深入，举例说明 liyy614 深度学习
深度学习算法的深入学习可以从理论和实践两个方面进行。理论上，深入理解深度学习需要掌握数学基础（如线性代数、概率论、微积分）、机器学习基础和深度学习框架原理。实践上，可以通过实现和优化深度学习模型来提升技能。理论深入数学基础线性代数：理解向量、矩阵、特征值和特征向量等，对于理解神经网络的权重和偏置矩阵至关重要。概率论：用于理解模型的不确定性，如Dropout等正则化技术。微积分：理解梯度下降等优化算
机械学习—零基础学习日志（概率论总笔记5）学长小陈来帮你学习笔记概率论算法深度学习机器学习
引言——“黑天鹅”要获得95%以上置信度的统计结果，需要被统计的对象出现上千次，但是如果整个样本只有几千字，被统计的对象能出现几次就不错了。这样得到的数据可能和真实的概率相差很远。怎么避免“黑天鹅”？古德-图灵折扣估计法在词语统计中，有点词语虽然是出现0次，但是实际的出现概率并不是永远不可能的零。那需要把一些概率转移给到这些词语。古德的做法实际上就是把出现1次的单词的总量，给了出现0次的，出现2次
最大熵模型（Maximum entropy model） Fang Suk 机器学习最大熵模型最大熵最大熵原理指数族分布
最大熵模型（Maximumentropymodel）本文你将知道：什么是最大熵原理，最大熵模型最大熵模型的推导（约束最优化问题求解）最大熵模型的含义与优缺点1最大熵原理最大熵原理：在满足已知约束条件的模型集合中，选择熵最大的模型。熵最大，对应着随机性最大。最大熵首先要满足已知事实，对于其他未知的情况，不做任何的假设，认为他们是等可能性的，此时随机性最大。2最大熵模型最大熵原理是统计学习的一般原理，
Python 数学建模——假设检验 Desire.984 Python 数学建模 python 数学建模概率论
文章目录前言参数假设检验单个总体均值的假设检验σ\sigmaσ已知σ\sigmaσ未知两个总体均值的假设检验参考代码非参数假设检验分布拟合检验——卡方检验KS检验（Kolmogorov-Smirnov检验）Wilcoxon检验Wilcoxon符号秩检验Wilcoxon秩和检验前言假设检验是概率论中相当重要的内容。一般是先提出一个原假设H0H_0H0和一个对立的备择假设H1H_1H1，通过数学方
非理工科院校怎么打好数学建模比赛 | 南川笔记南川笔记
Proposition1非理工科院校最好不要打数学建模比赛。虽说“一次建模，终身受益”，但毕竟数学建模既要数学理论的支撑（不仅仅是大学里的微积分、线性代数和概率论与统计，更多的是基于微积分的常偏微分方程、基于线性代数的运筹学和基于概率论与统计的统计分析内容），还要编程的支撑（不是常规的C语言或者Java程序，也不是这几年很火的Python编程，而是基于数值运算的Matlab和基于统计的R），这在一
【统计学习方法读书笔记】（四）朴素贝叶斯法 Y.G Bingo 统计学习方法人工智能统计学习概率概率论
终于到了贝叶斯估计这章了，贝叶斯估计在我心中一直是很重要的地位，不过发现书中只用了不到10页介绍这一章，深度内容后，发现贝叶斯估计的基础公式确实不多，但是由于正态分布在生活中的普遍性，贝叶斯估计才应用的非常多吧！默认输入变量用XXX表示，输出变量用YYY表示概率公式描述：P(X=x)P(X=x)P(X=x)：表示当X=xX=xX=x时的概率P(X=x∣Y=ck)P(X=x|Y=c_k)P(X=x∣
时间序列分析技巧（二）：ARIMA模型建模步骤总结小墨&晓末时间序列分析算法机器学习人工智能程序人生
CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍:研一｜统计学｜干货分享擅长Python、Matlab、R等主流编程软件累计十余项国家级比赛奖项，参与研究经费10w、40w级横向文章目录1目的2ARIMA模型建模流程图解3ARIMA模型建模实操1目的该篇为针对时间序列ARIMA模型建模系列技巧：ARIMA模型
Python的图形化界面编程 iteye_20668 Python python
2017.2.14好久没有写代码了，感觉过一个年弄的什么也没有干成，好像看了下c++,突然发现现在来看C++,要简单了好多，并且指针也没有那么难了，然后就是看了下机器学习，感觉有点小难，现在发现好多都涉及到高数，概率论和线性代数的知识，想想当初把这些学的是一塌糊涂。然后上次和胡杨大大聊天的时候，他说好多东西都是在实践中去学习的。好了，继续我的Python吧，Python的图形化界面编程。impor
数学基础 -- 线性代数之矩阵的迹 sz66cm 线性代数机器学习决策树
矩阵的迹什么是矩阵的迹？矩阵的迹（TraceofaMatrix）是线性代数中的一个基本概念，定义为一个方阵主对角线上元素的总和。矩阵的迹在许多数学和物理应用中都起着重要作用，例如在矩阵分析、量子力学、统计学和系统理论中。矩阵迹的定义对于一个n×nn\timesnn×n的方阵AAA：A=(a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮an1an2⋯ann)A=\begin{pmatrix}a_{1
【统计学习方法】感知机 jyyym ml苦手机器学习
一、前言感知机是FrankRosenblatt在1957年就职于康奈尔航空实验室时所发明的一种人工神经网络。它可以被视为一种最简单的前馈神经网络，是一种二元线性分类器。Seemoredetailsinwikipdia感知机.本篇blog将从统计学习方法三要素即模型、策略、算法三个方面介绍感知机，并给出相应代码实现。二、模型假设输入空间是x∈Rnx\in{R^n}x∈Rn，输出空间是y∈{−1,+1
2024 数学建模国赛 C 题模型及算法（无废话版）不染53 数学建模数学建模算法 python
目录写在开始需要掌握的数学模型/算法评价体系/评价类问题时间序列处理数据降维聚类问题（无监督）分类问题（有监督）集成学习（Bagging/Boosting）回归问题关联分析统计学方法/统计模型智能优化算法需要掌握的Python专业库需要掌握的软件/工具写在开始本人获2023年数学建模国赛C题国家级一等奖，备赛期间专攻C题。本文总结了在备赛期间总结的模型和算法，足以应对90%国赛C题中涉及到的问题。
每天一个数据分析题（五百一十四）- 决策树算法跟着紫枫学姐学CDA 数据分析题库算法数据分析决策树
决策树由节点和边两种元素组成的结构，决策树中不包含一下哪种结点？A.根结点（rootnode)B.内部结点（internalnode）C.外部结点（externalnode）D.叶结点（leafnode）数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练
零基础入门生信数据分析——导读呆猪儿生信之转录组——上游分析生信之转录组——下游分析学习方法 r语言数据分析数据库数据挖掘需求分析大数据
零基础入门生信数据分析——导读生信数据分析，即生物信息学数据分析，是一个涵盖了生物学、计算机科学、数学和统计学等多个领域的交叉学科。它主要利用计算机算法和统计方法对生物学数据进行处理、分析和解释，以揭示生物分子、细胞、组织和生物体等各个层次的生物学规律和机制。本帖主要是为生信数据分析的各个分析点提供跳转链接（简单说就是提供了一个目录供大家选择自己想要的知识点可以直接跳转）关联的生信数据分析的分析点
2024国赛数学建模备战-数学建模思想方法大全及方法适用范围 V建模忠哥V 2024国赛数学建模
第一篇：方法适用范围一、统计学方法1.1多元回归1、方法概述：在研究变量之间的相互影响关系模型时候，用到这类方法，具体地说：其可以定量地描述某一现象和某些因素之间的函数关系，将各变量的已知值带入回归方程可以求出因变量的估计值，从而可以进行预测等相关研究。2、分类分为两类：多元线性回归和非线性线性回归；其中非线性回归可以通过一定的变化转化为线性回归，比如：y=lnx可以转化为y=uu=lnx来解决；
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR