xyr007

统计学简史

统计学历史:

1. 起源，分布

2. KarPearson时代，1890－1920

3. R.A.FISHER时代，1921-1936

4. NEYMAN－PEARSON时代，1937－1949

5. 现代，1950—

简写sb.代表有某人,具体的人物在文章后面列出。不在文章中列出,是因为人数太多,列在文章中，显示不出统计学的主要人物.还难以记忆.所以单列出来.

1. 起源，分布

统计是初产生于研究对国家，特别是对其经济以及人口的描述。当时现代数学尚未形成。因此那时的统计史基本上是经济史的范畴。现代统计主要起源于研究总体（population），变差（variation）和简化数据（reduction of data）。第一个经典文献属于John Graunt（1620－1674），其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。他注意到在非瘟疫时期，一个大城市每年死亡数有统计规律，而且出生儿的性别比为1.08，即每生13个女孩就有14个男孩。大城市的死亡率比农村地区要高。在考虑了已知原因的死亡及不知死亡年龄的情况下，Graunt估计出了六岁之前儿童的死亡率，并相当合理地估计出了母亲的死亡率为1.5％。因此，他从杂乱无章的材料中得出了重要的结论。他还给出了一个新的生命表。

sb1.利用了Breslau的记有死亡年龄的数据，改进了Graunt的生命表并引进了死亡率的定义。瑞士数学家sb2.提出了平稳生命表的概念。sb3. 等人最早讨论退休金和人寿保险的方案。Thomas Robert Malthus（马尔萨斯）（1766－1834），sb4. ，Ronald Aylmer Fisher（费歇）（1890－1962），及 William Feller（费勒）（1906－1970）等人用渐趋复杂的数学来研究生命表的理论，这对人类及其它总体的动方学描述具有显著意义。

William Petty（1623－1687）是Graunt同时代的经济学家及朋友。他认为需要建立中央统计部来利用人口统计学的知识；由行政区利用列出记录年龄，性别，婚姻状况等细节的记录表格来收集数据；要有出生，死亡，婚姻，收入，教育和商业等方面的统计数据。

当时在研究诸如死亡等时间序列时，Graunt注意到了随机的起伏；但他仅以机械的术语加以描述一把这些与钟表运动的忽动忽停相联系。实际上，这种不规则的变化也影响赌博和天文学。因此，其后进一步导致了随机误差的误差分布概念的出现。

赌博产生了第一个机会事件的模型：如果硬币就骰子的每一面都有相同概率，则导致估计抛一个均衡的硬币所出现的正面次数或掷一个均衡的骰子的总点数。更一般地，Abraham de Moivre（棣美佛）（1667-1754）导出了对二项分布的一个近似；这使每一个概率都等于正态曲线下的一块面积，这是一种的中心极限定理。sb5. 导出了对男子出生比例的类似的渐近公式。sb6. 以弱大数定律支持了对大样本均值的使用。sb7. 计算了同分布随机变量和的精确分布，同样也支持了对大样本均值的使用。

在天文学中，要对一些运动星体位置的未知参数进行估计，通常某种意义上“最好的”估计都是来源于一些注定不和谐的观察值，因为只要观察值在数量上超过参数，就会产生度量误差。sb8. ，Thomas Bayes（贝叶斯）（1702－1761），sb9. ，sb10. ，sb11. ，sb12. 和sb13. 都在研究这个问题。后来被Friedrich Gauss（高斯）（1777－1855）解决。sb14. 用统计方法证明了双星的存在。

然而，认定现代统计理论是由精算科学，人口学和天文学的需要而发展来的观点是不正确的；事实上，它是由心理学，医学，人体测量学，遗传学和农业的需要发展出来的。

直到1830年，几乎所有的经验分布都是关于一维误差或一个非数值变量。在1830年之后，天文学家和社会学家 sb15.使得诸如身高体重之类的度量值的变量的经验分布通俗化。他在生物统计研究中大量利用了理论二项分布和正态分布。后来sb16. 报告了在普鲁士兵团中由马踢造成的受伤事故，发现Poisson（普阿松）分布和官方统计学有关。在计算血红细胞数目上，Poisson分布也被sb17. 所用。从那时起，该分布被大量地用于计数的试验中，比如闪光的计数。

在生物学上，统计方法使得Johann Gregor Mendel（孟德尔）（1822－1884）认识到某些主要遗传基因的存在，它们在0，l和2三个水平显现，其中水平0（双隐性）能和水平1和2区别开来。他能确定有相同或不相同的水平的个体之间交配的结果，而且提出了某些生物学事件等价于掷一个硬币的模型；他能对任意交配的结果给出概率并用实验来验证其假设。

虽然经济学没有产生超出用初等理论来求解问题，但在较早的医学统计中却夹生了有意思的问题。sb18. 和s19. 开始了建立疾病分类的困难课题；这些工作人员保存了精确和完整的所有病例的记录，并且能给出和预后有关的统计数字。sb19. 能有利用跟踪调查的方法反驳以当时广泛滥用的放血疗法。他的三个学生是值得一提的：sb20.写了一本医学统计的教科书；书中有应用Simeon Dents Poisson（1780－1840）理论来对两个比例进行检验的许多应用；sb21. 和他的不知名的数学顾问对一系列分娩热病例给出了有趣的分析，证明该病是传染的，这优于任何十九世纪的类似研究；sb22. 在官方统计学中建立了新的惯例。

更直接的原动力来自于遗传学（确切地说是优生学）。Francis Galton（1822一1911）在1886年研究了两代豌豆重量之间的相关时发现了Y关于一个正态变量X的线性回归及类似于椭圆的等概率线。从此，多元正态分布就经常出现在文献之中；而两个和三个变量的正态分布在Lapface时就已经知道了。该联合分布能够由互相独立的正态随机变量的线性变换而构造，例如Gb23. 和sb24. 所做. sb24. 2在最小二乘理论上导出了一般形式的多元正态分布；sb25.把xTAx化简为平方和并确定了该常数值。这些人都未对A-1＝V的非对角线元素感兴趣，这里V是协方差矩阵。Galton后来说“这些误差或偏差正是我想要研究并了解的。”

正态分布在理论统计中扮演了一个非常重要角色。有许多理由来说明这一点；一般来说，如果一个模型包含着正态分布的几个非平凡特性，则它必须具备所有的特性。

在 1895年，Karl Pearson（皮尔森）（1857－1936）认识到更理论的统计分布的需要，并且得到作为微分方程（Pearson方程组）解的密度函数；和另外一些统计学家一样，Andrei andreevic Markov（马尔科夫）（1856－1922）不愿意用Pearson分布方程组，因为即使得了皮尔森Г曲线作为一个极限分布，也没有明显的模型来产生它们。Markov进一步证明Pearsonχ2统计量为样本尺寸乘以sb26.的离散系数。sb27. 利用取独立第二项变量和的方法得到二项变量的联合分布。许多作者，比如sb28. 已经参与了发展该思想；但是许多其它思想已经被用来获得联合分布。在KarlPearson的方法不能产生更多的联合分布之后，sb29.认为一个更具有生产价值的方法可能存在于随机过程的领域中。

2. KarPearson时代，1890－1920

到1920年为止的英国生物统计学派的主要就为（i）收集并化简了许多经验数据；（ii）定义了具有多重和总相关系数ρ的联合正态分布，还定义了估计误差的联合分布；（iii）关于拟合度的χ2检验，比较观察分布和理论分布，包括由sb30. Herbert Edward Soper（1865－1930）引进的条件Poisson变量；（iV）分析列联表，特别是利用χ2统计量；（V）当边缘分布充分细分时由最大似然法估计ρ；（Vi）当边缘分布没有充分定义时估计ρ；（Vii）由一个统一的参数估计系统来描述一组曲线，即矩方法；（Viii）利用正态定理到遗传选择问题；（iX）通往独立性一般定理的某些进展；（X）通往估计和检验估计精确性的一个理论的进展；（Xi）构造了适当的表。

与此同时，在法国的 Feli院sb31. ，sb32. 及sb33. 和在俄国的sb34. ，sb35. 和sb36.作出许多贡献，特别是把数据的数学处理严格化。

3. R.A.FISHER时代，1921-1936

所有的皮尔森的方法都可以应用于大样本，而且可以对方差作出较精确的估计。但对于出现在实际应用中的小样本，这些方法就未必奏效了。sb37.国此导出了一个检验；按照R.A.Fisher的建议该检验在作了一个变换之后成为现在熟和的t-检验。

Fisher以其四篇值得纪念的论文开创了一个新纪元；相关系数估计的精确分布；协调一致了Mendelian和生物统计对遗传学的不同方法；正确解释了列联表；估计和推断的一般定理。在1920年之后，在Rothamsted实验室，Fisher发展了有广泛应用价值的方差分析和试验与分析的理论。Fisher有很强的数学功底，特别是在组合论（combinatorics）方面，他能吸引其他数学家作为助手。他对应用领域的选择是很幸运的；研究结果都能立即应用并有明显的经济效应；能够有效地简化假设，比如误差的正态性和独立性；和一些顽固的教条斗争；试验的花费都很低；没有伦理问题。许多重要的步骤用来发展上面提到的Pearson学派的工作的一些分支。在（iii）和（iV）中的许多重要问题被解决了；给出了正确的自由度；

K.Pearson已经为该目标前进了一段；在（Vii）中Fisher发明了更有效的方法来估计；他拒绝了用矩方法来确定分布；在(Vi)中Fisher和Yate发表了统计表。

Fisher在误差分布和互相独立性的假设使其能用正交变换来保持线性和二次型之间的独立性，这样就可合理地利用t-检验和F-检验。Fisher看到农业试验能利用更复杂的设计。于是，双向表的影响能够按地理因素（行和列）及处理来分别分析。这能推广到n维Latin方的应用，把处理用于Latin方相应的不同字母的位置上；该方法通过实行Graeco－Latin方来实现。Fisher及其助手和同事研究了设计问题，缺损值问题，非正交性等等；这些人包括sb38.，sb39. ，他们后来在美国特别有影响。此外，还有 sb40.，sb41. ，sb42. ，及sb43. 。

4. NEYMAN－PEARSON时代，1937－1949

Jerzy Neyman（1894－1981）及 Egon sharpe Pearson（1895一1980）在一系列的杰出的文章中澄清了推断理论，特别是有关显著性检验的基本原理一其合理性以往是常被批评。早期的显著性检验为关于二项变量之间或均值之间的，它们被 K.Pearson推广至χ2检验，被R.A.Fisher推广到F-检验，推广了Student T-检验。Neyman和 E.S.Fearson看出，为了更有效，应该考虑与待检验的零假设相对应的备选假设。他们在这样的检验中设立两种误差并因素导致了他们的基本引理，似然比检验，及势的概念；他们顺便验证了大多数常见的显著性检验的应用；他们还引进了置信限；但是他们的体系从未被Fisher所承认。Neyman和Pearson的工作影响了许多人，特别是美国人。

5. 现代，1950—

统计变得越来越数学化了。为了解对分布和推断理论的一般描述，需要测度论；Fourie分析成为研究波动最自然的工具；在分析方差的推断上，和在具对称性的设计以及在诸如 Graeco Latin方及 Steiner三元的特别结构的代数的推断上需要应用群论和数论。组合理论能用于编码理论和有限几何。因此统计数学成为纯粹数学的一部分，并且因其在各种领域的广泛应用而被研究。因为通常的统计检验已经彻底地研究了，而且往往被置身于某些具体应用领域的实际工作者所应用，所以在研究人员和实际工作者之间出现了一个距离；但是这种现象在其他开拓性的领域中也能看到。

电子计算机已经带来了巨大的变化。数据，比如海洋学中水面的高程，电磁能（特别是无线电波）的流量，工业过程的状态，生物的状态，都能用计算机收集；没有计算机这些是不实际或不可能的。计算机节省了大量人力，特别是在同样输出的重复计算上，例如在计算多元分析的相关系数和其它检验统计量时。由于计算软件包可用于所有通常的检验，特别是关于方差分析，则节省更多。高速计算使得有可能运用匹配和排列检验。当分布不能写成一个封闭的分析公式时，显著性水平也能计算；另外，计算机能用 Monte Carlo方法计算每一个事件的概率或近似显著性水平。由于利用软件包很方便，有时导致统计问题欠考虑而产生的结论，特别是在多重比较上。

模型在统计和科学工作中的作用现已被广泛承认；虽然基于应用领域的经验和知识，模型的选择在某种程度上是美学上的和任意的；但是一旦模型被选定，所有的推断都是数学的，用不着进一步的假设或原则。

所用的推断体系在某种程度上也是任意的；备选体系已经被大量研究。基于信仰的推断不再扮演重要的角色。贝叶斯模型在 Fisher时代曾一度失色，之后又被更广泛地应用。信息论已被引进；多数统计推断看来仍然以和Neyman—Pearson理论一致的方式来运作，运用在K.Pearson和Fisher时代引人的检验。

现代国家的增长的能力和兴趣要求以低花费收集更多的数据。sb44. 有远见地建议概率抽样应补充到人口普查方法中。这样的抽样已经在其被sb45. P引进之后成为在印度和其它地方的标准实践。被sb6. 所推广的工业质量控制方法也有类似的意图。

许多新的分支或专门化和应用已经被发展了：决策论，时间序列，多元分析，经济计量学，博奕论，临床试验，非参数推断，序贯分析，数学生物分类学，及可靠性。数量统计及其应用正在继续发展和扩大。

sb1. Edmond Helley（哈雷）（1656－1742）
sb2. Leonhard Euler（欧拉）（1707－1783）
sb3. John DeWitt(625－1672)
sb4. Alfred James lotke（1880－1949）
sb5. Pierre simon Laplace（拉普拉斯）（1749－1827）
sb6. Jacob Bernoulli（伯努利）（1654－1705）
sb7. Tomas simpson（辛普森）（1710－1761）
sb8. Rog.er Cotes（1682－1716）
sb9. Euler
sb10. Johann Toblas Mayer（1723－1762）
sb11. Rudger Josif Boskovic（1711－1787）
sb12. Laplace
sb13. Adrien Marie Legendre（勒让德）（1752－1833）
sb14. John Michell（米歇尔）(1724－1793）
sb15. Adolphe Jacques Quetele(1796－1874)
sb16. Ladislaus von Bortkiewicz（1868－1931）
sb17. Ernst Abbe（1840－1905）
sb18. Philippe Pinel（1745-1826）
sb19. Pierre Charles alexandre Louis（1787－1872）
sb20. Jules Gavarret（1808－1890）
sb21. Oliver Wendell Holmes（1809－1894）
sb22. William Farr（1807－1883）
sb23. iovanni Antonio amedeo Plana（1781－1863）
sb24. Irenee－Iules Bravais（1811－1863）
sb25. Auguste Bravais（l820－l884）
sb26. Wihelm Hector Bichard albrecht Lexis（1837一1914）
sb27. Walter Frank Raphael Weldon（1860－1906）
sb28. Alexander Craig Aitken（1895－1967）
sb29. Sergei Natanovic Bernstein（1880－1968）
sb30. Herbert Edward Soper（1865－1930）
sb31. x Edouard Justin emile borel（1871－1956），
sb32. Maurice Frenchet（1878-1973）
sb33. Jules Henri Poincare（1854－1912）
sb34. Alekandr Aleksandrovic Cuprov（1874－1926）
sb35. A.A.Markov
sb36. Vsevolod Ivanovic Romanovsky（l879－1954）
sb37. William Sealy Gosset（1876-1937）
sb38. Maurice Stevenson Bartlett（1910－）
sb39. William Gemmell cochran（1909－1982）
sb40. David John Finney（1917－）
sb41. Joseph Oscar Irwin（1898—1982）
sb42. Kanneth Mather（1911一）
sb43. Frank Yates（1902－）
sb44. Antlers Nicolai Kiaer（1838－1919）
sb45. Prasanta chandra Mahalanobis（1893－1972）
sb6. Andrew Shewhart(1891－1967）

应用统计学学什么科目_统计学考研科目分别有哪些？你都知道吗心言星愿应用统计学学什么科目
在现实社会社会中统计学的应用范围是比较广泛的，想要报考统计学的朋友也是不再少数的，那么问题就来了关于统计学应该要学习哪一些科目呢，下面就来详细的看一下关于统计学方向具体的统计学考研科目分别有那些。首先对于统计学来讲英语政治史必然的初试科目，而专业课的考研科目具体是什么还是要看你选择的院校的实际出题情况了，所以在确定了考研科目之后一定要在在确定一下你想去的高校，以便能够更好的准备。在来看一下在学校方
2025 年最值得收听的 AI 播客推荐！助你轻松掌握人工智能前沿动态！真智AI 人工智能开发语言机器学习
如今，几乎每个人都被告知需要提升技能，而当前许多组织最看重的技能之一就是人工智能（AI）。学习AI相关技能通常涉及数学、统计学和机器学习，但除此之外，你还需要了解行业趋势、业内人士的观点以及各大公司的动态。然而，学习并不意味着时刻都要埋头苦读！有时候，你需要给大脑一个喘息的机会，同时依然能获取有价值的信息。而收听AI相关的播客，就是一个轻松高效的方式。以下是2025年你必须关注的AI播客！1.Th
智商测试原理全解析：从心理学到统计学，一文读懂(包含数据接口 2401_84193787 职场发展职场和发展求职招聘单一职责原则
智力测验（IntelligenceTest）是有关人的普通心智功能的各种测验的总称，又称普通能力测验。编制这类测验的目的是为了综合评定人的智力水平。早期编制的智力测验多采取个人测验的形式，这是单独评估心智功能的最好方法。国际上常用的个人智力测验主要有两种：斯坦福-比奈智力量表和韦克斯勒智力量表。现在常用测验包括：比奈－西蒙智力量表、韦克斯勒智力量表、斯坦福一比奈智力量表、瑞文标准智力测验、军队甲种
23章11节：自助抽样及其在R语言中的实现与验证 DAT｜R科学与人工智能用R探索医药数据科学 r语言开发语言 r-4.2.1 microsoft 信息可视化
在统计学中，数据分析的核心任务之一是如何在样本数据的基础上推断总体的性质。传统方法往往依赖于已知的概率分布假设和解析推导，但在现实问题中，我们往往无法准确得知总体分布，或者数据样本量较小，难以满足经典统计推断方法的要求。自助抽样作为一种非参数的计算方法，为我们提供了基于样本数据“自我重复”构建抽样分布的途径。1977年，斯坦福大学的B.Efron在著名论文《BootstrapMethods:Ano
ANOVA：在Python中构建和理解ANOVA（方差分析） python收藏家 python 数据科学 python
ANOVA（方差分析）是一种统计技术，用于确定三个或更多独立（不相关）组的平均值之间是否存在任何统计学显著差异。它有助于检验关于组间均值差异的假设，在比较多个组时特别有用。在Python中，可以使用scipy.stats模块中的f_oneway函数来执行单因素方差分析（one-wayANOVA），或者使用statsmodels库中的ANOVA类来进行更复杂的方差分析。重要概念总体均值（Popula
【人工智能数学基础】——深入详解贝叶斯理论：掌握贝叶斯定理及其在分类和预测中的应用猿享天开人工智能数学基础专讲分类数据挖掘人工智能贝叶斯数学
深入详解贝叶斯理论：掌握贝叶斯定理及其在分类和预测中的应用贝叶斯理论（BayesianTheory）是概率论和统计学中的一个重要分支，它以托马斯·贝叶斯（ThomasBayes）命名，主要关注如何根据新的证据更新对某一事件的信念。贝叶斯定理作为贝叶斯理论的核心，在机器学习、数据分析、决策科学等多个领域中具有广泛的应用。本文将深入探讨贝叶斯定理的理论基础、数学表达及其在分类和预测中的应用，辅以实例和
R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE） sdgfbhgfj R语言初见机器学习数据挖掘人工智能数据分析 r语言
R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE）目录R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE）R语言是解决什么问题的？R语言将向量数据按照行方式转化为矩阵数据（设置参数byrow为TRUE）安利一个R语言的优秀博主及其CSDN专栏：R语言是解决什么问题的？R是一个有着统计分析功能及强大作图功能的软件系统，是由奥克兰大学统计学系的RossIhak
机器学习数学基础：29.t检验 @心都机器学习人工智能
一、t检验的定义与核心思想（一）定义t检验（Student’st-test）是一种在统计学领域中广泛应用的基于t分布的统计推断方法。其主要用途在于判断样本均值与总体均值之间，或者两个独立样本的均值之间、配对样本的均值之间是否存在显著差异。例如，在教育研究中，可以通过t检验判断某个班级学生的平均成绩与全校学生的平均成绩是否有显著差异；在医学实验里，可用于比较实验组和对照组的患者某项生理指标的均值是否
周报 | 25.3.3-25.3.9文章汇总双木的木大模型专栏深度学习拓展阅读人工智能 linux 服务器 deepseek llama YOLO transformer
为了更好地整理文章和发表接下来的文章，以后每周都汇总一份周报。周报|25.2.24-25.3.2文章汇总-CSDN博客Datawhale|最新「大模型简史」整理！从Transformer（2017）到DeepSeek-R1（2025）--建议收藏！-CSDN博客AI生成未来|CVPR2025|多模态六边形战士Magma：会点按钮会搬砖，标注竟让AI长出“时空大脑“_magma-8b-CSDN博客机
深度学习和机器学习的差异 The god of big data 教程深度学习机器学习人工智能
一、技术架构的本质差异传统机器学习（MachineLearning）建立在统计学和数学优化基础之上，其核心技术是通过人工设计的特征工程（FeatureEngineering）构建模型。以支持向量机（SVM）为例，算法通过核函数将数据映射到高维空间，但特征提取完全依赖工程师的领域知识。这种"人工特征+浅层模型"的结构在面对复杂非线性关系时容易遭遇性能瓶颈。深度学习（DeepLearning）作为机器
支持向量机 SVM 简要介绍 _夜空的繁星_ 机器学习 svm 支持向量机拉格朗日对偶机器学习
那些我从来没有理解过的概念（1）下面是我在学习过程中遇到的对我很难理解的概念和我抄下来的笔记主要资料来源：《统计学习方法》，维基百科拉格朗日对偶问题是什么假设f(x),ci(x),hj(x)是定义在Rn上的连续可微函数，考虑以下最优化问题：$$\min_{x\inR^n}{f(x)}\c_i(x)\leq0,i=1,2,\dots,k\h_j(x)=0,j=1,2,\dots,l$$是一个凸优化问
【练习】PAT 乙 1061 判断题柠石榴 PAT 题解输入输出算法 c++
题目判断题的评判很简单，本题就要求你写个简单的程序帮助老师判题并统计学生们判断题的得分。输入格式：输入在第一行给出两个不超过100的正整数N和M，分别是学生人数和判断题数量。第二行给出M个不超过5的正整数，是每道题的满分值。第三行给出每道题对应的正确答案，0代表“非”，1代表“是”。随后N行，每行给出一个学生的解答。数字间均以空格分隔。输出格式：按照输入的顺序输出每个学生的得分，每个分数占一行。输
总体方差和样本方差然后就去远行吧疑难杂症
在统计描述中，方差用来计算每一个变量*（观察值）与总体均数之间的差异。为避免出现离均差总和为零，离均差平方和受样本含量的影响，统计学采用平均离均差平方和来描述变量的变异程度。总体方差计算公式：σ2=∑(X−μ)2N\sigma^2=\frac{\sum(X-\mu)^2}{N}σ2=N∑(X−μ)2公式中σ2\sigma^2σ2为总体方差，XXX为变量，μ\muμ为总体均值，NNN为总体例数。在实
利用R语言irr包计算ICC值（组内相关系数） mlhylzqwxli r语言
ICC值是一个较为陌生的概念，在统计学中应用较多，引用百度百科的介绍：组内相关系数(ICC)是衡量和评价观察者间信度(inter-observerreliability)和复测信度(test-retestreliability)的信度系数(reliabilitycoefficient)指标之一。它最先由Bartko于1966年用于测量和评价信度的大小。ICC等于个体的变异度除以总的变异度，故其值介
第0节机器学习与深度学习介绍汉堡go 李哥深度学习专栏人工智能机器学习神经网络
人工智能：能够感知、推理、行动和适应的程序机器学习：能够随着数据量的增加而不断改进性能的算法（数学上的可解释性但准确率不是百分百，灵活度不高）深度学习：机器学习的一个子集：利用多层神经网络从大量数据中进行学习（设计一个很深的网络架构让机器自己学）（深度学习就是找一个函数f）机器学习算法简介（狭义）一般是基于数学，或者统计学的方法，具有很强的可解释性经典传统机器学习算法：KNN、决策树、朴素贝叶斯一
016.3月夏令营：数理类力学AI有限元保研
016.3月夏令营：数理类：中国人民大学统计学院：http://www.eeban.com/forum.php?mod=viewthread&tid=386109北京大学化学学院第一轮：http://www.eeban.com/forum.php?m...6026&extra=page%3D1香港大学化学系夏令营：http://www.eeban.com/forum.php?mod=viewthr
多独立样本秩检验：Kruskal-Wallis检验木子算法非参数统计非参数检验概率论统计
多独立样本秩检验：Kruskal-Wallis检验的理论与实践一、引言在统计学中，当数据不满足正态分布或方差齐性假设时，传统的参数检验（如方差分析ANOVA）可能失效。此时，非参数检验方法（如秩检验）成为更可靠的选择。本文将详细介绍多独立样本秩检验的核心方法——Kruskal-Wallis检验，包括其理论基础、公式推导、案例分析及Python实现。二、理论基础1.问题定义假设我们有kkk个独立样本
r语言手动算两个C指数p值,如何用R语言进行Pvalue显著性标记？蒲牢森 r语言手动算两个C指数p值
作者：一只想飞的喵审稿：童蒙编辑：angelica箱线图是统计学中较常见的图形之一。这篇文章将讲述如何简单比较两组或多组的平均值，且添加显著性标记。通常情况根据显著性p值的数值大小，分为四类：(1)0.01≤p<0.05，*(2)0.001≤p<0.01，**(3)0.0001≤p<0.001，***(4)p<0.0001,****接下来会讲述三种添加显著性标记的方法。方法1-手动添加1：创建数据
语义向量模型全解：从基础到现在的deepseek中的语义向量主流模型来自于狂人人工智能语言模型
一、语义向量模型：自然语言处理的基石语义向量模型（SemanticVectorModel）是自然语言处理（NLP）的核心技术，它将词汇、句子或文档映射为高维向量，在数学空间中量化语义信息。通过向量距离（如余弦相似度）衡量语义的相似性，支撑了搜索引擎、情感分析、机器翻译等实际应用。1.1发展简史1980s~2000s：基于统计的浅层模型，如TF-IDF（直接表征词的重要性）、LSA（通过矩阵分解降维
R语言广义加型模型（GAM）的运用例子及实现教程 Mrrunsen R语言大学作业 r语言开发语言
文章目录步骤1：加载所需包和数据步骤2：数据预处理步骤3：拟合广义加型模型步骤4：查看模型摘要和诊断模型摘要系数估计平滑项模型质量步骤5：预测和可视化结论广义加型模型（GeneralizedAdditiveModel，简称GAM）是一种灵活的非线性建模方法，在统计学和机器学习领域被广泛应用。GAM可以用于拟合非线性关系，适用于多个预测变量之间的复杂关系，并且可以处理连续和分类变量。本教程将向您展示
python 统计库_《统计学习方法》 Python 库 weixin_39756540 python 统计库
新建GitHub仓库仓库名为slmethod,统计学习方法(StatisticalLearningMethod)的简写Public公开仓库勾选InitializethisrepositorywithaREADME.gitignore选择Python添加MITLicensenew下载代码到本地，使用ssh协议。[email protected]:iOSDevLog/slmethod.git
数据挖掘与数据分析 dundunmm 数据挖掘数据挖掘数据分析人工智能
数据挖掘和数据分析是两个密切相关但有所区别的领域，它们都涉及从数据中提取有价值的信息，但在目标、方法和技术上有所不同。数据挖掘vs.数据分析特征数据挖掘数据分析目标从大数据中自动发现知识和模式通过系统分析数据，得出有意义的结论重点数据模式的自动发现、预测模型的构建数据理解、数据清洗、数据总结、假设验证方法机器学习、聚类、回归、关联规则、深度学习等统计学方法、数据可视化、数据清理、假设检验等应用实时
An Introduction to Statistical Learning with Applicatio AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介1.1定义统计学习（statisticallearning）是一门研究如何从数据中提取知识并应用于预测、决策或其他目的的一门学科。它是机器学习、数据挖掘、计算机视觉等领域的一个分支，是当前热门的AI方向。1.2特点数据驱动：统计学习倾向于采用结构化的数据——如表格或矩阵形式——作为输入；假设空间少：统计学习通常只考虑一种假设空间，即概率模型或概率分布；模型复杂性
规控算法工程师的技术图谱和学习路径执于代码开发者职业加速服务算法学习
规控算法工程师技术图谱与学习路径规控算法工程师（规划与控制算法工程师）是自动驾驶领域的核心岗位之一，涉及路径规划、行为决策、运动控制等多个技术模块。以下为技术图谱与学习路径的整合，结合行业需求和技术发展趋势。一、技术图谱核心模块数学基础线性代数：矩阵运算、向量空间、特征值分解（用于控制系统建模与优化）。微积分：梯度下降、泰勒展开、动态系统建模（支持控制算法推导）。概率论与统计学：贝叶斯理论、马尔可
推荐算法工程师的技术图谱和学习路径执于代码开发者职业加速服务推荐算法学习算法
推荐算法工程师的技术图谱和学习路径可以从多个维度进行概述，可以总结如下：一、技术图谱推荐算法工程师需要掌握的技术栈主要分为以下几个方面：数学基础：微积分、线性代数、概率论与统计学是推荐算法的基础，用于理解模型的数学原理和优化算法。高等数学、最优化理论、几何和图论等知识对于复杂模型的设计和优化至关重要。编程与数据结构：熟练掌握Python、Java等编程语言，具备良好的编程习惯和代码优化能力。掌握数
聚类分析tensorflow实例_新手必看的机器学习算法集锦（聚类篇）道酝欣赏
继上一篇《机器学习算法之分类》中大致梳理了一遍在机器学习中常用的分类算法，类似的，这一姊妹篇中将会梳理一遍机器学习中的聚类算法，最后也会拓展一些其他无监督学习的方法供了解学习。1.机器学习机器学习是近20多年兴起的一门多领域交叉学科，它涉及到概率论、统计学、计算机科学以及软件工程等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类能从数据中自动分析获得规律
数据挖掘与数据分析的区别是什么中琛源科技
数据挖掘与数据分析两者紧密相连，具有循环递归的关系，数据分析结果需要进一步进行数据挖掘才能指导决策，而数据挖掘进行价值评估的过程也需要调整先验约束而再次进行数据分析。从分析的目的来看，数据分析一般是对历史数据进行统计学上的一些分析，数据挖掘更侧重于机器对未来的预测，一般应用于分类、聚类、推荐、关联规则等。从分析的过程来看，数据分析更侧重于统计学上面的一些方法，经过人的推理演译得到结论；数据挖掘更侧
线性秩检验木子算法非参数统计数学建模概率论
线性秩检验一、引言在统计学的广袤领域中，参数检验通常基于数据服从特定分布（如正态分布）的假设。然而，在实际场景里，数据往往并不满足这些严格假设，此时非参数检验方法便展现出独特优势。线性秩检验作为一种强大的非参数检验手段，能够在不依赖数据分布的前提下，对数据进行深入分析，探寻其中隐藏的规律与差异。本文将全方位深入剖析线性秩检验，涵盖其原理、公式推导以及实际案例应用，助力读者全面掌握这一重要的统计方法
【线代】《线性代数的几何意义》——摘录笔记兼小结（五） jingyu404 线性代数读书及杂言
内容：大多是摘录原书，概括、理解是自己总结的。目的：供自己温习使用，有摘录不全或总结不精的部分。他人学习，仅供参考。目录附录1.线性代数简史2.怎样学习线性代数丘维声小结笔记链接汇总附录1.线性代数简史书上说摘自百科《线性代数》，所以就简略做个摘录吧。1.1向量，物理学。Bc350，亚里士多德：“力可以构成向量”，平行四边形法则。牛顿，最先使用有向线段表示。18c，威塞尔，用坐标平面的点表示复数，
【量化金融自学笔记】--开篇.基本术语及学习路径建议花花 Show Python 量化金融自学笔记金融笔记学习
在当今这个信息爆炸的时代，金融领域正经历着一场前所未有的变革。传统的金融分析方法逐渐被更加科学、精准的量化技术所取代。量化金融，这个曾经高不可攀的领域，如今正逐渐走进大众的视野。它将数学、统计学、计算机科学与金融学深度融合，为我们提供了一种全新的视角去理解和探索金融市场的奥秘。作为一名对量化金融充满热情的自学者，我深知在这个领域中，每一步都充满了挑战与机遇。从最初对复杂数学公式的困惑，到逐渐掌握编
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

统计学简史

你可能感兴趣的:(统计学简史)