Pterosaur_Zero

【学习笔记】组间差异比较及相关问题总结

前言

最近在对数据进行统计分析时发现自己其实对于统计学并没有一个很系统的了解，尤其是各种假设检验组间差异比较的方法过于繁多，实在是让人眼花缭乱，于是便打算把自己的疑惑及思考都总结记录下来，以便彻底搞清楚这些逻辑关系。

Q1：做组间差异比较的步骤是什么？方法都有哪些？

当要进行组间差异比较时，首先要对数据有一个清楚的认识，包括是否服从正态分布、方差是否齐性等等，还要知道数据到底是配对的还是不配对的，根据数据的不同，选择的比较方法也不尽相同，但大体上也就只有“参数检验”和“非参数检验”两种。无论是SPSS还是R语言等统计学工具，在实际操作的时候还是需要一步步选择的，具体步骤和方法如下面思维导图所示。

总体主要包括正态性检验方法（更详细的可查看上一篇博客：正态检验 (Normality Test)——常见方法汇总与简述）、方差齐性检验方法；两组样本的参数检验方法、非参数检验方法；多组方差分析的参数与非参数检验方法及对应的事后多重比较方法。由于每一类的方法都实在太多，以下仅总结出大部分常见的方法，可点击查看大图。

Q2：有些资料上提到，当两组服从正态分布的数据进行比较时，小样本（<30）使用t检验，大样本（>30）使用z检验，为什么SPSS等一些软件中只有t检验？

总体服从正态分布的数据在小样本时呈现为t分布，而服从t分布的数据在样本量较大时会渐进于正态分布，也就是无论样本量大小都可以使用t检验。但z检验需要数据严格服从正态分布，但数据量小时服从的是t分布而不是正态分布，因此z检验通常只能用在大样本的情况。显然t检验的使用条件更为宽松，并且完全可以替代z检验，因此可直接使用t检验。

相关参考：统计检验与多重矫正

Q3：为什么 Wilcoxon rank-sum test 又称为 Mann Whitney U test？它们有什么不同？

Rank-sum test 秩和检验方法最早是由Wilcoxon提出的，运用的场景是两组样本数量相等，后来Mann和Whitney将其应用到两样本容量不等的情况，因此又称为Mann Whitney U test。在文献中两种写法都有，脑科学研究中更多描述为“Mann Whitney U test”。

Q4：为什么方差分析的结果有差异后，还需要进行“事后多重比较”？

因为方差分析的结果只说明多组之间存在差异，但并不能明确计算出是哪两组之间存在差异，因此还需要进行两两进行比较以找出多组中哪两组之间存在差异。

Q5：是否有可能发生“在方差分析时没有差异，而事后两两比较时出现差异”，或者“在方差分析时有差异，而事后两两比较时却没有差异”这两种情况？

有可能，并且这两种情况的存在是合理的。

（1）方差分析结果显著只是说明组间可能存在显著差异，但某两组之间到底有无显著差异还是要看事后检验，事后两两比较允许无差异情况的存在；

（2）方差分析中，整体上的差异检验和事后多重比较的检验方法是不同的，而不同检验方法的检验效力是不一样的，有的可能对差异比较敏感，而有的却比较保守，因此就有可能造成该情况；

（3）事后多重比较中，可选用的比较方法比较多，适合数据的检验方法一般都不止一种，可尝试使用其他的方法进行检验，或许会得到不同的结果，再根据实际情况来对结果进行分析（可参考该领域的文献，具体问题具体分析）；

相关参考：方差分析F检验显著，但时候两两比较都不显著的问题

Q6：为什么事后多重比较不可以直接用t检验进行两两比较，而要用这些专门的事后多重比较方法？

这涉及到“多重比较矫正”的问题。于是又会引申出一个新的问题，就是“什么是多重比较矫正？”因此在解释完这个问题后，再回过头来重新回答这个问题。

Q7：什么是“多重比较矫正”？

在进行一次两两比较时，单个检验的显著性水平（即Ⅰ型错误率）一般设置为α=0.05，但随着检验次数的增加，也就是进行多次两两比较的时候，Ⅰ型错误会随之增加。简单点说就是，即使是小概率事件，但“夜路走多了也会遇到鬼”（借用知乎上看到的一句很有意思的话）。因此必须要对显著性水平α或计算出来的p值进行“矫正”，以防止Ⅰ型错误增加。

首先通过下表解释一下什么是Ⅰ型错误：

可能上面这个表很容易让人看得头晕，但简单点说，Ⅰ型错误率就是“原假设是真的，但却计算出原假设是假的，拒绝了原假设”的概率，也就是统计中经常用到的显著性水平α，一般都设置为α=0.05，使得犯Ⅰ型错误错的概率仅为0.05。为了更好地理解“多重检验会增加Ⅰ型错误概率”，并且为什么需要对α进行“矫正”的问题，下面尝试通过讲一个故事来进行解释。

假设一天只出门一次，且出门碰到鬼的概率为α=0.05，那么出门没碰到鬼的概率为1-α = 1-0.05 = 0.95。如果连续出门10天，每一天都单独来看的话，那么单独每天碰到鬼与没碰到鬼的概率为：

如果运气特别好，连续10天出门都没碰到鬼，这概率会是多少？通过计算，这个概率为：0.95^(10) ≈ 0.6，也就是连续10天都不会碰到鬼的可能性实际上只有60%，这显然比单独一天不碰到鬼的可能性95%要少多了，可见运气真的好。因此只要出门天数多，还想要天天都不碰到鬼，这可能性是会随着出门天数的增加而减少的，所以如果不想碰到鬼，最好的办法就是少出门。

那么，连续10天出门都没碰到鬼的概率为0.6，这还意味着什么？这时可以反过来想一下它的互补事件“连续10天至少有一天碰到鬼”的概率。互补事件的计算方法为：1-0.95^(10) ≈ 1-0.6 = 0.4，也就是说这10天中不管是第几天碰见鬼，也不管碰见了几次鬼，总之只要连续10天都出门，就会有40%的可能至少会碰到一次鬼！这比单独一天碰到鬼的概率0.05要大太多了！那么按照这个规律，如果连续出门20天，30天，甚至100天，“至少有一次碰到鬼”的概率将会是多少？根据上面的计算方法，计算公式为：1-(1-α)^n，作图如下：

可见，无论是概率多么小的事件，只要重复的次数越多，碰上的可能性就越大，并且当重复的次数足够多时，也就是出门的次数足够多时，就总会至少有一次会碰到鬼（接近于100%）。所以还是那句话，如果不想碰到鬼，还是少出门吧。

但减少出门次数通常来讲都是一件非常困难的事情，毕竟每天还要出门上班啊，周末还要出门溜达呀，有没有办法使得连续出门10天，也不会碰到鬼？或者说，即使连续出门10天，也仅接受0.05的概率碰到鬼，而不是0.4的概率碰到鬼，那该怎么办？

简单！找个算命法师，算个命，作个法，让单独每天碰到鬼的概率都降低一点不就得了！

法师：“你命中五行缺鬼，注定每天都有5%的可能碰到鬼，既然你要连续出门10天，那就让我略施小法，干脆把每天碰到鬼的概率改成 0.05/10=0.005 吧。” 于是单独每天碰到鬼和没碰到鬼的概率就变成：

此时，再次按照上面的计算方法，可算出连续10天都没碰到鬼的概率为：0.995(^10) ≈ 0.95，那么它的互补事件“连续10天至少有一天碰到鬼”的概率即为：1-0.995(^10) ≈ 1-0.95 = 0.05。虽然 “连续10天至少有一天碰到鬼”的概率0.05 与 “单独每天碰到鬼”的概率0.005 相比还是增加了10倍，但最终目的达到了，那就是“即使连续出门10天，也仅接受0.05的概率碰到鬼，而不是0.4的概率碰到鬼”。

到此，这个故事其实已经讲完了。对应回“多重比较矫正”这个问题，其实“出门碰到鬼的概率”就是“显著性水平/Ⅰ型错误概率α”，“连续出门天数”就是“两两比较次数”，因此当两两比较次数增多时，Ⅰ型错误的概率会随之增加，如果想要避免这样的高错误率，就需要“法师作法”来把“出门碰到鬼的概率”降低，实际上法师用到的法术，就是“多重比较矫正”中的各种方法，每种方法都有各自不同的侧重点，以有效降低Ⅰ型错误的概率。而上述故事中法师用到的法术仅仅是其中一种，就是简单粗暴的Bonferroni 矫正方法，直接把α除以出门的次数（两两比较的次数）来达到目的。

如果用一句话概括，多重比较矫正方法实际上就是设置更严格的阈值来定义统计学的显著性。

最后回到原来的问题：

重新回答Q6：为什么事后多重比较不可以直接用t检验进行两两比较，而要用这些专门的事后多重比较方法？

因为事后多重比较时会涉及多次的两两比较，那么Ⅰ型错误就会随着比较次数的增多而增加。而单纯的t检验是不会对显著性水平α值进行修改（矫正）的，永远都是设定为α=0.05，这就会导致无法降低Ⅰ型错误的概率，因此不能直接用t检验进行多次的两两比较，而应该用专门的事后多重比较方法来进行分析，因为这些专门的事后多重比较方法都会通过不同的方法对结果进行矫正，以减少Ⅰ型错误。

Q8：所以只要是事后多重比较中有多次的两两比较，都必须要做“多重比较矫正”？

不是的。从最开始的思维导图中可以看到，在“事后多重比较”中，“证实性研究”和“探索性研究”使用的事后多重比较方法是不一样的。其中：

证实性研究：在实验设计阶段，根据研究目的或专业知识事先设计好需要比较的组别。如在实验设计时已设计好有一组对照组，n组实验组，最后拿到数据后，只关心实验组和对照组之间的两两比较，而实验组与实验组之间的比较是不在实验设计范围内的，无需比较。即在得到数据前，就已经设计好需要比较的组有哪些，只关心某几个组之间的均数是否有差异，这称之为“事前比较”（priori test）。

探索性研究：在实验设计阶段由于不明确那些组之间的比较是需要关注的，没办法事先设计好需要比较的组别，因此在拿到数据后，所有组的两两比较都需要进行，以进一步确定到底是那两组之间是存在差异的。如在实验设计时，并不知道正常状态、疲劳状态和睡眠状态之间的脑电信号有无差异，所以在采集到数据后，需要两两之间都进行比较才能得到结果，需要考虑所有的比较，这称之为“事后比较”（post hoc test）。（注意在实际操作中会存在这样的情况：在数据收集完成后，为减少工作量，研究者会挑出来一些看似差异比较大的组进行比较，而那些看起来似乎没有差别的组便不再比较，因此在实际操作中并没有做完所有的两两比较，而是只完成了其中几组看起来差异大的两两比较。但要注意的是，即使看似仅进行了其中几组两两比较，但这些“看起来差异大”的组别已经是在所有两两比较中，“通过经验”而不是“检验方法”所筛选出来的结果，所以实际上也还是考虑了所有的两两比较，依然属于“事后比较”。）

一般情况下，证实性研究中的事后多重比较属于“计划内的比较”，一般不需要对多重比较进行矫正，如LSD-t test。而探索性研究的事后多重比较需要把所有组都进行一次两两比较，必须要进行多重比较矫正，因此这两种研究使用的事后多重比较方法是不一样的。

相关参考：

多重检验，p值矫正

多重检验及其生物学应用

高通量数据的多重检验问题

如何开展方差分析与多重比较-SPSS

Q9：如果进行多次方差分析（也就是进行多次“三三比较”、“NN比较”），也需要进行“多重比较矫正”吗？具体应该怎么做？

如一共有三组“正常状态”，“疲劳状态”，“睡眠状态”的脑电信号，需要研究三组之间，不同脑区（一共N个脑区）的脑电信号是否存在差异。那么在分析时，会先选定脑区1，然后对“正常”，“疲劳”和“睡眠”的信号进行方差分析；然后选定脑区2，对三组进行方差分析；以此类推，一共需要做N次方差分析。实际上“多重比较矫正”中的“多重比较”并不局限于“两两比较”，而是指任何比较，因此在上述分析中，一共进行了N次方差分析，同样需要进行“多重比较矫正”。只有在对N次方差分析的结果进行多重比较矫正后，仍有显著差异的脑区，才能进入下一步“事后多重比较”。在事后多重比较中，又会涉及到多次的两两比较，此时还需要再进行一次“多重比较矫正”。也就是上述的例子一共需要进行两次“多重比较矫正”。

Q10：方差分析中的事后多重比较方法大多都会进行“多重比较矫正”，这和文献中常见的“FDR矫正”之间有什么区别？多重比较矫正方法都有哪些？

多重比较矫正主要可划分为两大块，分别为 False Discovery Rates (FDR) correction 和 Family-Wise Error (FWE) correction，这两种矫正方法之间的区别需要再次用到这个表：

其中Family-wise error rate (FWER)的定义为“至少出现一次Ⅰ型错误的概率”，即

$FWER=P\left \{ C\geq 1 \right \} = 1-(1- \alpha )^n$

False discovery rate (FDR) 的定义为“Ⅰ型错误在总拒绝数量中的比率”，即

$FDR=E(C/(C+D))|(C+D> 0)P\left \{ C+D> 0 \right \}$

该表达式包含了总拒绝数(C+D)=0的情况，但如果拒绝数量不为0，可以直接简单地认为

因此FWE矫正方法实际上是通过控制FWER来实现的，为了保证多重比较结果的可靠性，该方法直接通过对显著性水平α进行矫正（控制），假设矫正后的α为α'，那么FWE矫正方法就是要保证：

$FWER=P\left \{ C\geq 1 \right \} = 1-(1- {\alpha}' )^n\leq \alpha$

而FDR矫正方法则是通过控制错误发现率FDR来实现的，为了保证多重比较结果的可靠性，该方法通过对结果的p值进行矫正（控制），以保证：

$FDR=C/(C+D)\leq \alpha$

这两种矫正的具体方法有很多，如以下思维导图所示（仅列出常见的部分方法，可点击查看大图）：

可见，方差分析事后多重比较中使用的矫正方法大部分都为FWE矫正，当然也可以选用FDR矫正方法来对事后多重比较的结果进行矫正。

需要注意的是，不同领域选用的矫正方法不尽相同，应根据实际研究的问题并参考相关文献来进行选择。

相关参考：

FWER和FDR(False Discovery Rate) - 简书 (jianshu.com)

如何通俗地理解Family-wise error rate(FWER)和False discovery rate(FDR)_sch的学习笔记-CSDN博客

yanlab.psych.ac.cn/Course/V3.1CN/9_StatisticalAnalysis.mp4

Q11：如果要对一些分类变量（如“性别”、“有无吸烟”等）进行差异性检验，该选什么方法？

首先要注意的是离散数据并不服从正态分布，因此应该选用非参数检验方法来进行比较。常用的方法是卡方检验（Chi-square test），它主要对两个及两个以上的样本率( 构成比）进行比较，或对两个或两个以上的分类变量进行关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题，如该分类变量不同组之间是否有差异，数据分布是否均匀。（由于只有分类变量才使用卡方检验，因此没有综合到第一个“组间差异检验”的思维导图中。）

相关参考：

【一图就懂】t检验 VS 卡方检验-中国全科医学 (chinagp.net)

统计学——卡方检验和卡方分布_snowdroptulip的博客-CSDN博客_卡方检验

全流程总结卡方检验，帮你理清分析思路 (baidu.com)

综合参考资料

组间差异检验，终于有人讲清楚了! - 简书 (jianshu.com)

样本均数间的多重比较，你想知道的都在这里！ - 专栏课程 - 医咖会 (mediecogroup.com)

方差分析两两比较 - 百度文库 (baidu.com)

如何理解事后多重比较的方法？ - 知乎 (zhihu.com)

Handbook_of_biostatistic_R/Handbook of Biostatistics and R.md at master · ShixiangWang/Handbook_of_biostatistic_R · GitHub

GraphPad中国官网 - Prism 8 统计指南 - 统计学原理 (graphpad-prism.cn) （PraphPad的统计学原理非常值得一读，有很多问题都能在里面找到答案。）

GraphPad Prism 9 Statistics Guide - Welcome to Prism 9 Statistics Guide （更推荐PraphPad的英文版网页，相比于直接翻译过来的中文版，一些描述性词语或许更准确一些。）

以上所有内容都是个人通过查阅相关资料并根据自己的理解来总结的笔记，或许还有很多地方没有完善或者理解不到位，欢迎各位批评指出！

Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
没想到，真没想到一棵落花的树
生活中，每一件小事都蕴藏着他的道理。有些令你意外，却能让你收到更为意外的结果。那一次，我真没想到的事，让我收获了爱。记忆的雨飘落下来，扰乱了我平静的心湖。那是一次数学考试，我破天荒地考了“99”分。我不禁沾沾自喜，这成绩我可不容易得到，妈妈一定会好好表扬我的。回到家，我想妈妈得意的报出成绩，妈妈只是淡淡的说：“嗯，等会儿试卷拿给我看看。”做完作业，我把试卷拿给了妈妈。只见妈妈捧着试卷，眯着眼睛盯着
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
九月班级管理工作反思追梦蜂
这个月应该算是最难的一个月，我已N年没当班主任，然后我又开始当了。职称是一方面，想到我如果退休了，不能再接触学生了，那该是多么遗憾的事！我的学生梁*铭是我的榜样，她那么努力，那么拼，那么上进，为什么我不行？虽然我面临的工作很难，但是高考数学也不容易。她拿下来了！满分150分她考了146分！我目睹她的艰辛，她的拼搏！还有，我要为我的孩子做榜样，如何竭尽全力，实现梦想。还有，服务，为社会做事，也是会有
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
高级UI<第二十四篇>：Android中用到的矩阵常识 NoBugException
（1）定义在数学中，矩阵（Matrix）是一个按照长方阵列排列的复数或实数集合。由m×n个数aij排成的m行n列的数表称为m行n列的矩阵，简称m×n矩阵。记作：图片.png这m×n个数称为矩阵A的元素，简称为元，数aij位于矩阵A的第i行第j列，称为矩阵A的(i,j)元，以数aij为(i,j)元的矩阵可记为(aij)或(aij)m×n，m×n矩阵A也记作Amn。元素是实数的矩阵称为实矩阵，元素是复
感恩日记Day 236 E姐小酒窝
图片发自App1.感谢16愿意听我"唠叨"，人与人的信任和托付在此刻弥足珍贵珍贵；2.感谢到家就能吃上美味的中餐，辛苦妞爸；3.感谢妞中午愿意听我叼叼旅行中的事儿；4.感谢星巴克就在家附近，让我一杯回魂；5.感谢美妞总结我和爸爸优点并说两者揉和就很棒了。6.感谢看到妞第一天数学成绩后淡定的自己；将责任归回妞自己并总结行动。7.感谢林姐姐信任，又定变啦减脂套餐。8.感谢梅姐知道我旅行回来后约我吃饭；
【高中数学/三角函数/判别式法求极值】已知：实数a,b满足a^2/4-b^2=1 求：3a^2+2ab的最小值普兰店拉马努金高中数学之三角函数高中数学三角函数判别式
【问题】已知：实数a,b满足a^2/4-b^2=1求：3a^2+2ab的最小值【来源】App"网易新闻"中up主“我服子佩”的数学视频专辑，据其称是北京市某年的竞赛题。【解答】由a^2/4-b^2=1，联想到secθ^2-tanθ^2=1故设a/2=1/cosθ,b=sinθ/cosθ将a=2/cosθ,b=sinθ/cosθ代入3a^2+2ab得f(θ)=(12+4sinθ)/(1-sinθ^2
2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
2021-10-17(376) 刘玥上学记
今天早上妈妈六点就把我喊起来了，天气太冷了，姥姥给我们煮了鸡蛋，路上保暖用一切按部就班的进行，到公司刚刚好七点五十妈妈给我安排的是上午两张试卷，下午两张试卷上午的没做完，下午的我实在是不想做了，后来凯丽姐姐说早点写完，可以早些玩耍我就回办公室写作业了一直到下午四点半，凯丽姐姐过来检查，数学卷子还没做完询问了半天，原来是乘法口诀没有背过，然后凯丽姐姐就一个一个的给我提问而且还说让我晚上回去自己再重新
2021-10-03 虫虫新生111
今天放假的第3天感觉过得好快，总体来说数学做了25道题，里边有几道题还是弄得不清楚，仍然不懂怎么做，不过整体感觉思路比去年要清晰很多，因为有去年的基础，今年还是比较轻松一些。逻辑做了有几道题，6题，错2，有些概念总的是模糊不清，还是要反复的再整理一下概念，以及回头看一下讲的基础知识，把基础的公式弄懂才可以。现在困了睡觉，明天早点起床。
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
创设问题情境的策略平常心666
创设情境要有情趣案例：可以圈多少地如何让孩子喜欢数学，是数学教师必须思考和解决的问题。有趣的情境会吸引学生，使学生主动走近数学学习。因此，教师要结合学生的年龄特点和实际生活，创造出富有数学情趣的情境。创设情境要有生活案例：克与千克的生活情境正如著名数学家华罗庚所说：“宇宙之大，粒子之微，火箭之速，化工之巧，地球之变，日月之繁，无处不用数学。”数学与现实生活有着密切的联系。创设情境要有问题案例：喝出
丁俊贵之《“女人和男人”那些事》兴时态_198812
【“女人和男人”那些事】生活中，我们经常用性别来给很多现象和问题贴标签。比如：女性发脾气是常见的事情，所以不要跟她们讲道理，要让着她们；女性考虑问题总是比较感性，不如男性那么理性、严谨、全面；女生的数学成绩普遍比较差，因此选文科的女生更多；……许许多多像这样的认知，已经成为我们根深蒂固的信念。我们在生活中哪怕不会直接这样讲，但多多少少都会有类似的想法和感受，并且用这些信念去理解和认知他人。一、人世
MATLAB语言基础教程、小项目1：简单的计算器、小项目2：有页面的计算器、使用App Designer创建GUI计算器 azuredragonz 学习教程 matlab 开发语言
MATLABMATLAB语言基础教程1.MATLAB简介2.基本语法变量与赋值向量与矩阵矩阵运算数学函数控制流3.函数4.绘图案例：简单方程求解小项目1：简单的科学计算器功能代码项目说明小项目2：有页面的计算器使用AppDesigner创建GUI计算器主要步骤：完整代码（使用MATLAB编写）说明：如何运行：小项目总结MATLAB语言基础教程1.MATLAB简介MATLAB（矩阵实验室）是一种用于
搞笑的数学老师鹿悦
今天,陈老师来到了我们班,我们都一脸闷闷不乐的写着家庭作业。陈老师一提到回答问题,我们的脸都快要掉到抽屉里了。"小牛，你来回答一下这道题。"突然，我们班都安静的鸦雀无声，紧接着一阵哄堂大笑的声音在班里回荡着。我们都说陈老师很有意思：史卓听就叫小史，曲子昱就叫小曲，朱宇豪就叫小朱，于恩智就叫小于。至于我呀，陈老师经常叫我小佑或者小张2号。（因为班里有许多姓张的同学）。我们都非常喜欢这个风趣幽默的陈老
希希~嗯嗯~ 猪猪女孩小哒哒
电话铺垫无聊天当天来上课的情况：外婆陪三岁的希希，妈妈陪小的大的上课规则感建立的还算不错，二的满场跑完全坐不住妈妈想找外教早教机构，因为大的在托班，里面会有数学、外教等分支教学课程。老二妈妈没怎么带教二宝。妈妈想给她找语言妈妈问有没有英文我的回答是英文课会有中教，应该回答中外教一起妈妈夸赞宝宝10个月会走了，今天见到的情形是宝宝走几步路就会跌倒，没有联系过爬，就开始走，长大以后模仿别人动作上面做的
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
5/3亲子践行豆果妈
90天打卡累计天数：53/90#宣言（做好当知当觉的父母，处理情绪是第一步）#孩子第一个30天目标：每晚21:45前睡觉家长第一个30天目标：每晚23:00前睡觉加油小宝（黄唯嘉+10岁）践行打卡53/901.早睡早起：22：30-8：302.先吃青蛙：13.️今日闪光点：（1）早晨和爸爸一起去晨跑（2）上午带弟弟，陪弟弟玩了一个上午（3）下午完成了部分作业，还剩数学卷和采访小报#父母教练检视#孩
科普阅读两不误，这才是儿童科普阅读的正确打开方式麦麦安
"孩子数学不好，根源在于语文没学好"，这一观点已经被越来越多的老师和家长接受。虽然阅读理解力看上去只和语文有关，事实上，它是所有学科的根基。比如一道数学应用题，只有正确地看懂了各种条件，才能把答案快速地解出来。在美国的小学教育体系中，很重要的一项任务是帮助儿童进行大量阅读，从而培养出理解及思考的能力。这种说法虽然正确，但很多孩子也会存在这样一个问题：绘本故事类的阅读量不小，看小说听故事几乎可以独立
洛谷P1719 最大加权矩形 0hang 算法 c++开发语言
洛谷P1719最大加权矩形题目描述为了更好的备战NOIP2013，电脑组的几个女孩子LYQ,ZSC,ZHQ认为，我们不光需要机房，我们还需要运动，于是就决定找校长申请一块电脑组的课余运动场地，听说她们都是电脑组的高手，校长没有马上答应他们，而是先给她们出了一道数学题，并且告诉她们：你们能获得的运动场地的面积就是你们能找到的这个最大的数字。校长先给他们一个n\timesnn×n矩阵。要求矩阵中最大加
Tor Browser配置方法淡水猫. 网络安全服务器
密码学中有两种常见的加密方式：对称加密：加密和解密使用同一个秘钥，如AES、DES等算法。非对称加密：加密和解密使用不相同的密钥，这两个秘钥分别称为公钥（publickey）和私钥（privatekey）——也就是说私钥可以解开公钥加密的数据，反之亦然（很神奇的数学原理）。Tor是一个三重代理（也就是说Tor每发出一个请求会先经过Tor网络的3个节点），其网络中有两种主要服务器角色：中继服务器：负
晚托第34天唐锐_32c4
2019-04-06本来担心优的抄写的作业不能及时完成，今天一来看到她写的作业后我放心多了。英语抄写的是满满的6面，说明你在老家期间没有耽误学习，自觉性有了提高。以后在学校期间不能吃外面小摊子的东西，防止有害细菌进入体内。杨今天表现的一般，数学计算能手只刷了3面，就开始骄傲，当我告诉你别人已经刷上几十面时你目瞪口呆。所以，以后一定要谦虚谨慎，人外有人，天外有天，始终有强悍的孩子远远超过你，你要做的
第一次参加女儿的家长会章章2021
说来惭愧，从幼儿园到现在，第一次去参加女儿的家长会。老师们说了一下每个孩子在学校的表现。女儿被两位老师表扬语文老师:作业完成很好，错了及时订正，上课积极发言。数学老师:非常爱思考，责任感很强，爱卫生。回来把老师的表扬一五一十的传达给女儿，甚至有些地方还添油加醋了，哈哈。女儿上小学以来，基本没有操过什么心，作业，阅读，基本都能独立完成。平时聊天会强调班集体，也会多说老师的好话。女儿酷爱漫画书和绘本，
架构师备考的一些思考（四） kiba518
前言对于数学，我们之前学的是对的，但不是真的，所以我们没有数学思维。对于计算机，我们学校教的是对的，但不是真的，所以仅仅从学校学习知识的应届毕业生，不论985,211，本科，专科都一样，都是一张白纸，啥也不会。案例分析案例分析是5选3，第一题必答。问题一的类型架构风格对比问题二的类型质量属性填写问题三的类型ER图分析问题类型四场景分析，此类型题比较多。案例分析主要是结合我们之前介绍的内容和自身的经
中考数学想考满分？必须刷完这60道经典压轴题！（高清打印版）孔文教育QD
孔文教育启东校区距离中考还有30多天的时间，如果平常数学可以考100分左右的同学，就可以重视一下压轴题的提升，老师整理了60道压轴题，包括了考点解析等内容，可以做起来哦！孩子升入初中之后，学习压力逐渐增加，孩子的学习能力以及适应环境的能力决定孩子能够分到哪个层次。中考决定孩子进入普通高中还是职业高中，这是个很现实的问题，经数据研究，中考的普职分流比为1:1，换言之，假设有100个考生，其中就有50
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

【学习笔记】组间差异比较及相关问题总结

前言

目录

Q1：做组间差异比较的步骤是什么？方法都有哪些？

Q2：有些资料上提到，当两组服从正态分布的数据进行比较时，小样本（<30）使用t检验，大样本（>30）使用z检验，为什么SPSS等一些软件中只有t检验？

Q3：为什么 Wilcoxon rank-sum test 又称为 Mann Whitney U test？它们有什么不同？

Q4：为什么方差分析的结果有差异后，还需要进行“事后多重比较”？

Q5：是否有可能发生“在方差分析时没有差异，而事后两两比较时出现差异”，或者“在方差分析时有差异，而事后两两比较时却没有差异”这两种情况？

Q6：为什么事后多重比较不可以直接用t检验进行两两比较，而要用这些专门的事后多重比较方法？

Q7：什么是“多重比较矫正”？

重新回答Q6：为什么事后多重比较不可以直接用t检验进行两两比较，而要用这些专门的事后多重比较方法？

Q8：所以只要是事后多重比较中有多次的两两比较，都必须要做“多重比较矫正”？

Q9：如果进行多次方差分析（也就是进行多次“三三比较”、“NN比较”），也需要进行“多重比较矫正”吗？具体应该怎么做？

Q10：方差分析中的事后多重比较方法大多都会进行“多重比较矫正”，这和文献中常见的“FDR矫正”之间有什么区别？多重比较矫正方法都有哪些？

Q11：如果要对一些分类变量（如“性别”、“有无吸烟”等）进行差异性检验，该选什么方法？

综合参考资料

你可能感兴趣的:(数学,概率论)

【学习笔记】组间差异比较及相关问题总结

前 言

目 录

Q1：做组间差异比较的步骤是什么？方法都有哪些？

Q2：有些资料上提到，当两组服从正态分布的数据进行比较时，小样本（<30）使用t检验，大样本（>30）使用z检验，为什么SPSS等一些软件中只有t检验？

Q3：为什么 Wilcoxon rank-sum test 又称为 Mann Whitney U test？它们有什么不同？

Q4：为什么方差分析的结果有差异后，还需要进行“事后多重比较”？

Q5：是否有可能发生“在方差分析时没有差异，而事后两两比较时出现差异”，或者“在方差分析时有差异，而事后两两比较时却没有差异”这两种情况？

Q6：为什么事后多重比较不可以直接用t检验进行两两比较，而要用这些专门的事后多重比较方法？

Q7：什么是“多重比较矫正”？

重新回答Q6：为什么事后多重比较不可以直接用t检验进行两两比较，而要用这些专门的事后多重比较方法？

Q8：所以只要是事后多重比较中有多次的两两比较，都必须要做“多重比较矫正”？

Q9：如果进行多次方差分析（也就是进行多次“三三比较”、“NN比较”），也需要进行“多重比较矫正”吗？具体应该怎么做？

Q10：方差分析中的事后多重比较方法大多都会进行“多重比较矫正”，这和文献中常见的“FDR矫正”之间有什么区别？多重比较矫正方法都有哪些？

Q11：如果要对一些分类变量（如“性别”、“有无吸烟”等）进行差异性检验，该选什么方法？

综合参考资料

你可能感兴趣的:(数学,概率论)

前言

目录