hx2024

连续性变量的组间差异分析

正态分布

正态分布检测

1：图像法

2:计算法

Shapiro–Wilk W检验（小样本推荐）

Lilliefors正态性检验

Anderson–Darling 或AD检验

D'Agostino检验（大样本推荐）

独立样本t检验

1，方差齐性检验

2，t检验

3，单侧t检验

非独立样本t检验

1，配对数据

2，配对t检验

单因素方差分析

1，单因素方差数据

2，方差齐性

3，单因素方差分析

4，可以进一步两两比较

TukeyHSD函数

Bonferroni法

非正态分布

Wilcoxon秩和检验（独立t）

Wilcoxon符号检验（配对t）

Kruskal-Wallis检验(单因素方差)

PMCMRplus包（非参数两两比较）

t检验（连续变量）和卡方检验（分类变量）-CSDN博客

正态分布

正态分布检测

1：图像法

##连续变量的统计分析##
rm(list = ls())
library(ggpubr)
data <- iris##鸢尾花数据集

#查看数据分布类型
##1.1：图像法密度图
ggdensity(data$Sepal.Length, 
          main = "Density plot",
          xlab = "Sepal.Length")

##1.2：图像法QQ图
ggqqplot(data$Sepal.Length)
#定样本与正态分布之间的相关性,并给出了45度参考线，即y=x。
#当所有点都大致落在该参考线时，我们可以假定数据为正态。

##1.3：图像法 直方图
hist(data$Sepal.Length,main = "",xlab = "", breaks = 10, 
     col = "lightblue", border = "pink")

2:计算法

计算法：S.S.Shapiro&M.B.Wilk 提出的W检验法(Shapiro-Wilk检验)和 Ralaph.B.D.Agostino 提出的D检验法(D'Agostino检验)。此外，x²检验适用于任意频数分布的拟合优度检验，并非检验正态性的专用方法，效率不够高。

W检验和D检验是我国制定的正态性检验的国家标准GB4882-85推荐的正态性检验的专用方法，都需要通过专用的计算表来确定临界值；其中W检验在3≤n≤50时使用，D检验在50。

常见检验方法介绍：

①Kolmogorov-Smirnov检验：用样本数据与期望的理论分布进行对比，如果差异不大，则可以认为数据服从正态分布。假设总体的参数是已知的，但这在实际应用中是很难做到的。

②Lilliefors正态性检验（第一个改良）：用样本均值和标准差代替总体均值和标准差。

③Anderson–Darling 或AD检验：把所有的差平方后求和，有点像计算方差。

④Shapiro–Wilk W检验：用的是经验累积概率与目标理论累积概率之差的最大值，有点像计算极差

（W检验适合于样本量在3～50之间的样本数据。有其他统计学家把其适用范围扩展到5000，因此可以说W检验几乎适用于所有的正态检验。）

R-概率统计 | 正态分布检验 - 知乎 (zhihu.com)、

R语言统计分析 01 正态性检验及方差齐性检验 - 知乎 (zhihu.com)

Shapiro–Wilk W检验（小样本推荐）

#2:Shapiro-Wilk方法 shapiro.test(data$Sepal.Length) Shapiro-Wilk normality test data: data$Sepal.Length W = 0.97609, p-value = 0.01018 本数据含有150个样本，超过30，且从前视觉判断，数据不存在明显的分布不均匀。视情况考虑。

假设检验H0，总体符合正态分布

W值：W越小，越接近0，表示样本数据越接近正态分布

p值：p小于显著性水平α(0.05)，表示样本数据不符合正态分布（注意使用范围）

Lilliefors正态性检验

## Lilliefor检验 library(nortest) lillie.test(data$Sepal.Length) Lilliefors (Kolmogorov-Smirnov) normality test data: data$Sepal.Length D = 0.088654, p-value = 0.005788

原假设 H0：样本服从正态分布；备择假设 H1：样本不服从正态分布。

P值>指定水平0.05,接受原假设，可以认为样本数据服从正态分布

P值<指定水平0.05,拒绝原假设，认为样本数据在5%的显著性水平下不服从正态分布

Anderson–Darling 或AD检验

#Performs the Anderson-Darling test #for the composite hypothesis of normality ad.test(data$Sepal.Length) Anderson-Darling normality test data: data$Sepal.Length A = 0.8892, p-value = 0.02251

零假设H0：数据服从正态分布

备择假设H1：数据不服从正态分布

P＜0.05，要拒绝原假设，说明数据是不服从正态分布。

D'Agostino检验（大样本推荐）

#D'Agostino skewness test library(moments) agostino.test(data$Sepal.Length, alternative = "two.sided") D'Agostino skewness test data: data$Sepal.Length skew = 0.31175, z = 1.59630, p-value = 0.1104 alternative hypothesis: data have a skewness 原假设为符合正态分布，认为是正态分布

CSDN博主「Pterosaur_Zero」

（1）由于每个正态性检验方法的检验角度不同，因此同一批数据用不同的检验方法可能得到的结果会不尽相同，所以在实际操作中可以根据样本量大小选择多种检验方法进行正态性检验，同时通过QQ图等图示法辅助判断；

（2）正态性检验只是检验样本数据来自正态分布总体的可能性有多大，或者说只是检验样本数据的总体是否近似正态分布，因此样本的总体并不是一定服从标准正态分布，但已有大量实验表明，即使总体仅为近似的正态分布，也能很好地进行 t -test、方差分析等参数检验。

（3）有些样本的总体可能仅为近似的正态分布，但没有一种直接的方法可以决定“偏离正态性的严重程度”是否足以改变“进行参数检验”的选择。正态性检验的意义本身并不全是为了决定什么时候使用非参数检验，还包括在确定一个样本的总体如果近似服从正态分布后，可以使用更加简单的方法来制定参考值范围、对数据进行质量控制等等。决定使用参数检验还是非参数检验是一个非常复杂且困难的问题，在实际研究中，不应该仅基于正态性检验的结果来自动断定是否使用非参数检验，还需要根据实际问题更深入地考虑其他影响因素（具体问题具体分析）。

（4）正态性检验在大多数情况下并不是十分有用。因为在样本量很少的情况下，正态检验对于检测“非正态分布”的作用不是很大；而当样本量足够大的时候，数据是否需要严格通过正态性检验、是否需要严格服从正态分布就显得不那么重要了，因为t 检验和方差分析等对于近似正态分布数据的检测结果是非常稳定的（根据大数定律和中心极限定理，当样本量足够大时，所有分布都近似于正态分布）。因此正态性检验只是一个测试方法，用于告诉我们自己的数据偏离理想正态分布的情况是否严重到足以使以正态分布为前提条件的统计方法失效，正态性检验的结果只是一个参考。
原文链接：https://blog.csdn.net/qq_33924470/article/details/114668701

独立样本t检验

如果两个样本是从两个总体中独立抽取的，即一个样本中的元素与另一个样本中的元素相互独立，则称为独立样本(Independent Samples)。

假设变量的分布呈正态分布，针对两组的独立样本，t检验可以用于两个总体均值之间的比较。通常我们需要先用函数vartest()检查两组间是否具有方差齐性，即方差是否相等。比较吸烟组和不吸烟组产妇的新生儿体重。

1，方差齐性检验

##连续变量的统计分析## rm(list = ls()) library(MASS) data <- birthwt var.test(bwt~smoke,data =birthwt) F test to compare two variances data: bwt by smoke F = 1.3019, num df = 114, denom df = 73, p-value = 0.2254 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.8486407 1.9589574 sample estimates: ratio of variances 1.301927

F = 1.3019, num df = 114, denom df = 73, p-value = 0.2254

结果表明，吸烟组和不吸烟组两组数据方差的差异没有统计学意义(p=0.2254),即组间具有方差齐性。接下来用函数t.test()进行t检验。

2，t检验

#var.equal = FALSE(默认) t.test(bwt ~smoke, var.equal =TRUE,#这里需要选择T，前面检验相等 data =birthwt) ##拆开写 group1 <-birthwt$bwt[birthwt$smoke =="0"] group2 <-birthwt$bwt[birthwt$smoke =="1"] t.test(group1,group2,var.equal =TRUE)#一样的

Two Sample t-test data: bwt by smoke t = 2.6529, df = 187, p-value = 0.008667 alternative hypothesis: true difference in means between group 0 and group 1 is not equal to 0 95 percent confidence interval: 72.75612 494.79735 sample estimates: mean in group 0 mean in group 1 3055.696 2771.919

3，单侧t检验

t.test(bwt ~smoke, var.equal =TRUE,#这里需要选择T，前面检验相等 alt = "greater",#设置为单侧检验（不吸烟比吸烟） conf.level = 0.95,#CI区间可以修改 data =birthwt)

Two Sample t-test data: bwt by smoke t = 2.6529, df = 187, p-value = 0.004333 alternative hypothesis: true difference in means between group 0 and group 1 is greater than 0 95 percent confidence interval: 106.9528 Inf sample estimates: mean in group 0 mean in group 1 3055.696 2771.919

非独立样本t检验

组间不是独立的：(1)同体配对，即同一受试对象分别接受两种不同处理；(2)异体配对，即两同质受试对象配成对子后分别接受两种不同的处理。在比较两组的差异时，由于组间不是独立的，需要用配对的t检验。此时，在函数t.test()里，我们需要将参数paired设为TRUE。

1，配对数据

下面建立两组数据，分别代表用脂肪酸水解法和罗紫-戈特里法对10份乳酸饮料中脂肪含量测定的结果，现欲比较两种测定结果是否存在差异。（一个样本两种方法）

x<-c(0.84,0.59,0.67,0.63,0.69,0.98,0.75,0.73,1.20,0.87) y<-c(0.58,0.51,0.50,0.32,0.34,0.52,0.45,0.51,1.00,0.51) data <- data.frame(x,y) data$ID <- paste0("A",1:nrow(data)) t.test(x,y,paired =TRUE)

2，配对t检验

t.test(x,y,paired =TRUE) paired a logical indicating whether you want a paired t-test.

Paired t-test data: x and y t = 7.871, df = 9, p-value = 2.52e-05 X Y两种方法检测存在差异 alternative hypothesis: true mean difference is not equal to 0 95 percent confidence interval: 0.1931133 0.3488867 sample estimates: mean difference 0.271

单因素方差分析

多个组之间差异分析（分类>2），如果数据是从正态总体中独立抽样而得的，且满足方差齐性，我们可以用方差分析(Analysis of Variance,ANOVA)。在分类变量只有一个时，这种方差分析被称为单因素方差分析(one-way ANOVA)。

1，单因素方差数据

##数据查看：有3亚型 table(birthwt$race) 1 2 3 96 26 67 #进行正态性检验 tapply(birthwt$bwt,birthwt$race,shapiro.test)

data: X[[i]] W = 0.98727, p-value = 0.4861

data: X[[i]] W = 0.97696, p-value = 0.8038

data: X[[i]] W = 0.97537, p-value = 0.2046

2，方差齐性

bartlett.test()函数

bartlett.test(bwt ~race,data =birthwt) Bartlett test of homogeneity of variances data: bwt by race Bartlett's K-squared = 0.65952, df = 2, p-value = 0.7191

Bartlett检验对数据的正态性非常敏感。p-value = 0.7191 各组方差齐

3，单因素方差分析

race.aov <-aov(bwt ~race,data =birthwt) summary(race.aov) Df Sum Sq Mean Sq F value Pr(>F) race 1 3790184 3790184 7.369 0.00726 ** Residuals 187 96179472 514329 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

4，可以进一步两两比较

TukeyHSD函数

需要将亚型转变为因子才能进行分析

#转换为因子 birthwt$race <- as.factor(birthwt$race) race.aov <-aov(bwt ~race,data =birthwt) summary(race.aov) TukeyHSD(race.aov) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = bwt ~ race, data = birthwt) $race diff lwr upr p adj 2-1 -383.02644 -756.2363 -9.816581 0.0428037 3-1 -297.43517 -566.1652 -28.705095 0.0260124 3-2 85.59127 -304.4521 475.634630 0.8624372

Bonferroni法

其他进行两两比较的方法：Bonferroni法、Holm法等，这些方法的核心问题都是如何控制总的犯第一类错误的概率。

pairwise.t.test(birthwt$bwt,birthwt$race, p.adjust.method ="bonferroni") Pairwise comparisons using t tests with pooled SD data: birthwt$bwt and birthwt$race 1 2 2 0.049 - 3 0.029 1.000 P value adjustment method: bonferroni #从四格表中找对应的P值

多因素方差学习：R语言方差分析总结_r语言方差分析结果解读-CSDN博客

非正态分布

Wilcoxon秩和检验（独立t）

如果数据无法满足t检验(不符合正态分布)或者方差分析（方差不齐）的假设，例如变量呈明显的偏态分布，或者组间不具有方差齐性，我们可以采用非参数方法。对于两组独立样本，可以使用Wilcoxon秩和检验来评估观测值是否是从相同的分布中抽得的。

这里使用wilcox.test()测试前面数据

rm(list = ls()) library(MASS) data <- birthwt wilcox.test(bwt~smoke,data =birthwt) Wilcoxon rank sum test with continuity correction data: bwt by smoke W = 5249.5, p-value = 0.006768 alternative hypothesis: true location shift is not equal to 0

与上面t检验的结果相同，再次拒绝了吸烟组和非吸烟组新生儿体重相同的假设(p< 0.01)。

Wilcoxon符号检验（配对t）

Wilcoxon符号秩检验可以看作非独立样本t检验的一种非参数替代方法。

rm(list = ls()) x<-c(0.84,0.59,0.67,0.63,0.69,0.98,0.75,0.73,1.20,0.87) y<-c(0.58,0.51,0.50,0.32,0.34,0.52,0.45,0.51,1.00,0.51) data <- data.frame(x,y) data$ID <- paste0("A",1:nrow(data)) wilcox.test(x,y,paired = T)

Kruskal-Wallis检验(单因素方差)

对于多于两组间比较的情况，如果无法满足方差分析的假设条件，也需要借助非参数方法。如果各组之间相互独立，可以使用Kruskal-Wallis检验；如果各组之间不独立(如重复测量设计),则应该使用Friedman M检验。在R里，进行这两种检验的函数分别为kruskal.test()和friedman.test(),其使用方法类似。以Kruskal-Wallis检验为例：

kruskal.test(bwt ~race,data =birthwt) Kruskal-Wallis rank sum test data: bwt by race Kruskal-Wallis chi-squared = 8.5199, df = 2, p-value = 0.01412

这个p值比用t检验得到的p值更大，这也验证了对于同样的数据，非参数检验的结论相比参数检验更为保守。

PMCMRplus包（非参数两两比较）

PMCMRplus包进行非参数方法的组间两两比较。

library(PMCMRplus) comp <-bwsAllPairsTest(bwt ~race,data =birthwt) summary(comp)

Pairwise comparisons using BWS All-Pairs Test data: bwt by race alternative hypothesis: two.sided P value adjustment method: holm H0 B value Pr(>|B|) 2 - 1 == 0 3.980 0.026755 * 3 - 1 == 0 3.517 0.030137 * 3 - 2 == 0 0.729 0.535124 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

参考：

1：医学统计学/孙振球，徐勇勇主编.—4版.—北京：人民卫生出版社，2014

2：R语言医学数据分析实战/赵军编著.--北京：人民邮电出版社，2020.8

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
今日分享：有的孩子家长常常在对于小朋友老是说谎，还特别爱推卸责任，很头痛，不知道该怎么办！雨燕Cassie
其实六岁以前都不叫撒谎，只能叫做逃避和害怕，因为他们都是没有撒谎的这个概念，家长所谓的撒谎只能说是因为做错了事情，怕受到责罚而找一个「台阶」给自己一下而已，所以家长不能给孩子一个贴上撒谎的这个标签，如果说孩子出现家长所说的撒谎，我们应该做的是：1.允许孩子将事情的原委进行一个表达，给孩子说明的机会，不提示孩子说谎，不急著批评孩子。2.不使用问句，不恐吓和严刑逼供，耐心的以故事或者以分析的形式和孩子
06选课支付模块之基于消息队列发送支付通知消息 echo 云清学成在线 java rabbitmq 消息队列支付通知学成在线
消息队列发送支付通知消息需求分析订单服务作为通用服务，在订单支付成功后需要将支付结果异步通知给其他对接的微服务，微服务收到支付结果根据订单的类型去更新自己的业务数据技术方案使用消息队列进行异步通知需要保证消息的可靠性即生产端将消息成功通知到服务端：消息发送到交换机-->由交换机发送到队列-->消费者监听队列，收到消息进行处理，参考文章02-使用Docker安装RabbitMQ-CSDN博客生产者确
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

连续性变量的组间差异分析

正态分布

正态分布检测

1：图像法

2:计算法

Shapiro–Wilk W检验（小样本推荐）

Lilliefors正态性检验

​​​​​​​Anderson–Darling 或AD检验

D'Agostino检验（大样本推荐）

独立样本t检验

1，方差齐性检验

2，t检验

3，单侧t检验

非独立样本t检验

1，配对数据

2，配对t检验

单因素方差分析

1，单因素方差数据

2，方差齐性

3，单因素方差分析

4，可以进一步两两比较

TukeyHSD函数

Bonferroni法

非正态分布

Wilcoxon秩和检验（独立t）

Wilcoxon符号检验（配对t）

Kruskal-Wallis检验(单因素方差)

PMCMRplus包（非参数两两比较）

你可能感兴趣的:(肿瘤生信分析,r语言)

Anderson–Darling 或AD检验