elsieyin

4. 方差分析

方差分析

1 概要

方差分析(Analysis of variance, ANOVA) 主要研究分类变量作为自变量时，对因变量的影响是否是显著的。

方差分析的方法是由20世纪的统计学家Ronald Aylmer Fisher在1918年到1925年之间提出并陆续完善起来的，该方法刚开始是用于解决田间实验的数据分析问题，因此，方差分析的学习是和实验设计、实验数据的分析密不可分的。

实验设计和方差分析都有自己相应的语言。因此，在这里我们通过一个焦虑症治疗的实例，先了解一些术语，并且思考一下，方差分析主要用于解决什么样的问题。

以焦虑症治疗为例，现有两种治疗方案：认知行为疗法（CBT）和眼动脱敏再加工法（EMDR）。我们招募10位焦虑症患者作为志愿者，随机分配一半的人接受为期五周的CBT，另外一半接受为期五周的EMDR，设计方案如表1-1所示。在治疗结束时，要求每位患者都填写状态特质焦虑问卷（STAI），也就是一份焦虑度测量的自我评测报告。

表1-1 单因素组间方差分析

CBT	EMDR
s1	s6
s2	s7
s3	s8
s4	s9
s5	s10

在这个实验设计中，治疗方案是两水平（CBT、EMDR）的组间因子。之所以称其为组间因子，是因为每位患者都仅被分配到一个组别中，没有患者同时接受CBT和EMDR。表中字母s代表受试者（患者）。STAI是因变量，治疗方案是自变量。由于在每种治疗方案下观测数相等，因此这种设计也称为均衡设计（balanced design）；若观测数不同，则称作非均衡设计（unbalanced design）。

因为仅有一个类别型变量，表1的统计设计又称为单因素方差分析（one-way ANOVA），或进一步称为单因素组间方差分析。方差分析主要通过F检验来进行效果评测，若治疗方案的F检验显著，则说明五周后两种疗法的STAI得分均值不同。

假设你只对CBT的效果感兴趣，则需将10个患者都放在CBT组中，然后在治疗五周和六个月后分别评价疗效，设计方案如表1-2所示。

表1-2 单因素组内方差分析

	时间
患者	5周	6个月
s1
s2
s3
s4
s5
s6
s7
s8
s9
s10

此时，时间（time）是两水平（五周、六个月）的组内因子。因为每位患者在所有水平下都进行了测量，所以这种统计设计称单因素组内方差分析；又由于每个受试者都不止一次被测量，也称作重复测量方差分析。当时间的F检验显著时，说明患者的STAI得分均值在五周和六个月间发生了改变。

现假设你对治疗方案差异和它随时间的改变都感兴趣，则将两个设计结合起来即可：随机分配五位患者到CBT，另外五位到EMDR，在五周和六个月后分别评价他们的STAI结果（见表1-3）。

表1-3 含组间和组内因子的双因素方差分析

		时间
疗法	患者	5周	6个月
CBT	s1
	s2
	s3
	s4
	s5
EMDR	s6
	s7
	s8
	s9
	s10

疗法（therapy）和时间（time）都作为因子时，我们既可分析疗法的影响（时间跨度上的平均）和时间的影响（疗法类型跨度上的平均），又可分析疗法和时间的交互影响。前两个称作主效应，交互部分称作交互效应。

当设计包含两个甚至更多的因子时，便是因素方差分析设计，比如两因子时称作双因素方差分析，三因子时称作三因素方差分析，以此类推。若因子设计包括组内和组间因子，又称作混合模型方差分析，当前的例子就是典型的双因素混合模型方差分析。

本例中，你将做三次F检验：疗法因素一次，时间因素一次，两者交互因素一次。若疗法结果显著，说明CBT和EMDR对焦虑症的治疗效果不同；若时间结果显著，说明焦虑度从五周到六个月发生了变化；若两者交互效应显著，说明两种疗法随着时间变化对焦虑症治疗影响不同（也就是说，焦虑度从五周到六个月的改变程度在两种疗法间是不同的）。

现在，我们对上面的实验设计稍微做些扩展。众所周知，抑郁症对病症治疗有影响，而且抑郁症和焦虑症常常同时出现。即使受试者被随机分配到不同的治疗方案中，在研究开始时，两组疗法中的患者抑郁水平就可能不同，任何治疗后的差异都有可能是最初的抑郁水平不同导致的，而不是由于实验的操作问题。抑郁症也可以解释因变量的组间差异，因此它常称为混淆因素（confounding factor）。由于你对抑郁症不感兴趣，它也被称作干扰变数（nuisance variable）。

假设招募患者时使用抑郁症的自我评测报告，比如白氏抑郁症量表（BDI），记录了他们的抑郁水平，那么你可以在评测疗法类型的影响前，对任何抑郁水平的组间差异进行统计性调整。本案例中，BDI为协变量，该设计为协方差分析（ANCOVA）。

以上设计只记录了单个因变量情况（STAI），为增强研究的有效性，可以对焦虑症进行其他的测量（比如家庭评分、医师评分，以及焦虑症对日常行为的影响评价）。当因变量不止一个时，设计被称作多元方差分析（MANOVA），若协变量也存在，那么就叫多元协方差分析（MANCOVA）。

下面我们主要介绍单因素方差分析与双因素方差分析的原理与实现。

2 单因素方差分析

2.1 推导过程

接下来我们使用种小麦的例子，去帮助理解方差分析里涉及的一些变量。

假设我们现在有若干品种的小麦，要在某一地区播种，我们想知道这些品种的产量有没有显著区别，为此我们先设计了一个田间实验，取一大块地将其分成形状大小都相同的 $n$ 小块．设供选择的品种有 $k$ 个，我们打算其中的 $n_1$ 小块种植品种1, $n_2$ 小块种植品种2，等等， $n_1 + n_2 + ... n_k = n$ .

接下来，我们使用方差分析的方法去看不同小麦品种的产量是否有显著差异。

设问题中涉及一个因素 $A$ ，有 $k$ 个水平，如上例的 $k$ 个种子品种，以 $Y_{ij}$ 记第 $i$ 个水平的第 $j$ 个观察值，如上例 $Y_{ij}$ 是种植品种 $i$ 的第 $j$ 小块地上的亩产量。模型为
$Y_{ij} = a_i + e_{ij}, j = 1,...,n_i, i = 1,...,k\qquad(2.1)$
$a_i$ 表示水平 $i$ 的理论平均值，称为水平 $i$ 的效应。在小麦例子中， $a_i$ 就是品种 $i$ 的平均亩产量， $e_{ij}$ 就是随机误差。并且我们假定：
$E(e_{ij})=0, 0E(eij)=0,0<Var(eij)=σ2<∞,一切eij独立同分布(2.2)$

接下来，把 $S S$ 分为两部分，一部分表示随机误差的影响，记为 $SS_e$ ；另一部分表示因素 $A$ 的各水平理论平均值 $a_i$ 不同带来的影响，记为 $SS_A$ 。

关于 $SS_e$ ，先固定一个 $i$ ，此时对应的所有观测值 $Y_{i1},Y_{i2},\cdots,Y_{in}$ ，他们之间的差异与每个水平的理论平均值不等无关，而是取决于随机误差，反映这些观察值差异程度的量是 $\sum_{j=1}^{n_i}\left ( Y_{ij}-\bar{Y_i} \right )^2$ ，其中
$\bar{Y_i}=(Y_{i1}+Y_{i2}+\cdots+Y_{in})/n_i,\quad i=1, 2,\cdots,n \qquad (2.5)$
$\bar{Y_i}$ 可以视为对 $a_i$ 的估计。把上述平方和做累加得：
$SS_e=\sum_{i=1}^{k}\sum_{j=1}^{n_i}\left ( Y_{ij}-\bar{Y_i} \right )^2 \qquad (2.6)$
可求得 $SS_A$ :

因为 $\bar{Y_i}$ 可以视为对 $a_i$ 的估计， $a_i$ 的差异越大， $\bar{Y_i}$ 之间的差异也越大，所以 $SS_A$ 可以用来衡量不同水平之间的差异程度。

在统计学上，通常称 $S S$ 为总平方和， $SS_A$ 为因素 $A$ 的平方和， $SS_e$ 为误差平方和，分解式 $SS=SS_A+SS_e$ 为该模型的方差分析。

基于上面的分析，我们可以得到假设（5.3）的一个检验方法：当比值 $SS_A/SS_e$ 大于某一给定界限时，否定 $H_0$ ，不然就接受 $H_0$ 。为了构造 $F$ 分布的检验统计量，我们假定随机误差 $e_{ij}$ 满足正态分布 $\sigma^2)$ ，同时我们也假定观察值 $Y_{ij}$ 符合正态分布，此时，记
$MS_A = SS_A/(k-1), \quad MS_e = SS_e/(n-k) \qquad (2.8)$
当 $H_0$ 成立时，有：
$MS_A / MS_e \sim F_{k-1, n-k} \qquad (2.9)$
据（5.9），在给定显著性水平 $\alpha$ 时，即得（5.3）的假设 $H_0$ 的检验如下：
$当MS_A / MS_e \leqslant F_{k-1, n-k}(\alpha)时，接受H_0，不然就拒绝H_0 \qquad (2.10)$
$MS_A$ 和 $MS_e$ 分别被称为因素 $A$ 和随机误差的平均平方和。被除数 $k - 1$ 和 $n - k$ ，分别称为这两个平方和的自由度。 $MS_e$ 的自由度为什么是 $n - k$ 呢？因为平方和 $\sum_{j=1}^{n_i}\left ( Y_{ij}-\bar{Y_i} \right )^2$ 的自由度为 $n_i-1$ ，故对 $i$ 求和， $SS_e$ 的自由度就是 $n - k$ 。那么， $MS_A$ 的自由度为什么是 $k - 1$ 呢？因为一共有 $k$ 个平均值 $a_1,\cdots,a_k$ 等 $k - 1$ 个，故自由度为 $k - 1$ ，两者自由度之和为 $n - 1$ ，恰好是总平方和的自由度。

到这里，我们可以做出方差分析表如表2-1

2-1 单因素方差分析的方差分析表

项目	$S S$	自由度	$M S$	$F$ 比	显著性
$A$	$SS_A$	$k - 1$	$MS_A$	$MS_A / MS_e$	, *, 或无
误差	$SS_e$	$n - k$	$MS_e$
总和	$S S$	$n - 1$

在上表中，对于显著性一栏，一般来说，我们把算出的 $F$ 比，即 $MS_A / MS_e$ ，与 $F_{k-1, n-k}(0.05)=c_1$ 和 $F_{k-1, n-k}(0.01)=c_2$ 比较。若 $MS_A / MS_e>c_2$ ，用**表示，表明A因素的效应是高度显著的，即在 $\alpha=0.01$ 的显著性水平下，拒绝原假设（5.3）。同理， $c_2c2<MSA/MSe<c1$

2.2 代码实例

单因素方差分析的R语言实现

单因素方差分析中，你感兴趣的是比较分类因子定义的两个或多个组别中的因变量均值。以multcomp包中的cholesterol数据集为例，50个患者均接受降低胆固醇药物治疗（trt）五种疗法中的一种疗法。其中三种治疗条件使用药物相同，分别是20mg一天一次（1time）、10mg一天两次（2times）和5mg一天四次（4times）。剩下的两种方式（drugD和drugE）代表候选药物。

> library(multcomp)
> attach(cholesterol)
> 
> # 统计各组样本大小
> table(trt) 
trt
 1time 2times 4times  drugD  drugE 
    10     10     10     10     10 
> 
> # 各组均值
> aggregate(response, by=list(trt), FUN=mean)
  Group.1        x
1   1time  5.78197
2  2times  9.22497
3  4times 12.37478
4   drugD 15.36117
5   drugE 20.94752
> 
> # 各组标准差
> aggregate(response, by=list(trt), FUN=sd)
  Group.1        x
1   1time 2.878113
2  2times 3.483054
3  4times 2.923119
4   drugD 3.454636
5   drugE 3.345003
> 
> # 进行方差分析
> fit <- aov(response ~ trt)
> summary(fit)
            Df Sum Sq Mean Sq F value   Pr(>F)    
trt          4 1351.4   337.8   32.43 9.82e-13 ***
Residuals   45  468.8    10.4                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

方差分析的结果中，各项数字的含义可以参照表2-1。

查看各水平对应的组均值的差异

gplots包中的plotmeans()可以用来绘制带有置信区间的组均值图形。如图9-1所示，图形展示了带有95%的置信区间的各疗法均值，可以清楚看到它们之间的差异。

library(gplots)
plotmeans(response ~ trt, xlab="Treatment", ylab="Response",
          main="Mean Plot\nwith 95% CI")
detach(cholesterol)

2-1 五种降低胆固醇药物疗法的均值，含95%的置信区间

多重比较

虽然ANOVA对各疗法的F检验表明五种药物疗法效果不同，但是并没有告诉你哪种疗法与其他疗法不同。多重比较可以解决这个问题。例如，TukeyHSD()函数提供了对各组均值差异的成对检验。

> TukeyHSD(fit)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = response ~ trt)

$trt
                  diff        lwr       upr     p adj
2times-1time   3.44300 -0.6582817  7.544282 0.1380949
4times-1time   6.59281  2.4915283 10.694092 0.0003542
drugD-1time    9.57920  5.4779183 13.680482 0.0000003
drugE-1time   15.16555 11.0642683 19.266832 0.0000000
4times-2times  3.14981 -0.9514717  7.251092 0.2050382
drugD-2times   6.13620  2.0349183 10.237482 0.0009611
drugE-2times  11.72255  7.6212683 15.823832 0.0000000
drugD-4times   2.98639 -1.1148917  7.087672 0.2512446
drugE-4times   8.57274  4.4714583 12.674022 0.0000037
drugE-drugD    5.58635  1.4850683  9.687632 0.0030633

> par(las=2)
> par(mar=c(5,8,4,2))
> plot(TukeyHSD(fit))

成对比较图形如图2-2所示。图形中置信区间包含0的疗法说明差异不显著（p>0.05）。

图2-2 Tukey HSD均值成对比较图

评估检验的假设条件

根据2.1中我们讲的关于方差分析的推导中，我们知道，方差分析结果的有效性是建立在一系列假设条件之上的，因此，在我们使用方差分析模型时，需要评估进行方差分析的数据，是否符合模型使用的假设条件。

正态性检验

第一，在建立模型时，我们假设因变量是服从正态分布的，需要进行正态性检验。

正态性检验的方法有两种，一是通过QQ图进行检验。

# QQ plot
library(car)
qqPlot(lm(response ~ trt, data=cholesterol),
       simulate=TRUE, main="Q-Q Plot", labels=FALSE)

除此之外，R里面也提供了一些package来进行正态性检验。

K-S test

统计学里, Kolmogorov–Smirnov 检验(亦称：K–S 检验)是用来检验数据是否符合某种分布的一种非参数检验。其原假设 $H_0$ :两个数据分布一致或者数据符合理论分布。在R语言里，我们可以使用ks.test(x, pnorm)进行正态性检验，若结果中的p值大于0.05，则数据符合正态分布。

Anderson–Darling test

Anderson–Darling检验是一种用来检验给定的样本是否来自于某个确定的概率分布的统计检验方法。在R语言中，我们可以从nortest包中的ad.test()进行检验。若结果中的p值大于0.05，则数据符合正态分布。

Shapiro-Wilk test

Shapiro-Wilk检验在小样本情况下，是很普通的正态性检验方法，Shapiro.test()在默认安装的stats包中。原假设 $H_0$ : 数据符合正态分布。

Lilliefor test

Lilliefor test是基于Kolmogorov–Smirnov test的一种正态性检验。原假设 $H_0$ : 数据符合正态分布，lillie.test()也在nortest包中。

方差齐性检验

因为方差分析的实质是检验多个水平的均值是否有显著差异，如果各个水平的观察值方差差异太大，只检验均值之间的差异就没有意义了，所以要进行方差齐性检验。

Bartlett test可以用来检验数据的方差齐性。

> bartlett.test(response ~ trt, data=cholesterol)

	Bartlett test of homogeneity of variances

data:  response by trt
Bartlett's K-squared = 0.57975, df = 4, p-value = 0.9653

Bartlett检验表明五组的方差并没有显著不同（p=0.97）。其他检验如Fligner-Killeen检验
（fligner.test()函数）和Brown-Forsythe检验（HH包中的hov()函数）此处没有做演示，但它们获得的结果与Bartlett检验相同。

不过，方差齐性分析对离群点非常敏感。可利用car包中的outlierTest()函数来检测离群点：

outlierTest(fit)
No Studentized residuals with Bonferroni p < 0.05
Largest |rstudent|:
   rstudent unadjusted p-value Bonferroni p
19 2.251149           0.029422           NA

从输出结果来看，并没有证据说明胆固醇数据中含有离群点（当p>1时将产生NA）。因此根据正态性检验、方差齐性检验和离群点检验，该数据似乎可以用ANOVA模型拟合得很好。这些方法反过来增强了我们对于所得结果的信心。

3 双因素方差分析

3.1 推导过程

在很多种情况下，只考虑一个指标对观察值的影响，显然是不够的，这时就会用到多因素方差分析。双因素方差分析和多因素方差分析在原理上是相似的，这里为了书写简便，我们只以双因素方差分析为例进行推导。

还是以田间实验的例子帮助理解推导过程，我们设有两个因素 $A, B$ ，分别有 $k, l$ 个水平（例如 $A$ 为品种，有 $k$ 个； $B$ 为播种量，考虑 $l$ 种不同的数值，如20斤／亩，25斤／亩，……）． $A$ 的水平 $i$ 与 $B$ 的水平 $j$ 的组合记为 $(i, j)$ ，其试验结果记为 $Y_{ij}, i = 1, · · ·, k,j = 1,…, l$ ．统计模型定为
$Y_{ij} = \mu + a_i + b_j + e_{ij}，i= 1, · · ·, k,j = 1,· · ·, l\qquad (3.1)$
为解释这模型，首先把右边分成两部分： $e_{ij}$ 为随机误差，它包含了未加控制的因素( $A, B$ 以外的因素）及大量随机因素的影响．假定
$E(e_{ij})=0, 0E(eij)=0,0<Var(eij)=σ2<∞,一切eij独立同分布(3.2)$

约束条件 $(3.3)$ 给了 $a_i，b_j$ 的意义一种更清晰的解释： $a_i>0$ 表示A的水平 $i$ 的效应在 $A$ 的全部水平的平均效应之上， $a_i<0$ 则相反。另外，这个约束条件也给了 $\mu，a_i,b_j$ 的一个适当的估计法：把 $Y_{ij}$ 对一切 $i, j$ 相加．注意到 $(3.3)$ ，有
$\sum_{i=1}^{k}\sum_{j=1}^{l}Y_{ij}= kl\mu+\sum_{i=1}^{k}\sum_{j=1}^{l}e_{ij} \qquad (3.4)$
由 $(3.2)$ 得，
$\bar{Y}=\sum_{i=1}^{k}\sum_{j=1}^{l}Y_{ij}/kl \qquad (3.5)$
是 $\mu$ 的一个无偏估计。其次，有
$\sum_{j=1}^{l}Y_{ij}=l\mu+la+\sum_{j=1}^{l}e_{ij} \qquad (3.6)$
于是，记
$\bar{Y_i}=\sum_{j=1}^{l}Y_{ij}/l, \quad \bar{Y_j}=\sum_{i=1}^{k}Y_{ij}/k \qquad (3.7)$
由 $(3.7)$ 知， $\bar{Y_j}$ 为 $\mu+a_i$ 的一个无偏估计。于是得到 $a_i$ 的一个无偏估计为
$\hat{a_i}=\bar{Y_i}-\bar{Y}, i=1,\cdots,k \qquad(3.8)$
同理，
$\hat{b_j}=\bar{Y_j}-\bar{Y}, j=1,\cdots,l \qquad(3.9)$
$\hat{a_i},\hat{b_j}$ 适合约束条件 $(3.3)$ 。

下面进行方差分析，要设法把总平方和
$SS=\sum_{i=1}^{k}\sum_{j=1}^{l}(Y_{ij}-\bar{Y})^2$
分解为三部分： $SS_A,SS_B,SS_e$ ，分别表示因素 $A, B$ 和随机误差的影响。这种分解的主要目的是假设检验：
$H_{0A}:a_1=\cdots=a_k=0 \qquad(3.10)$
和
$H_{0B}:b_1=\cdots=b_k=0 \qquad(3.11)$
$H_0A$ 成立表示因素 $A$ 对指标其实无影响。在实际问题中，绝对无影响的场合少见，但如影响甚小以致被随机误差所掩盖时，这种影响事实上等于没有。因此，拿 $SS_A$ 和 $SS_e$ 的比作为检验统计量正符合这一想法．

接下来讲一下方差分解的小技巧：
$Y_{ij}-\bar{Y}=(\bar{Y_i}-\bar{Y}) + (\bar{Y_j}-\bar{Y})+(Y_{ij}-\bar{Y_i}-\bar{Y_j}+\bar{Y})$
两边平方，对 $i, j$ 求和，结合约束条件(3.3)，注意到
$\sum_{i=1}^{k}(\bar{Y_{i}}-\bar{Y})=0， \sum_{j=1}^{l}(\bar{Y_{j}}-\bar{Y})=0，$

$\sum_{i=1}^{k}(Y_{ij}-\bar{Y_i}-\bar{Y_j}+\bar{Y})=\sum_{j=1}^{l}(Y_{ij}-\bar{Y_i}-\bar{Y_j}+\bar{Y})=0$

即知所有交叉积之和皆为0，而得到

第一个平方和可以作为因素 $A$ 的影响的衡量，从前述 $\bar{Y_{i}}-\bar{Y}$ 作为 $a_i$ 的估计可以理解第二个平方和同理。至于第三个平方和可作为随机误差的影响这一点，直接看不甚明显。可以从两个角度去理解：在 $S S$ 中去掉 $SS_A$ 和 $SS_B$ 后，剩余下的再没有其他系统性因素的影响，故只能作为 $SS_e$ 。另外，由模型 $(3.1)$ 及约束条件 $(3.3)$ ，易知

这里面已经毫无 $\mu,a_i,b_j$ 的影响，而只含随机误差。

得到分解式 $(3.12)$ 后，我们就可以像单囚素情况那样，写出下面的方差分析表：
$SS_A , SS_B$ 自由度分别为其水平数减去1，这一点与单因素情况相同．总和自由度为全部观察值数目 $k l$ 减去1．剩下的就是误差平方和自由度：
$(k l - 1) - (k - 1) - (l - 1) = (k - 1) (l - 1)$
表3.1 双因素方差分析表

项目	$S S$	自由度	$M S$	$F$ 比	显著性
$A$	$SS_A$	$k - 1$	$MS_A$	$MS_A / MS_e$	, *, 或无
$B$	$SS_B$	$l - 1$	$MS_B$	$MS_B / MS_e$
误差	$SS_e$	$(k - 1) (l - 1)$	$MS_e$
总和	$S S$	$k l - 1$

还有一点要注意：在采纳模型 $(3.1)$ 时，我们事实上引进了一种假定，即两因素 $A, B$ 对指标的效应是可以叠加的．换一种方式说：因素 $A$ 的各水平的优劣比较，与因素 $B$ 处在哪个水平无关，反之亦然．更一般的情况是： $A, B$ 两因子有“交互作用＂。这时在模型(5.13)中，还要加上表示交互作用的项 $c_{ij}$ ．这时不仅统计分析复杂化了，尤其是分析结果的解释也复杂化了．本文档暂不讨论这种情况。在一个特定的问题中，交互作用是否需要考虑，在很大程度上取决于问题的实际背景和经验．有时，通过试验数据的分析也可以看出一些问题。例如，若误差方差 $\sigma^2$ 的估计$MS_e $反常地大，则有可能是由于交互作用所致．因为可以证明：若交互作用确实存在而未加考虑，则它的影响进入随机误差而增大了$ MS_e$。

3.2 代码实例

在双因素方差分析中，受试者被分配到两因子的交叉类别组中。以基础安装中的ToothGrowth数据集为例，随机分配60只豚鼠，分别采用两种喂食方法（橙汁或维生素C），各喂食方法中抗坏血酸含量有三种水平（0.5mg、1mg或2mg），每种处理方式组合都被分配10只豚鼠，牙齿长度为因变量。

> attach(ToothGrowth)
> table(supp, dose)
    dose
supp 0.5  1  2
  OJ  10 10 10
  VC  10 10 10
> 
> aggregate(len, by=list(supp, dose), FUN=mean)
  Group.1 Group.2     x
1      OJ     0.5 13.23
2      VC     0.5  7.98
3      OJ     1.0 22.70
4      VC     1.0 16.77
5      OJ     2.0 26.06
6      VC     2.0 26.14
> 
> aggregate(len, by=list(supp, dose), FUN=sd)
  Group.1 Group.2        x
1      OJ     0.5 4.459709
2      VC     0.5 2.746634
3      OJ     1.0 3.910953
4      VC     1.0 2.515309
5      OJ     2.0 2.655058
6      VC     2.0 4.797731
> 
> dose <- factor(dose)
#dose变量被转换为因子变量，这样aov()函数就会将它当做一个分组变量，而不是一个数值型协变量
> # condider interactive factor
> fit <- aov(len ~ supp*dose)
> summary(fit)
            Df Sum Sq Mean Sq F value   Pr(>F)    
supp         1  205.4   205.4  15.572 0.000231 ***
dose         2 2426.4  1213.2  92.000  < 2e-16 ***
supp:dose    2  108.3    54.2   4.107 0.021860 *  
Residuals   54  712.1    13.2                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

计算结果表明，主效应和交互效应都是显著的。

有多种方式对结果进行可视化处理。此处可用interaction.plot()函数来展示双因素方
差分析的交互效应。

# interactive effect
interaction.plot(dose, supp, len, type="b",
                 col=c("red","blue"), pch=c(16, 18),
                 main = "Interaction between Dose and Supplement Type")

图3-1 各种剂量喂食下豚鼠牙齿长度的均值（interaction.plot()函数绘制）

还可以用gplots包中的plotmeans()函数来展示交互效应。

图3-2 喂食方法和剂量对牙齿生长的交互作用。用plotmeans()函数绘制的95%的置
信区间的牙齿长度均值

图形展示了均值、误差棒（95%的置信区间）和样本大小。
最后，你还能用HH包中的interaction2wt()函数来可视化结果，图形对任意顺序的因子设计的主效应和交互效应都会进行展示（图3-3）。

library(HH)
interaction2wt(len~supp*dose)
> 
> detach(ToothGrowth)

图3-3 ToothGrowth数据集的主效应和交互效应。图形由interaction2wt()函数创建

以上三幅图形都表明随着橙汁和维生素C中的抗坏血酸剂量的增加，牙齿长度变长。对于0.5mg和1mg剂量，橙汁比维生素C更能促进牙齿生长；对于2mg剂量的抗坏血酸，两种喂食方法下牙齿长度增长相同。

参考书目：

陈希孺，概率论与数理统计
Robert I. Kabacoff, R in Action.

你可能感兴趣的:(DataWhale天池数据挖掘)

大数据专业毕业设计选题118例：数据挖掘数据分析可视化 HaiLang_IT 毕设选题教程毕业设计大数据数据挖掘
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
Python：第三方库衍生星球 python 第三方库
1.第三方Python库库名用途pip安装指令NumPy矩阵运算pipinstallnumpyMatplotlib产品级2D图形绘制pipinstallmatplotlibPIL图像处理pipinstallpillowsklearn机器学习和数据挖掘pipinstallsklearnRequestsHTTP协议访问pipinstallrequestsJieba中文分词pipinstalljieba
AI驱动的知识发现：程序员的新机遇 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
AI驱动的知识发现：程序员的新机遇关键词：知识发现,AI驱动,数据挖掘,数据分析,算法优化,数据可视化,机器学习1.背景介绍1.1问题由来在当今信息化时代，数据量呈爆炸性增长，各行各业都面临着海量数据挖掘和知识发现的巨大挑战。传统的统计分析方法已难以满足需求，而人工智能（AI）技术的兴起为这一问题提供了新的解决方案。AI驱动的知识发现，即利用机器学习、深度学习等技术手段，从海量数据中自动提取有用信
DataWhale 组队学习 wow-agent task2 体验总结归纳菜鸟码农01 学习 datawhale
一、Llama-index知识体验1.ReActAgent与业务自动化ReActAgent：通过ReActAgent，业务逻辑可以自动转换为代码，只要有相应的API，模型就可以调用。这种自动化能力使得许多业务场景变得更加高效和智能化。LlamaIndex开源工具：LlamaIndex提供了一些开源工具，帮助开发者实现这些功能。通过访问官网，开发者可以获取这些工具并应用到自己的项目中。2.Agent
DataWhale组队学习 LeetCode task4 菜鸟码农01 学习 leetcode 算法
目录1.二分查找算法介绍1.1二分查找算法简介1.2二分查找算法步骤1.3二分查找算法思想2.简单二分查找2.1题目：704.二分查找2.2解题思路3.二分查找细节3.1区间的开闭问题3.2mid的取值问题3.3出界条件的判断3.4搜索区间范围的选择4.二分查找的两种思路4.1直接法4.2排除法5.总结1.二分查找算法介绍1.1二分查找算法简介二分查找算法（BinarySearchAlgorith
DataWhale组队 LeetCode task1 菜鸟码农01 leetcode 算法
目录1.数据结构2.算法3.程序设计总结1.算法复杂度的评估方法2.问题规模n3.时间复杂度4.空间复杂度的定义5.空间复杂度的组成6.空间复杂度的计算总结一、什么是算法？算法的用处是什么？算法+数据结构=程序这一公式简洁地表达了程序设计的核心要素。算法是解决问题的步骤或方法，而数据结构则是数据的组织、存储和管理方式。程序则是算法和数据结构的具体实现。1.数据结构数据结构是带有结构特性的数据元素的
机器学习里的逻辑回归Logistic Regression基本原理与应用硅基创想家 AI-人工智能与大模型机器学习逻辑回归人工智能
LogisticRegression即逻辑回归，是一种广泛应用于机器学习和数据挖掘领域的有监督学习算法，以下从原理、应用、算法优缺点等方面进行介绍：基本原理线性回归基础：逻辑回归基于线性回归模型，其基本形式为：z=w1x1+w2x2+⋯+wnxn+bz=w_1x_1+w_2x_2+\cdots+w_nx_n+bz=w1x1+w2x2+⋯+wnxn+b其中xix_ixi是特征变量，wiw_iwi是对
python电商数据挖掘_Python 爬取淘宝商品数据挖掘分析实战 weixin_39946996 python电商数据挖掘
作者孙方辉本文为CDA志愿者投稿作品，转载需授权项目内容本案例选择>>商品类目：沙发；数量：共100页4400个商品；筛选条件：天猫、销量从高到低、价格500元以上。项目目的1.对商品标题进行文本分析词云可视化2.不同关键词word对应的sales的统计分析3.商品的价格分布情况分析4.商品的销量分布情况分析5.不同价格区间的商品的平均销量分布6.商品价格对销量的影响分析7.商品价格对销售额的影响
数据仓库与数据挖掘记录二匆匆整棹还数据仓库数据挖掘人工智能
1.数据仓库的产生从20世纪80年代初起直到90年代初,联机事务处理一直是关系数据库应用的主流。然而,应用需求在不断地变化,当联机事务处理系统应用到一定阶段时,企业家们便发现单靠拥有联机事务处理系统已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的态势进行分析,进而做出有利的决策。这种决策需要对大量的业务数据包括历史业务数据进行分析才能得到。把这种基于业务数据的决策分析
数据仓库与数据挖掘记录三匆匆整棹还数据挖掘
数据仓库的数据存储和处理数据的ETL过程数据ETL是用来实现异构数据源的数据集成,即完成数据的抓取/抽取、清洗、转换.加载与索引等数据调和工作,如图2.2所示。1）数据提取（Extract）从多个数据源中获取原始数据（如数据库、日志文件、API、云存储等）。数据源可能是结构化（如MySQL）、半结构化（如JSON）、非结构化（如文本）。关键技术：SQL查询、Web爬虫、日志采集工具（如Flume）
DeepSeek与核货宝订货系统的协同进化：智能商业范式重构多用户商城系统订货系统源码 deepseek 人工智能核货宝订货系统
数据处理与分析方面深度数据洞察：利用Deepseek强大的智能数据挖掘与分析能力，处理核货宝订货系统中的海量订单数据、客户数据、商品数据等。比如分析不同地区、不同时间、不同客户群体的订货偏好和趋势，为批发订货企业制定精准的采购、库存和销售策略提供依据。建立行业知识图谱：Deepseek可基于核货宝系统的数据及行业信息，构建批发行业知识图谱，清晰呈现企业、产品、客户、供应商等之间的关系和关联信息，帮
探索Python爬虫：获取淘宝商品详情与订单API接口的深度解析不爱搞技术的技术猿 Python 淘宝API python 爬虫开发语言
引言在数字化时代，电子商务平台的数据挖掘和分析已成为企业获取市场洞察的重要手段。淘宝，作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于商家和市场分析师来说，如何高效、合规地获取这些数据，成为了一个迫切需要解决的问题。本文将深入探讨如何利用Python爬虫技术，通过淘宝提供的API接口，合法合规地获取商品详情和订单数据。淘宝API接口概览淘宝开放平台提供了丰富的API接口，允许开发者在
DataWhale 数学建模导论学习笔记（第一章） ryanYu_127 学习笔记
要点：利用Python作为计算工具帮助解决数学模型。一、前期准备工作1.AnacondaNavigator帮助安装了NumPy所需的功能包。2.通过Jupyter_Lab,可以直接测试代码运行的结果。3.通过vscode可以修改文本并即时看到预览结果，解决一些符号、公式、表格显示不正常的问题。4.这也是我第一次使用CSDN记录自己的学习笔记。二、进入第一章正题解析方法与几何建模：1.前面的向量和矩
Datawhale数学建模导论课程第八章学习心得(I)一时间序列与投资模型星.惜尘数学建模
学习链接：Datawhale数学建模教程Descriptionhttps://datawhalechina.github.io/intro-mathmodel/#/CH8/%E7%AC%AC8%E7%AB%A0-%E6%97%B6%E9%97%B4%E5%BA%8F%E5%88%97?id=_811-%e6%97%b6%e9%97%b4%e5%ba%8f%e5%88%97%e7%9a%84%e5%
Python爬虫框架Scrapy入门指南健胃消食片片片片 python 爬虫 scrapy
Scrapy是一个高效、灵活、开放的Python爬虫框架，它可以帮助开发者快速地开发出高质量的网络爬虫，而不需要太多的编码工作。以下是对Scrapy的入门指南：一、Scrapy简介Scrapy是一个用于抓取网站和提取结构化数据的应用程序框架，可用于各种有用的应用程序，如数据挖掘、信息处理或历史存档。尽管Scrapy最初是为网络抓取而设计的，但它也可用于使用API提取数据或用作通用网络爬虫。Scra
李沐：读博这五年总结 datawhale
李沐DatawhaleDatawhale干货作者：李沐，卡内基梅隆大学前言12年8月提着一个行李箱降落在匹兹堡机场。没找住的地方，也不知道CMU应该怎么去。对未来一片迷茫，但充满乐观。现在，刚完成了博士期间最后的一场报告，在同样的机场，不过是在等待离开的航班。回想过去的五年，是折腾的五年，也是自我感悟和提升的五年。这里我尝试记录这五年主要做过的事情和其中的感想，希望对大家有所启发。第0年：3/11
获得清华博士学位的条件之一：不辱师门 datawhale
贾庆山老师DatawhaleDatawhale干货分享：贾庆山老师，编辑：哈哈镜V一个群体PermanentheadDamage的博士生群体PermanentheadDamage=Ph.D博士生一年级的同学们，不要担忧或高兴得太早，抱歉你们还没有经历Qualification——预备考试，你们暂且不能被称为博士，只能称自己是要努力成为博士预备生的学生。等过了一年到了博二，你们会疑惑，自己读的是工学
MINITAB中文教程：统计分析与质量管理聚合收藏
本文还有配套的精品资源，点击获取简介：MINITAB作为一款强大的统计分析工具，在质量控制、数据挖掘和实验设计等领域广受欢迎。该教程旨在为初学者提供一个友好的起点，通过详细的界面介绍、数据管理、基本统计分析、图形制作、质量控制、回归分析、过程能力分析、假设检验、多元统计和质量改进工具等内容的学习，使用户能够通过实例和练习，提高数据分析和质量管理的实际操作技能。教程采用PPT格式，以直观高效的方式呈
DataSet：数据挖掘与机器学习应用 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
DataSet：数据挖掘与机器学习应用作者：禅与计算机程序设计艺术1.背景介绍1.1.数据挖掘与机器学习的兴起近年来，随着互联网、物联网、云计算等技术的快速发展，全球数据量呈现爆炸式增长，数据的积累为数据挖掘和机器学习提供了丰富的素材。数据挖掘和机器学习作为从数据中提取有用信息和知识的关键技术，正在各个领域发挥着越来越重要的作用，例如商业智能、金融分析、医疗诊断、网络安全等等。1.2.DataSe
企业智能分析BI：洞察数据，驱动未来用友协同与数据服务大数据
在数据驱动的今天，企业运营不再仅仅依赖于直觉和经验，而是越来越多地依赖于深入的数据分析和精准的商业洞察。企业智能分析BI（BusinessIntelligence）系统，作为企业数据管理的得力助手，正在以其卓越的数据分析能力，帮助企业解锁数据潜能，驱动业务增长。企业智能分析BI系统，是一种运用数据仓库、在线分析和数据挖掘技术来处理和分析数据的崭新技术，目的是帮助企业决策者做出更好的决策。它像一把钥
使用MATLAB实现SMOTE算法 PixelLancer matlab 算法人工智能 Matlab
在数据挖掘和机器学习中，合成少数类过采样技术（SyntheticMinorityOver-samplingTechnique，简称SMOTE）是一种常用的处理类别不平衡问题的方法。本文将介绍如何使用MATLAB实现SMOTE算法，并提供相应的源代码。SMOTE算法通过合成新的少数类样本来平衡类别不平衡的数据集。它通过在少数类样本之间插入合成样本，以增加少数类样本的数量。这些合成样本是通过在少数类样
PDFMiner，一款超级强大的 Python 库快乐星球没有乐 python 人工智能开发语言 windows
介绍PDFMiner是一个用于从PDF文档中提取信息的工具，它可以解析PDF文件并提供不同层次的数据抽取。PDFMiner可以解析文本、注释、表单数据等，是一个广受欢迎的Python库，特别适用于需要处理PDF内容的数据挖掘和分析任务。安装方式安装PDFMiner非常简单，可以使用Python的包管理器pip进行安装。在终端或命令提示符中输入以下命令即可：pipinstallpdfminer.si
想做 Python 聊天机器人，有什么好用的中文分词、数据挖掘、AI方面的 Python 库或者开源项目推荐 xiamu_CDA 人工智能 python 机器人
想做Python聊天机器人，有什么好用的中文分词、数据挖掘、AI方面的Python库或者开源项目推荐？在当今数字化时代，聊天机器人已经成为了连接人与机器的重要桥梁。从客户服务到娱乐互动，从智能家居到医疗咨询，聊天机器人的应用场景越来越广泛。而作为一门强大的编程语言，Python在构建聊天机器人方面拥有得天独厚的优势。如果你正打算开发一个Python聊天机器人，尤其是涉及到中文分词、数据挖掘和AI技
高效利用爬虫开发获取淘宝分类详情：电商数据挖掘新路径 Jason-河山爬虫数据挖掘人工智能
在电商领域，淘宝作为中国最大的电商平台之一，其分类详情数据对于市场分析、竞争策略制定以及电商运营优化具有极高的价值。通过爬虫技术，我们可以高效地获取这些数据，为电商从业者提供强大的数据支持。本文将详细介绍如何利用爬虫技术获取淘宝分类详情，并提供具体的实现方法和注意事项。一、淘宝分类详情数据的价值淘宝的分类详情数据不仅包括商品的分类名称、分类层级，还可能包含每个分类下的热门商品、价格区间等信息。这些
完整的671B R1塞进本地，详尽教程来了！ datawhale
李锡涵DatawhaleDatawhale干货作者：李锡涵，编译：机器之心本文作者：李锡涵（XihanLi）作者简介：伦敦大学学院（UCL）计算机系博士研究生，谷歌开发者专家，主要研究方向为学习优化，在NeurIPS、ICLR、AAMAS、CIKM等会议发表过学术论文，CircuitTransformer作者，图书《简明的TensorFlow2》（https://tf.wiki）作者过年这几天，D
DeepSeek实习感受与大模型择业思考！ datawhale
郑思泽DatawhaleDatawhale经验作者：郑思泽，北京大学博士、字节TopSeed知乎：郑思泽，已获作者授权地址：https://zhuanlan.zhihu.com/p/...转眼距离博士毕业已经六个月了，过去的一年时光可谓心路坎坷，时常陷于纠结犹豫之中，前一阵还收到邀请分享就业心得。因为行程安排没有能参加，趁着今天放假，就直接记录一段这段时间的心情和事情，记录的内容里，我的选择有对有
Python 数据挖掘与机器学习岁月如歌，青春不败人工智能 python 数据挖掘机器学习编程决策树随机森林神经网络
模块一：Python编程Python编程入门1、Python环境搭建2、如何选择Python编辑器？3、Python基础4、常见的错误与程序调试5、第三方模块的安装与使用6、文件读写（I/O）Python进阶与提高1、Numpy模块库2、Pandas模块库3、Matplotlib基本图形绘制4、图形样式的美化5、图形的布局6、高级图形绘制7、坐标轴高阶应用模块二：特征工程数据清洗1、描述性统计分析
组队学习首次开放许愿啦！下个月想学什么，听你的 datawhale
原创DatawhaleDatawhaleDatawhale学习开源贡献：Datawhale团队许愿你想学习的课程组队学习新增许愿环节，每个人都可以在留言区写下你想学习的内容。许愿规则▶许愿的内容不能太广。举个栗子，不推荐大家直接许愿：「机器学习」，而是许愿：「机器学习入门概念讲解」，或者具体到某个算法：「线性回归的公式推导+代码实战」，这样便于我们在1个月内完成制作。▶不限制课程难度，只要是刚需就
机器学习与数据挖掘：决策树（知识点总结） KE.WINE 机器学习机器学习数据挖掘决策树
决策树叶节点对应于决策结果，内部节点表示一个特征或属性。基本流程决策树算法递归返回的三个条件：当前结点包含的样本全属于同一类别，无需划分;当前属性集为空,或是所有样本在所有属性上取值相同，无法划分;*将当前节点标记为叶节点，将其类别设定为该节点所含样本最多的类别；当前结点包含的样本集合为空，不能划分；*将当前节点标记为叶节点，将其类别设定其父节点所含样本最多的类别；划分选择决策树学习算法包括3部分
错误信息：Traceback (most recent call last): L_cl 常见算法与知识积累 python
错误信息Traceback(mostrecentcalllast):File"E:\python.learning\pythonDateExcavateTreat\数据挖掘课程设计\2_京东用户意向购买数据探索.py",line74,indf_ui=df_ui.to_frame().reset_index()File"E:\python.learning\lib\site-packages\pan
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S