weixin_39889337

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？

连玉君（中山大学岭南学院金融系）
Stata连享会主页 || 视频 || 推文

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第2张图片

连享会-知乎推文列表

Note: 助教招聘信息请进入「课程主页」查看。

因果推断-内生性专题 ⌚ 2020.11.12-15 主讲：王存同 (中央财经大学)；司继春(上海对外经贸大学) 课程主页： https://gitee.com/arlionn/YG | 微信版

http://qr32.cn/BlTL43 (二维码自动识别)

空间计量专题 ⌚ 2020.12.10-13 主讲：杨海生 (中山大学)；范巧 (兰州大学) 课程主页： https://gitee.com/arlionn/SP | 微信版

https://gitee.com/arlionn/DSGE (二维码自动识别)

2018.4.11更新：该文已发表
连玉君, 廖俊平, 2017, 如何检验分组回归后的组间系数差异?, 郑州航空工业管理学院学报 35, 97-109. [PDF 原文下载] [PDF-万方]
2020.4.19 更新：[本文最新版]

问题：实证分析中，经常需要对比分析两个子样本组的系数是否存在差异。
例如，在公司金融领域，研究薪酬激励是否有助于提升业绩时，模型设定为：

关注的重点是系数
。

我们经常把样本组分成“国有企业(SOE)”和“民营企业(PRI)”两个样本组，继而比较
和

是否存在差异。通常认为，民营企业的薪酬激励更有效果，即

。

如果两个样本组中的模型设定是相同的，则两组之间的系数大小是可以比较的，而且这种比较在多数实证分析中都是非常必要的。

举几个例子，让诸位对这类问题有点感觉：

Cleary, S., 1999, The relationship between firm investment and financial status, Journal of Finance, 54 (2): 673-692. Tabel IV

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第3张图片

连玉君, 彭方平, 苏治, 2010, 融资约束与流动性管理行为, 金融研究, (10): 158-171. 表2.

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第4张图片

问题背景：

下面使用我在stata初级班讲座（http://www.peixun.net/view/307_detail.html；连玉君课程_视频在线学习 - 讲师介绍 - Peixun.net - Peixun.net）中的例子，列举几种方法。

调入 stata 自带的数据集 nlsw88.dta。

这份数据包含了1988年采集的 2246 个妇女的资料，包括：小时工资 wage，每周工作时数 hours，种族 race 等变量。

我们想研究的是妇女的工资决定因素。

最为关注的是白人和黑人（相当于把原始数据分成了两个样本组：白人组和黑人组）的工资决定因素是否存在差异。

分析的重点集中于工龄（ttl_exp）和婚姻状况(married) 这两个变量的系数在两组之间是否存在显著差异。

下面是分组执行 OLS 回归的命令和结果：

sysuse "nlsw88.dta", clear
  gen agesq = age*age
*-分组虚拟变量
  drop if race==3
  gen black = 2.race
  tab black 
*-删除缺漏值 
  global xx "ttl_exp married south hours tenure age* i.industry"
  reg wage $xx i.race
  keep if e(sample)   
*-分组回归
  global xx "ttl_exp married south hours tenure age* i.industry"
  reg wage $xx if black==0 
  est store White
  reg wage $xx if black==1 
  est store Black
 *-结果对比
  local m "White Black"
  esttab `m', mtitle(`m') b(%6.3f) nogap drop(*.industry) ///
	 s(N r2_a) star(* 0.1 ** 0.05 *** 0.01)

结果：

------------------Table 1-------------------
                      (1)             (2)   
                    White           Black   
--------------------------------------------
ttl_exp             0.251***        0.269***
                   (6.47)          (4.77)   
married            -0.737**         0.091   
                  (-2.31)          (0.23)   
south              -0.813***       -2.041***
                  (-2.71)         (-4.92)   
hours               0.051***        0.037   
                   (3.81)          (1.39)   
tenure              0.025          -0.004   
                   (0.77)         (-0.09)   
age                 0.042           0.995   
                   (0.03)          (0.54)   
agesq              -0.001          -0.015   
                  (-0.09)         (-0.66)   
_cons               3.333         -14.098   
                   (0.14)         (-0.39)   
--------------------------------------------
N                1615.000         572.000   
r2_a                0.112           0.165   
--------------------------------------------
t statistics in parentheses
* p<0.1, ** p<0.05, *** p<0.01

可以看到，ttl_exp 变量在 [white 组] 和 [black 组] 的系数分别为 0.251 和 0.269，二者都在 1% 水平上显著异于零。

问题在于：我们能说 0.269 比 0.251 大吗？

从统计意义上来看，答案显然没有那么明确（小学五年级的小朋友会觉得这根本不是个问题！）。

相对而言，若把注意力放在 married 这个变量上，或许更容易判断二者的差异是否显著。因为，_b[married]_white (白人组的 married 估计系数) 为 -0.737**，而 _b[married]_black 为 0.091 —— 前者在 5% 水平上显著为负，而后者不显著。

即便如此，我们仍然无法直接作出结论：_b[married]_white < _b[married]_black，因为二者的置信区间尚有重叠：

	  *----------------------------------------
	  *             White         Black        
	  *----------------------------------------
	  * ttl_exp 
	  *---------
	  *   beta     0.251***       0.269***     
	  *  95% CI  [0.17, 0.33]   [0.16, 0.38]   
	  *----------------------------------------
	  * married 
	  *---------
	  *   beta     -0.737**         0.091      
	  *  95% CI  [-1.36, -0.11]  [-0.69, 0.87] 
	  *----------------------------------------

下面我们介绍三种检验组间系数差异的方法：

方法1：引入交叉项（Chow 检验）
方法2：基于似无相关模型的检验方法 (suest)
方法3：费舍尔组合检验（Permutation test）

连享会 最新专题 直播

方法 1: 引入交叉项

这是文献中最常用的方法，执行起来也最简单。以检验 ttl_exp 在两组之间的系数是否存在显著差异为例。引入一个虚拟变量

，若某个妇女是黑人，则

，否则

。在如下命令中，black 变量即为这里的

。模型设定为：

这是最基本的包含虚拟变量，以及虚拟变量与一个连续变量交乘项的情形。

显然，对于白人组而言，

，则 (1) 式可以写为：

对于黑人组， (1) 式可以写为：

由此可见，在 (1) 式中，参数

和

分别反映了黑人组相对于白人组的截距和斜率差异。我们关注的是参数

，它反映了 ttl_exp 这个变量在两个样本组中的系数差异。因此，检验 ttl_exp 在两组之间的系数是否存在显著差异就转变为

。相应的估计命令如下：

dropvars ttl_x_black marr_x_black
global xx "ttl_exp married south hours tenure age* i.industry" //Controls
gen ttl_x_black = ttl_exp*black  //交乘项
reg wage black ttl_x_black $xx   //全样本回归+交乘

为节省篇幅，仅列出最关键的结果如下：

reg wage black ttl_x_black $xx   //全样本回归+交乘
     Source |       SS       df       MS              Number of obs =    2187
------------+------------------------------           F( 20,  2166) =   17.32
      Model |   10074.761    20  503.738052           Prob > F      =  0.0000
   Residual |  63000.2591  2166  29.0859922           R-squared     =  0.1379
------------+------------------------------           Adj R-squared =  0.1299
      Total |  73075.0201  2186   33.428646           Root MSE      =  5.3931
-----------------------------------------------------------------------------
       wage |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
------------+----------------------------------------------------------------
      black |   -.818647   .8015272    -1.02   0.307     -2.39049    .7531957
ttl_x_black |  -.0181844   .0585517    -0.31   0.756    -.1330077    .0966389
    ttl_exp |   .2537358   .0351178     7.23   0.000     .1848676     .322604
    married |  -.4646649   .2530829    -1.84   0.066    -.9609756    .0316458
      south |  -1.127138   .2453123    -4.59   0.000     -1.60821   -.6460662
      hours |   .0516672   .0116886     4.42   0.000     .0287451    .0745894
     tenure |   .0198005   .0260971     0.76   0.448    -.0313775    .0709786
        age |   .1685498   1.035721     0.16   0.871    -1.862562    2.199661
      agesq |  -.0034668   .0131097    -0.26   0.791    -.0291756     .022242
                             .....
      _cons |   .8448605   20.39973     0.04   0.967    -39.16022    40.84994
-----------------------------------------------------------------------------

交乘项 [ttl_x_black] 的系数为 -.01818, 对应的 p-value 为 0.756，表明 [ttl_exp] 的系数在两组之间并不存在显著差异。

我们也可以不事先生成交乘项，而直接采用 stata 的因子变量表达式，得到完全相同的结果：

reg wage i.black ttl_exp i.black#c.ttl_exp $xx

或如下更为简洁的方式 (详情参见 help fvvarlist)：

reg wage i.black##c.ttl_exp $xx

然而，需要特别强调的是，在上述检验过程中，我们无意识中施加了一个非常严格的假设条件：只允许变量 [ttl_exp] 的系数在两组之间存在差异，而其他控制变量(如 married, south, hours 等) 的系数则不随组别发生变化。

这显然是一个非常严格的假设。因为，从 -Table 1- 的结果来看, married， south, hours 等变量在两组之间的差异都比较明显。

为此，我们放松上述假设，允许 married， south, hours 等变量在两组之间的系数存在差异：

reg wage i.black i.black#(c.ttl_exp i.married i.south c.hours) $xx    //Model 2

在这种相对灵活的设定下，[ttl_exp] 的系数为

，相应的 p-value=0.787，依然不显著。

当然，我们也可以采用更为灵活的方式：允许所有的变量在两组之间都存在系数差异（注意：所有离散变量前都要加 i. 前缀，否则将被视为连续变量进行处理（对于取值为0/1的虚拟变量，可以省略前缀 i.）；连续变量则需加 c. 前缀）：

global xx "c.ttl_exp married south c.hours c.tenure c.(age*) i.industry"
reg wage i.black##($xx)                                               //Model 3

这其实就是大名鼎鼎的 Chow test （邹检验），可以用 chowtest 命令快捷地完成。

小结：

引入交乘项来检验某个或某几个变量的系数是否存在组间差异，只需在普通线性回归中加入交乘项即可，但需要注意这一方法背后隐含的假设条件（为了便于说明，重新将 (1) 式列出）：

A1：所有控制变量的系数在两组之间无差异，即
;
A2：两组的干扰项具有相同的分布（因为估计时是将两组样本混合在一起进行估计的），即
, 且

，换言之，

。
因此，当其它变量的系数在两组之间也存在明显差异（A1不满足），或存在异方差（A2不满足）时，上述检验方法得到的结果都存在问题。

解决办法：

对于 A1，实际操作过程中，可以通过引入更多的交乘项来放松 A1，如上文提到的 Model 2 或 Model 3。
对于 A2，则可以在上述回归分析过程中加入 vce(robust) 选项，以便允许干扰项存在异方差；或加入 vce(cluster varname) 以便得到聚类调整后的稳健型标准误。
上述范例中，是以基于截面数据的 OLS 回归为例的，但这一方法也适用于其他命令，如针对面板数据的 xtreg, 针对离散数据的 logit, probit 等。

方法 2: SUEST (基于似无相关模型SUR的检验)

基本思想

顾名思义，所谓的似无相关模型（seemingly unrelated regression）其实就是表面上看起来没有关系，但实质上有关系的两个模型。这听起来有点匪夷所思。这种“实质上”的关系其实是假设白人组和黑人组的干扰项彼此相关。为了表述方便，将白人和黑人组的模型简写如下：

白人组

黑人组

若假设

，则我们可以分别对白人组和黑人组进行 OLS 估计。

然而，虽然白人和黑人种族不同，但所处的社会和法律环境，面临的劳动法规都有诸多相似之处，使得二者的干扰项可能相关，即

。此时，对两个样本组执行联合估计（GLS）会更有效率（详见 Greene (2012, Econometric analysis, 7th ed, 292–304)）。

执行完 SUR 估计后，我们就可以对两组之间的系数差异进行检验了。

从上面的原理介绍，可以看出，基于 SUR 估计进行组间系数差异检验时，假设条件比第一种方法要宽松一些：

其一，在估计过程中，并未预先限定白人组和黑人组各个变量的系数一定要相同，因此在 (2) 式中，我们分别用
和

表示白人组和黑人组各个变量的系数向量；
其二，两个组的干扰项可以有不同的分布，即可以不同，即
,

，且允许二者的干扰项相关，

。

Stata 实现方法

在 stata 中执行上述检验的步骤为：

Step 1: 分别针对白人组和黑人组进行估计（不限于OLS估计，可以执行 Logit, Tobit 等估计），存储估计结果；
Step 2：使用 suest 命令执行 SUR 估计；
Step 3: 使用 test 命令检验组间系数差异。

范例如下：

*-Step1: 分别针对两个样本组执行估计
  reg wage $xx if black==0 
  est store w  //white
  reg wage $xx if black==1 
  est store b  //black
*-Step 2: SUR
  suest w b
*-Step 3: 检验系数差异
  test [w_mean]ttl_exp = [b_mean]ttl_exp 
  test [w_mean]married = [b_mean]married  
  test [w_mean]south = [b_mean]south

Step 2 的结果如下（为便于阅读，部分变量的系数未呈现）：

.       suest w b

Simultaneous results for w, b
                                                  Number of obs   =       2187
-------------------------------------------------------------------------------
              |    Robust
              |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
--------------+----------------------------------------------------------------
w_mean        |
      ttl_exp |   .2505707   .0362302     6.92   0.000     .1795609    .3215805
      married |  -.7367238   .3486479    -2.11   0.035    -1.420061   -.0533865
        south |  -.8125914   .2892359    -2.81   0.005    -1.379483   -.2456994
        hours |   .0507118   .0126268     4.02   0.000     .0259637    .0754599
       tenure |   .0246063   .0289939     0.85   0.396    -.0322207    .0814333
          age |   .0415616   1.107902     0.04   0.970    -2.129887    2.213011
        agesq |  -.0014454   .0138965    -0.10   0.917     -.028682    .0257911
                                  ... ...
        _cons |   3.333308   22.03159     0.15   0.880    -39.84781    46.51442
--------------+----------------------------------------------------------------
w_lnvar       |
        _cons |     3.4561   .0971137    35.59   0.000     3.265761     3.64644
--------------+----------------------------------------------------------------
b_mean        |
      ttl_exp |   .2686185   .0511831     5.25   0.000     .1683015    .3689355
      married |   .0913607   .4050685     0.23   0.822    -.7025589    .8852804
        south |  -2.040701   .4252889    -4.80   0.000    -2.874252    -1.20715
        hours |   .0367536   .0229076     1.60   0.109    -.0081444    .0816516
       tenure |   -.003914   .0450917    -0.09   0.931    -.0922921    .0844641
          age |   .9952064   1.814351     0.55   0.583    -2.560856    4.551269
        agesq |  -.0153824   .0229045    -0.67   0.502    -.0602744    .0295096
        _cons |  -14.09831   35.40206    -0.40   0.690    -83.48508    55.28846
                                  ... ...
--------------+----------------------------------------------------------------
b_lnvar       |
        _cons |   3.077588   .2090237    14.72   0.000     2.667909    3.487267
-------------------------------------------------------------------------------

对上述命令和结果的简要解释如下：

白人组和黑人组的估计结果分别存储于 w 和 b 两个临时性文件中；
执行 - suest w b - 命令时，白人组和黑人组的被视为两个方程，即文的 (2a) 和 (2b) 式。Stata 会自动将两个方程对应的样本联合起来，采用 GLS 执行似无相关估计（SUR）；
由于 SUR 属于多方程模型，因此需要指定每个方程的名称，在下面呈现的回归结果中，[w_mean] 和 [b_mean] 分别是白人组和黑人组各自对应的方程名称。因此，[w_mean]ttl_exp 表示白人组方程中 ttl_exp 变量的系数，而 [b_mean]ttl_exp 则表示黑人组中 ttl_exp 变量的系数。

执行组间系数差异检验的结果如下（Step 3）：

. *-Step 3: 检验系数差异

.      test [w_mean]ttl_exp = [b_mean]ttl_exp 
  (1)  [w_mean]ttl_exp - [b_mean]ttl_exp = 0
           chi2(  1) =    0.08
         Prob > chi2 =    0.7735

.      test [w_mean]married = [b_mean]married  
  (2)  [w_mean]married - [b_mean]married = 0
           chi2(  1) =    2.40
         Prob > chi2 =    0.1213

.      test [w_mean]south = [b_mean]south      
  (3)  [w_mean]south - [b_mean]south = 0
           chi2(  1) =    5.70
         Prob > chi2 =    0.0169

此时，ttl_exp 在两组之间的系数差异仍然不显著，这与采用第一种方法得到的结论是一致的。在我们测试的三个变量中，只有 south 的系数在两组之间存在显著差异，对应的 p-value 为 0.0169。

使用 -bdiff- 命令

上述过程可以使用我编写的 - bdiff - 命令非常快捷的加以实现，结果的输出方式也更为清晰（在 stata 命令窗口中输入 - ssc install bdiff, replace- 可以下载最新版命令包，进而输入 - help bdiff - 查看帮助文件）：

preserve
  drop if industry==2  // 白人组中没有处于 Mining (industry=2) 的观察值
  tab industry, gen(d)  //手动生成行业虚拟变量
  local dumind "d2 d3 d4 d5 d6 d7 d8 d9 d10 d11" //行业虚拟变量
  global xx "c.ttl_exp married south c.hours c.tenure c.age c.agesq `dumind'"  
  bdiff, group(black) model(reg wage $xx) surtest
restore

结果如下：

-SUR- Test of Group (black 0 v.s 1) coeficients difference

   Variables |      b0-b1    Chi2     p-value
-------------+-------------------------------
     ttl_exp |     -0.017    0.07       0.788
     married |     -0.814    2.32       0.128
       south |      1.238    5.80       0.016
       hours |      0.014    0.28       0.597
      tenure |      0.030    0.32       0.571
         age |     -1.027    0.23       0.629
       agesq |      0.015    0.31       0.578
          d2 |     -2.732    1.63       0.202
          d3 |     -1.355    1.45       0.228
          d4 |     -2.708    2.23       0.135
          d5 |     -1.227    1.00       0.317
          d6 |      0.087    0.00       0.950
          d7 |     -0.534    0.07       0.785
          d8 |     -1.316    1.26       0.261
          d9 |      0.346    0.06       0.807
         d10 |     -1.105    0.94       0.333
         d11 |     -1.689    1.81       0.179
       _cons |     18.770    0.20       0.652
---------------------------------------------

几点说明：

使用 -suest- 时，允许两个样本组的解释变量个数不同。但由于一些技术上的问题尚未解决(很快可以解决掉)，-bdiff- 命令要求两个样本组中的解释变量个数相同。在上例中，白人组在 Mining 行业的观察值个数为零（输入 -tab industry black- 可以查看），导致我们加入行业虚拟变量时，白人组只有 10 个行业虚拟变量，而黑人组则有 11 个行业虚拟变量。为此，在上述命令中，我使用 - drop if industry==2 - 命令删除了 Mining 行业的观察值。
目前，-bdiff- 还不能很好地支持因子变量的写法 (help fvvarlist)，因此上例中的行业虚拟变量不能通配符方式写成 d*，而必须写成原始模样： d2 d3 d4 d5 d6 d7 d8 d9 d10 d11。

面板数据的处理方法

- suest - 不支持 -xtreg- 命令，因此无法直接将该方法直接应用于面板数据模型，如 FE 或 RE。此时，可以预先手动去除个体效应，继而对变换后的数据执行 OLS 估计，步骤如下：

step 1：对于固定效应模型而言，可以使用 - center - 或 - xtdata - 命令去除个体效应；对于随机效应模型而言，可以使用 - xtdata - 命令去除个体效应。
step 2：按照截面数据的方法对处理后的数据进行分组估计，并执行 suest 估计和组间系数检验。

举个例子：

*-SUEST test for panel data
  *-数据概况
        webuse "nlswork", clear
        xtset idcode year
        xtdes
  *-对核心变量执行组内去心：去除个体效应
	help center   //外部命令, 下载命令为 ssc install center, replace
	local y "ln_wage"
	local x "hours tenure ttl_exp south"
	bysort id: center `y', prefix(cy_)   //组内去心
	bysort id: center `x', prefix(cx_) 	
  *-分组回归分析	
	reg cy_* cx_* i.year if collgrad==0  // 非大学组
	est store Yes
	reg cy_* cx_* i.year if collgrad==1  //   大学组
	est store No
  *-列示分组估计结果	
	esttab Yes No, nogap mtitle(Yes_Coll No_Coll) ///
		   star(* 0.1 ** 0.05 *** 0.01) s(r2 N)		
  *-似无相关估计	
	suest Yes No
  *-组间差异检验	
        test [Yes_mean]cx_ttl_exp = [No_mean]cx_ttl_exp 
	test [Yes_mean]cx_hours = [No_mean]cx_hours

小结

相对于方法1（引入交乘项），基于 SUR 的方法更为灵活一些。在上例中，白人组和黑人组的被解释变量相同（均为 wage），此时方法 1 和方法 2 都能用。有些情况下，两个组中的被解释变量不同，此时方法 1 不再适用，而方法 2 则可以。
对于面板数据而言，可以预先使用 - center - 或 - xtdata - 命令去除个体效应，变换后的数据可以视为截面数据，使用 - regress - 命令进行估计即可。
为了便于呈现结果，可以使用 - estadd - 命令将上述检验结果(chi2 值或 p值) 加入内存，进而使用 -esttab- 命令列示出来。可以参考 - help bdiff - 中的类似范例。

连享会 - 文本分析与爬虫 - 专题视频
主讲嘉宾：司继春 || 游万海

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第5张图片

方法 3：费舍尔组合检验（Fisher's Permutation test)

A、基本思想

白人组，样本数为

黑人组，样本数为

将二者的系数差异定义为

，检验的原假设为：

。

我们仍然关注 ttl_exp 变量在两组之间的系数差异。以 -Table 1- 中的结果为例，可以看到，ttl_exp 变量在 [white 组] 和 [black 组] 的系数估计值分别为 0.251 (

) 和 0.269 (

)，因此，实际观察到的系数差异为

。

这里，

是一个统计量，若能知道其分布特征，便可通过分析

在

的分布中的相对位置来判断我们实际观察到

的概率。若概率很小，则表明

是小概率事件，此时拒绝原假设，反之则无法拒绝原假设。

例如，若假设

服从标准正态分布，即

，则基于实际观察到的

，我们很容易得出结论：无法拒绝原假设，即两组之间的 ttl_exp 的系数不存在显著差异。p-value 很容易计算 (当然，也可以查表得到)：

. dis normal(-0.018)    //单尾检验
.49281943

然而，我们并不知道 d 的分布特征。此时，可以对现有样本进行重新抽样，以得到经验样本 (empirical sample)，进而利用经验样本构造出组间系数差异统计量 d 的经验分布 (empirical distribution)，从而最终得到经验 p 值 (empirical p-value)。

下面先通过一个小例子说明 “经验 p 值” 和 “经验分布” 的概念，进而介绍使用组合检验获得 “经验 p 值” 的流程。

B、经验 p 值 (empirical p-value)

在这个小例子中，我们先随机生成一个服从标准正态分布的随机数 d，共有 10000 个观察值。这些观察值是通过模拟产生的。如果这些观察值构成的样本是通过从原始样本（原始样本是从母体中一次随机抽样，称为 “抽样样本，sample”）中二次抽样得到的，则称为 “经验样本 (empirical sample)”。

然后，我们数一下在这 10000 个随机数中，有多个是大于

(我们实际观察到的数值)，命令为 count if d<-0.018。一共有 4963 个观察值大于

，由此可得，经验 p 值 = 4963/10000 = 0.4963。这与采用 normal() 函数得到的结果 (0.4928) 非常接近。

	preserve
	   clear
	   set obs 10000
	   set seed 1357
	   gen d = rnormal()  // d~N(0,1) 服从标准正态分布的随机数
	   sum d, detail
	   count if d<-0.018
	   dis "Empirical p-value = "  4963/10000
	restore

C、经验样本 (empirical sample)

上例中，我们假设 d 服从标准正态分布，从而可以通过 monte carlo 模拟的方式产生 10000 个观察值，这事实上是构造了一个经验样本。但多数情况下，我们并不知道 d 的分布特征，此时无法使用 monte carlo 模拟。然而，若假设抽样样本 (sample) 是从母体 (population) 中随机抽取的，则可以通过抽样样本中二次抽样得到经验样本 (empirical sample)，这些经验样本也可以视为对母体的随机抽样。

若抽样过程中为无放回抽样 (sampling with no replacement)，则相应的检验方法称为 “组合检验（permutation test）”；若抽样过程中为有放回抽样 (也称为可重复抽样，sampling with replacement)，则对应的检验方法称为 “基于 Bootstrap 的检验”。

D、费舍尔组合检验的步骤

若

是正确的，则对于任何一个妇女而言（不论她是白人还是黑人），其 x 对 y 的边际影响都是相同的。因此，我们可以将白人组和黑人组的观察值混合起来，从中随机抽取 n1 个观察值，并将其视为"白人组"，剩下的 n2 个观察值可以视为“黑人组”。

Step 0: 分别针对白人组和黑人组估计模型 (3a) 和 (3b)，得到系数估计值
和

，以及二者的系数差异

；
Step 1: 将白人组和黑人组的样本混合起来，得到 n1+n2 个观察值构成的样本 S；
Step 2: 获得经验样本 —— 从 S 中随机抽取 (无放回) n1 个观察值，将其视为“白人组”(记为 Sw)，剩下的 n2 个观察值可以视为“黑人组” (记为 Sb)；
Step 3: 分别针对经验样本 Sw 和 Sb，估计模型 (3a) 和 (3b)，得到
和

（上标

表示利用第一笔经验样本得到的估计值），以及二者的差异

；
Step 4: 获得统计量
的经验分布 —— 将 Step 2 和 Step 3 重复执行

次 (如

)，则可以得到

，亦可简记为

；
Step 5: 计算经验 p 值，
，其中

表示 Step 4 中得到的

个

中大于我们实际观测到的

的个数。若

，则可以在5%水平上拒绝原假设，表明两组的系数差异是显著的。
需要说明的是，由于
的分布未必是对称的，因此，

与

都可以视为在 5% 水平上拒绝原假设的证据。因为，前者意味着

在 1000 个

中属于非常大的数值，而后者意味着它是非常小的数值。无论如何，在原假设

下观察到

都是小概率事件，也就意味着原假设是不合理的。
此外，该方法的并不局限于普通的线性回归模型(-regress-命令)，可以应用于各种模型的估计命令，如 -xtreg-, -xtabond-, -logit-, -ivregress- 等。

E、Stata 实现

上述过程可以使用连玉君编写的 -bdiff- 命令来实现。在命令窗口中输入 -ssc install bdiff, replace- 可以自动安装该命令。帮助文件中提供了多个范例。

先使用一个简单的例子，不考虑行业虚拟变量：

  *-数据处理
        sysuse "nlsw88.dta", clear
	gen agesq = age*age
	drop if race==3
	gen black = 2.race 
	global xx "ttl_exp married south hours tenure age agesq"
    *-检验
	bdiff, group(black) model(reg wage $xx) reps(1000) detail

选项 group() 中填写用于区分组别的类别变量（若有多个组，可以预先删除不参与比较的组，类似于上面的 drop if race==3 命令）；
选项 model() 用于设定回归模型，即上面提到的模型 (3a) 或 (3b)；
选项 reps(#) 用于设定抽样次数，即上文提到的
，通常设定 1000-5000 次即可；
附加 detail 选项，可以进一步列表呈现两组的实际估计系数
和

；

上述过程大约用时 13 秒，结果如下：

-Permutaion (1000 times)- Test of Group (black 0 v.s 1) coeficients difference

   Variables |      b0-b1    Freq     p-value
-------------+-------------------------------
     ttl_exp |      0.007     490       0.490
     married |     -0.824     920       0.080
       south |      1.411       5       0.005
       hours |      0.010     344       0.344
      tenure |     -0.006     512       0.488
         age |     -1.579     751       0.249
       agesq |      0.022     218       0.218
       _cons |     28.051     267       0.267
---------------------------------------------

可以看到，ttl_exp 的经验 p 值为 0.49，表明白人和黑人组的 ttl_exp 系数不存在显著差异；married 变量的 p 值为 0.08，我们可以在 10% 水平上拒绝原假设。细心的读者会发现，该变量对应的 Freq = 920，为什么？（答案在上面 Step 5 处）。

行业虚拟变量

若需在模型中加入虚拟变量，处理过程会稍微复杂一些。需要手动生成行业虚拟变量，并保证两个样本组中参与回归的行业虚拟变量个数相同。此外，书写命令时，不能使用通配符。（后续版本的 bdiff 命令会使用 fvunab 命令解决这些 bugs）。

*-数据预处理(可以忽略)
  sysuse "nlsw88.dta", clear
  gen agesq = age*age
*-分组虚拟变量
  drop if race==3
  gen black = 2.race 
*-删除缺漏值 
  global xx "ttl_exp married south hours tenure age* i.industry"
  qui reg wage $xx i.race
  keep if e(sample) 
*-生成行业虚拟变量
  drop if industry==2  // 白人组中没有处于 Mining (industry=2) 的观察值
  tab industry, gen(d)  //手动生成行业虚拟变量
  local dumind "d2 d3 d4 d5 d6 d7 d8 d9 d10 d11" //行业虚拟变量
  global xx "c.ttl_exp married south c.hours c.tenure c.age c.agesq `dumind'"
*-permutation test
  bdiff, group(black) model(reg wage $xx) reps(1000) detail

面板数据

若原始数据为面板数据，通常会采用 -xtreg-, -xtabond- 等考虑个体效应的方法进行估计。抽样过程必须考虑面板数据的特征。在执行 -bdiff- 命令之前，只需设定 -xtset id year-，声明数据为面板数据格式，则抽样时便会以 id (公司或省份代码) 为单位，以保持 id 内部的时序特征。

*-Panel Data (sample by cluster(id))
    *-数据预处理
        webuse "nlswork.dta", clear
	xtset id year                  //声明为面板数据，否则视为截面数据
	gen agesq = age*age
	drop if race==3
	gen black = 2.race
    *-检验
	global x "ttl_exp hours tenure south age agesq"
	local m "xtreg ln_wage $x, fe" //模型设定
	bdiff, group(black) model(`m') reps(1000) bs first detail

耗时 608 秒才完成，结果如下：

-Bootstrap (1000 times)- Test of Group (black 0 v.s 1) coeficients difference

   Variables |      b0-b1    Freq     p-value
-------------+-------------------------------
     ttl_exp |      0.011      47       0.047
       hours |      0.003      58       0.058
      tenure |      0.004     116       0.116
       south |      0.093      14       0.014
         age |     -0.022     984       0.016
       agesq |      0.000      45       0.045
       _cons |      0.302      22       0.022
---------------------------------------------
Ho: b0(ttl_exp) = b1(ttl_exp)
  Observed difference =  0.011
    Empirical p-value =  0.047

解释和说明：

-bdiff- 命令中设定 -bs- 选项，则随机抽样为可重复抽样 (bootstrap)；
-first- 选项便于将组间系数差异检验结果保存在内存中，方便后续使用 esttab 合并到回归结果表格中。具体使用方法参见 -help bdiff-。
由于抽样过程具有随机性，因此每次检验的结果都有微小差异。在投稿之前，可以附加 -seed()- 选项，以保证检验结果的可复制性。
其他选项和使用方法参阅 -help bdiff- 的帮助文件。

F、延伸阅读

关于这一方法的更为一般化的介绍参见 Efron, B., R. Tibshirani. An introduction to the bootstrap[M]. New York: Chapmann & Hall, 1993 （Section 15.2, pp.202）.

如下论文使用了这一方法检验了 “投资-现金流敏感性” 分析中的组间系数差异：

Cleary, S., 1999, The relationship between firm investment and financial status, Journal of Finance, 54 (2): 673-692. （pp.684-685）

连玉君, 彭方平, 苏治, 2010, 融资约束与流动性管理行为, 金融研究, (10): 158-171. （pp.164）

其它基于 Permutation test 的检验

-mtest- 命令基于组合检验的思想来检验两个样本组是否具有相同的分布（Stata Journal, 11-2, http://www.stata-journal.com/sjpdf.html?articlenum=st0228）；
-tsrtest-， -mwtest- 命令用于检验两个样本组的均值，中位数，方差等多个维度的差异（Stata Journal, 9-1, http://www.stata-journal.com/sjpdf.html?articlenum=st0158）
上述命令都可以使用 - findit - 搜索到，或直接用 - ssc install 命令名称 - 下载安装。

小结

方法1（加入交乘项）在多数模型中都可以使用，但要注意其背后的假设条件是比较严格的。若在混合回归中，只引入你关心的那个变量（ttl_exp）与分组变量 (black) 的交乘项（ttl_exp*black），则相当于假设其他控制变量在两组之间的不存在系数差异。相对保守的处理方法是：在混合估计时，引入所有变量与分组变量的交乘项，同时附加 vce(robust) 选项，以克服异方差的影响。
方法2（基于 SUR 模型的检验）执行起来也比较方便，假设条件也比较宽松：允许两组中所有变量的系数都存在差异，也允许两组的干扰项具有不同的分布，且彼此相关。局限在于，有些命令无法使用 -suest- 执行联合估计，如几乎所有针对面板数据的命令都不支持（-xtreg-， -xtabond- 等）。
方法3（组合检验）是三种方法中假设条件最为宽松的，只要求原始样本是从母体中随机抽取的（看似简单，但很难检验，只能靠嘴说了），而对于两个样本组中干扰项的分布，以及衡量组间系数差异的统计量
的分布也未做任何限制。事实上，在获取经验 p 值的过程中，我们采用的是“就地取材”、“管中窥豹”的思路，并未假设

的分布函数；另一个好处在于可以适用于各种命令，如 regress，xtreg，logit, ivregress 等，而 -suest- 则只能应用于部分命令。
方法无优劣。无论选择哪种方法，都要预先审视一下是否符合这些检验方法的假设条件。

2018.4.11更新：该文已发表
连玉君, 廖俊平, 2017, 如何检验分组回归后的组间系数差异?, 郑州航空工业管理学院学报 35, 97-109. [PDF 原文下载]

相关课程

连享会-直播课 上线了！ http://lianxh.duanshu.com 免费公开课：

直击面板数据模型 - 连玉君，时长：1 小时 40 分钟
Stata 33 讲 - 连玉君, 每讲 15 分钟.
部分直播课 课程资料下载 (PPT，dofiles 等)

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第6张图片

课程一览

支持回看，所有课程可以随时购买观看。 连享会 - 文本分析与爬虫 - 专题视频 主讲嘉宾：司继春 || 游万海

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第7张图片

连享会 - 效率分析专题 已上线：可随时购买学习+全套课件， 课程主页 已经放置板书和 FAQs 主讲嘉宾：连玉君 | 鲁晓东 | 张宁 课程主页， 微信版 https://gitee.com/arlionn/TE

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第8张图片

Note: 部分课程的资料，PPT 等可以前往 连享会-直播课 主页查看，下载。

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第9张图片

关于我们

Stata 连享会 由中山大学连玉君老师团队创办，定期分享实证分析经验。直播间 有很多视频课程，可以随时观看。
连享会-主页 和 知乎专栏，300+ 推文，实证分析不再抓狂。
公众号推文分类：计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类，主流方法介绍一目了然：DID, RDD, IV, GMM, FE, Probit 等。

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第10张图片

连享会小程序：扫一扫，看推文，看视频……

两个PDF比较标出差异_[连玉君专栏]如何检验分组回归后的组间系数差异？_第11张图片

扫码加入连享会微信群，提问交流更方便

http://qr32.cn/BRPFg5 (二维码自动识别)

你可能感兴趣的:(两个PDF比较标出差异)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
配音助手：自媒体神器，内置海量音色的语音，支持多主播配音阿幸软件杂货间媒体
软件介绍内置文字转语音，提供多个主播音色，男声、女声、小孩、方言。支持的场景也是比较多，比如：广告促销、有声读物、广播配音、影视配音、Ai配音等。这个软件是免费的，只不过需要通过手机号码登录就可以使用全部功能了。软件下载夸克下载
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
cvc降噪和主动降噪_音频知识：CVC降噪和ANC主动降噪的区别和应用汪国 cvc降噪和主动降噪
原标题：音频知识：CVC降噪和ANC主动降噪的区别和应用降噪，对于需要长时间戴耳机的人群来讲，起到了很好的保护作用。然而在购买蓝牙耳机时总会听到商家在宣传耳机所具备的CVC、ANC降噪功能，尽管听过很多商家描述，有些小伙伴依然不是很明白这两者之间的区别以及应用。现在简单和大家介绍这两个看不懂的降噪名词。CVC降噪(ClearVoiceCapture)是通话软件降噪技术。工作原理是是通过耳机内置的消
小林渗透入门：burpsuite+proxifier抓取小程序流量 ξ流ぁ星ぷ132 小程序 web安全安全性测试网络安全安全
目录前提：代理：proxifier：步骤：bp证书安装bp设置代理端口：proxifier设置规则：proxifier应用规则：结果：前提：在介绍这两个工具具体实现方法之前，有个很重要的技术必须要大概了解才行---代理。代理：个人觉得代理，简而言之，就是在你和服务器中间的一个中间人，来转达信息。那为什么要代理呢，因为这里的burpsuite要抓包，burpsuite只有做为中间代理人才可以进行拦截
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Excel控件Spire.XLS 更新至7.12.144 | 附下载 cocacola456 文档管理更新 Excel控件 Spire.XLS更新 Spire.XLS Spire.XLS下载
Excel控件Spire.XLS更新至7.12.144，修复了转换PDF时字幕对齐的问题。Spire.XLS7.12.144更新修复修复了将Chart转换为Image时图表数据标签重复的问题。修复了CalculateAllValue方法抛出异常的问题。修复了将工作表转换为PDF时图表字幕对齐不正确的问题。
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
C++设计秘籍：为什么所有参数都需类型转换时，非成员函数才是王道？讳疾忌医丶 c++前端开发语言
当所有参数都需要类型转换时，为什么要选择非成员函数？在C++的世界里，有一个看似简单却蕴含深意的设计原则：当所有参数（包括被this指针所指的那个隐式参数）皆须进行类型转换时，请为此采用非成员函数实现。这个原则背后隐藏着C++类型系统的精妙设计，也揭示了成员函数与非成员函数在处理隐式类型转换时的本质差异。想象一下，你正在设计一个数学计算库，需要支持整数与有理数的混合运算。如果你天真地将所有操作都实
【DBC】DBC中CAN信号多路复用徐饼干 DBC 程序人生其他经验分享
DBC文件信号多路复用详解1何时定义有些信号比较长，但是又不常用，就可以定义多路复用信号以节约空间。2具体定义2.1定义一个短信号来当做“控制开关”。【若定义1bit，则有2种可能0x00和0x01，复用两路】【若定义2bit，则有4种可能0x00和0x01和0x10和0x11，复用四路】…所以说，这个短信号的长度和你想复用多少路有关，多长？放在什么位置？由定义者决定2.2节约空间是如何体现的现在
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
初始化列表与类型转换（C++） 2401_89195731 c++开发语言
初始化列表和构造函数体在C++中都是用于给类的成员变量赋初值区别：初始化列表是给每个成员变量定义初始化的地方，即使有成员变量没有给它显式在初始化列表初始化，它也会走初始化列表初始化时机初始化列表：在对象创建时，成员变量通过初始化列表被直接初始化，这发生在构造函数体执行之前。构造函数体内赋值：成员变量首先被默认初始化，然后在构造函数体内通过赋值语句进行赋值。性能差异初始化列表：通常更高效，因为它避免
Flutter基础（前端教程⑥-按钮切换） aaiier Flutter flutter 前端状态模式
1.假设你已有的两个表单组件（示例）//手机号注册表单（示例）classPhoneRegisterFormextendsStatelessWidget{@overrideWidgetbuild(BuildContextcontext){returnColumn(children:[TextField(decoration:InputDecoration(labelText:'手机号')),Text
flutter知识点 ZhDan91 flutter
#时隔4年了#4年前用flutter开发海外项目和医疗项目。绘制界面的语法与html还是较类似的。把这些封印的记忆和技术回顾一下，最开始是开发Android出身的，所以开发起flutter来依旧是用的androidstudio开发工具。整理下用到的知识点：整理来源：flutter面试题——基础篇（1）-CSDN博客1、Dart是单线程的。在单线程中以消息循环来运行的。其中敖汉两个任务队列。一个是微
el-timeline时间线（Plus）左边图标改为自定义图片顾尘眠 javascript 前端 vue.js
（目前图片有点小，还需要自己去调整下大概样式，比较懒，就放了个大概样子）时间线左侧正常根据文档内容，是填写的icon，但通过icon属性还有另外一个类型，component，可以搭配h函数写一组img元素，实现将图标改为本地图片{{activity.content}}import{h}from'vue'constactivities=[{content:'Eventstart',timestamp
C++STL-set s15335 C++STL c++开发语言
一.基础概念set也是一种容器，像vector,string这样，但它是树形容器。在物理结构上是二叉搜索树，逻辑上还是线性结构。set容器内元素不可重复，multiset内容器元素可以重复；这两个容器，插入的元素都是有序排列。二.基础用法1.set对象创建1.默认构造函数sets1;2.初始化列表sets2_1={9,8,7,6,5};//56789sets2_2({9,8,7,7,6,5});/
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
Python uWSGI 安装配置 AI老李 python python 开发语言
关键要点uWSGI安装和配置适合PythonWSGI应用，资源丰富，适合初学者和中级用户。推荐菜鸟教程和官方文档，涵盖Linux和Windows环境。配置需注意操作系统差异和框架（如Django、Flask）需求。安装步骤uWSGI安装通常通过pip或源码编译完成。以下是基本步骤：Linux：安装依赖（如build-essentialpython-dev），然后用pipinstalluwsgi或编
11. TCP 滑动窗口、拥塞控制是什么，有什么区别 yqcoder 前端面试-服务协议 tcp/ip 网络 php
总结滑动窗口：早期网络，通信双方不考虑网络拥挤情况，导致掉包。滑动窗口大小意味着有多少缓冲区接受数据。拥塞控制：防止过多数据注入网络中，拥塞控制是一个全局过程，控制网络流量。区别：滑动窗口解决掉包问题，拥塞控制解决网络拥塞问题。TCP滑动窗口与拥塞控制详解在TCP协议中，为了实现可靠传输和高效通信，引入了两个核心机制：滑动窗口（SlidingWindow）和拥塞控制（CongestionContr
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc