Noob_daniel

Greedy Match学习笔记一 —— 匹配原理及SAS实现

Greedy Match 是基于 Greedy Algorithm 的思想，根据实验组样本在受到特定干预前的各项属性，贪婪的、不放回的生成一个虚拟对照组的方法。该方法的思想清晰透明，且可以根据需要灵活调整约束条件。在大样本的情况下，可以很好的生成所需的对照组。

Greedy Algorithm(贪婪算法)简介

基本思想

贪婪算法的核心在于，在每一个阶段，都选择当前阶段的局部最优解。在大多数情况下，依靠这种方法并不能得到全局最优解，但这个算法可以很有效率的逼近全局最优，而且它得到的路径在每个小范围内来看都是“很优秀”的。

构造逻辑

在生成虚拟对照组这一问题上，Greedy Algorithm的思路如下：
1. 不放回。
按一定的逻辑从实验组取出一样本，然后在对照池（control pool）中寻找最佳匹配。成功后再取另一样本，从剩余的对照池中寻找最佳匹配。若还存在阈值，则每次需检查最佳匹配间的距离是否超过阈值，若超过则需舍弃。

2. 1:K mapping。
若K>1，则先对实验组的全部样本1:1寻找其最佳匹配，再将整个过程重复K次（不放回）。

何为最佳匹配

最佳匹配意味着对照池中的该样本和选取的样本距离最近。
下面是几种常见的距离定义：
1. 欧氏距离（Euclidean distance）

d 1 (x ⃗, y ⃗) = (x 1 - y 1) 2 + \dots + (x n - y n) 2 - - - - - - - - - - - - - - - - - - - - - - \sqrt

2. 曼哈顿距离（Manhattan Distance）

d 2 (x ⃗, y ⃗) = | x 1 - y 1 | + \dots + | x n - y n |

3. 马氏距离（Mahalanobis distance）

d 3 (x ⃗, y ⃗) = (x ⃗ - y ⃗) T S - 1 (x ⃗ - y ⃗) - - - - - - - - - - - - - - - - \sqrt

其中

S−1 是

x⃗ 和

y⃗ 之间协方差矩阵的逆。（协方差与马氏距离的理解）
4. 倾向性分数（Propensity Score）
这是一个非常常用的分数，当给定一个样本

xi→ ，它的Propensity Score为：

e (x i \to) = p r (Z i = 1 | X i = x i)

它的意义是该样本被划分到实验组的概率。
若采用该距离，则每次我们需要从对照池中选取分数和实验组样本最接近的那个作为最佳匹配。

如何用SAS实现Greedy Match

方案选取及原因

选用贪婪算法(Greedy Match)而非全局最优(Optimal)
Greedy Match效率要高很多。
而且在深度研究中需要对样本进行多维度的分拆，全局最优算法难以保证每次分拆后T和C的样本表现都是近似的。
对于用户属性等离散变量要求其强制相同，仅对于购买金额和频次等连续变量计算距离。
这一方法可以显著提高效率，不仅减少了需要匹配的变量数量，而且所有的计算都可以被分拆到不同的小格子里进行。
选用欧氏距离和曼哈顿距离
若使用propensity score，则需对海量样本进行logistic回归，耗时甚久。

SAS 代码

关于代码目的和所需数据/参数的描述

   /*------------------------------------------------------------------*
   | MACRO NAME  : gmatch
   | SHORT DESC  : Match 1 or more controls to cases using the
   |               GREEDY algorithm
   *------------------------------------------------------------------*
   | CREATED BY  : Kosanke, Jon                  (04/07/2004 16:32)
   |             : Bergstralh, Erik
   *------------------------------------------------------------------*
   | PURPOSE
   |
   | GMATCH Macro to match 1 or more controls for each of N cases
   | using the GREEDY algorithm--REPLACES GREEDY option of MATCH macro.
   | Changes:
   | --cases and controls in same dataset
   | --not mandatory to randomly pre-ort cases and controls, but recommended
   | --options to transform X's and to choose distance metric
   | --input parameters consistent with %DIST macro for optimal matching
   |
   | *******
   |
   | Macro name: %gmatch
   |
   | Authors: Jon Kosanke and Erik Bergstralh
   |
   | Date: July 23, 2003
   |       October 31, 2003...tweaked print/means based on "time" var
   |
   | Macro function:
   |
   | Matching using the GREEDY algorithm
   |
   | The purpose of this macro is to match 1 or more controls(from a total
   | of M) for each of N cases.  The controls may be matched to the cases by
   | one or more factors(X's).  The control selected for a particular
   | case(i) will be the control(j) closest to the case in terms of Dij.
   | Dij can be defined in multiple ways. Common choices are the Euclidean
   | distance and the weighted sum of the absolute differences between the
   | case and control matching factors.  I.e.,
   |
   |     Dij= SQRT [SUM { W.k*(X.ik-X.jk)**2} ],  or
   |
   |     Dij= SUM { W.k*ABS(X.ik-X.jk) },
   |
   |                                      where the sum is over the number
   |                                      of matching factors X(with index
   |                                      k) and W.k = the weight assigned
   |                                      to matching factor k and X.ik =
   |                                      the value of variable X(k) for
   |                                      subject i.
   |
   | The control(j) selected for a case(i) is the one with the smallest Dij
   | (subject to constraints DMAX and DMAXK, defined below). In the case of
   | ties, the first one encountered will be used. The higher the user-defined
   | weight, the more likely it is that the case and control will be matched
   | on the factor.  Assign large weights (relative to the other weights) to
   | obtain exact matches for two-level factors such as gender. An option to
   | using weights might be to standarize the X's in some fashion. The macro
   | has options to standardize all X's to mean 0 and variance 1 and to use
   | ranks.
   |
   | The matching algorithm used is the GREEDY method. Using the greedy method,
   | once a match is made it is never broken.  This may result in inefficiencies
   | if a previously matched control would be a better match for the current
   | case than those controls currently available. (An alternative method is to
   | do optimal matching using the VMATCH & DIST macros. This method guarantees
   | the best possible matched set in terms of minimizing the total Dij.)
   | The GREEDY method generally produces very good matches, especially if the
   | control pool is large relative to the number of cases. When  multiple
   | controls/case are desired, the algorithm first matches 1 control to all
   | cases and then proceeds to select second controls.
   |
   |
   | The gmatch macro checks for missing values of matching variables and the
   | time variable(if specified) and deletes those observations from the input
   | dataset.
   |
   | Call statement:
   |
   |
   | %gmatch(data=,group=,id=,
   |       mvars=,wts=,dmaxk=,dmax=,transf,
   |       time=, dist=,
   |       ncontls=,seedca=,seedco=,
   |       out=,outnmca=,outnmco=,print=);
   |
   | Parameter definitions(R=required parameter):
   |
   |
   |  R    data  SAS data set containing cases and potential controls. Must
   |             contain the ID, GROUP, and the matching variables.
   |
   |  R    group SAS variable defining cases. Group=1 if case, 0 if control.
   |
   |  R     id   SAS CHARACTER ID variable for the cases and controls.
   |
   |
   |  R   mvars  List of numeric matching variables common to both case and
   |             control data sets.  For example, mvars=male age birthyr.
   |
   |  R     wts  List of non-negative weights corresponding to each matching
   |             variable.  For example wts=10 2 1 corresponding to male, age
   |             and birthyr as in the above example.
   |
   |      dmaxk  List of non-negative values corresponding to each matching
   |             variable.  These numbers are the largest possible absolute
   |             differences compatible with a valid match.  Cases will
   |             NOT be matched to a control if ANY of the INDIVIDUAL
   |             matching factor  differences are >DMAXK.  This optional
   |             parameter allows one to form matches of the type male+/-0,
   |             age+/-2, birth year+/-5 by specifying DMAXK=0 2 5.
   |
   |      dmax   Largest value of Dij considered to be a valid match.  If
   |             you want to match exactly on a two-level factor(such as
   |             gender coded as 0 or 1) then assign DMAX to be less than
   |             the weight for the factor.  In the example above, one could
   |             use wt=10 for male and dmax=9.  Leave DMAX blank if any
   |             Dij is a valid match.  One would typically NOT use both
   |             DMAXK and DMAX.  The only advantage to using both, would be
   |             to further restrict potential matches that meet the
   |             DMAXK criteria.
   |
   |       dist  Indicates type of distance to calculate.
   |
   |             1=weighted sum(over matching vars) of
   |             absolute case-control differences(default)
   |
   |             2=weighted Euclidean distance
   |
   |       time  Time variable used for risk set matching.  Matches are only
   |             valid if the control time > case time. May need to
   |
   |     transf  Indicates whether all matching vars are to be transformed
   |             (using the combined case+control data) prior to computing
   |             distances.  0=no(default),
   |                         1=standardize to mean 0 and variance 1,
   |                         2=use ranks of matching variables.
   |
   |    ncontls  Indicates the number of controls to match to each case.  The
   |             default is 1.  With multiple controls per case, the algorithm
   |             will first match every case to one control and then again
   |             match each case to a second control, etc.  Controls selected
   |             on the first pass will be stronger matches than those selected in
   |             later rounds.  The output data set contains a variable (cont_n)
   |             which indicates on which round the control was selected.
   |
   |    seedca   Seed value used to randomly sort the cases prior to
   |             matching. This positive integer will be used as input to
   |             the RANUNI function.  The greedy matching algorithm is
   |             order dependent which, among other things means that
   |             cases matched first will be on average more similar to
   |             their controls than those matched last(as the number of
   |             control choices will be limited).  If the matching order
   |             is related to confounding factors (possibly age or
   |             calendar time) then biases may result.  Therefore it is
   |             generally considered good practice when using the GREEDY
   |             method to randomly sort both the cases and controls
   |             before beginning the matching process.
   |
   |    seedco   Seed value used to randomly sort the controls prior to
   |             matching using the GREEDY method.  This seed value must
   |             also be a positive integer.
   |
   |
   | print= Option to print data for matched cases. Use PRINT=y to
   |        print data and PRINT=n or blank to not print.  Default is y.
   |
   |        out=name of SAS data set containing the results of the matching
   |            process.  Unmatched cases are not included.  See outnm
   |            below.  The default name is __out.  This data set will have
   |            the following layout:
   |
   |          Case_id  Cont_id  Cont_n  Dij  Delta_caco MVARS_ca  MVARS_co
   |             1        67      1     5.2  (Differences & actual
   |             1        78      2     6.1   values for matching factors
   |             2        52      1     2.9   for cases & controls)
   |             2        92      2     3.1
   |             .        .       .      .
   |             .        .       .      .
   |
   |        outnmca=name of SAS data set containing NON-matched cases.
   |                Default name is __nmca .
   |
   |        outnmco=name of SAS data set containing NON-matched controls.
   |                Default name is __nmco .
   |        REUSE= Option allow a control can be reused after it's matched to 1 test if REUSE <>0.
   |
   |  References:  Bergstralh, EJ and Kosanke JL(1995).  Computerized
   |               matching of controls.  Section of Biostatistics
   |               Technical Report 56.  Mayo Foundation.
   |
   |
   |  Example: 1-1 matching by male(exact), age(+-2) and year(+-5).
   |           The wt for male is not relevant, as only exact matches
   |           on male will be considered.  The weight for age(2) is
   |           double that for year(1).
   |
   |
   |       %gmatch(data=all, group=ca_co,id=clinic,
   |              mvars=male age_od yr_od,
   |              wts=2 2 1, dmaxk=0 2 5,out=mtch,
   |              seedca=87877,seedco=987973);
   |
   *------------------------------------------------------------------*
   | OPERATING SYSTEM COMPATIBILITY
   |
   | UNIX SAS v8   :   YES
   | UNIX SAS v9   :
   | MVS SAS v8    :
   | MVS SAS v9    :
   | PC SAS v8     :
   | PC SAS v9     :
   *------------------------------------------------------------------*
   | EXAMPLES
   |
   | Another example is located at the bottom of the code.
   *------------------------------------------------------------------*/

代码正文

%MACRO GMATCH(DATA=,GROUP=,ID=,
             MVARS=,WTS=,DMAXK=,DMAX=,DIST=1,
             NCONTLS=1, TIME=,TRANSF=0,
             SEEDCA=,SEEDCO=,PRINT=y,
             OUT=__OUT,OUTNMCA=__NMCA,OUTNMCO=__NMCO,REUSE=0);

   %LET BAD=0;

   %IF %LENGTH(&DATA)=0 %THEN %DO;
      %PUT ERROR: NO DATASET SUPPLIED;
      %LET BAD=1;
   %END;

   %IF %LENGTH(&ID)=0 %THEN %DO;
      %PUT ERROR: NO ID VARIABLE SUPPLIED;
      %LET BAD=1;
   %END;

   %IF %LENGTH(&GROUP)=0 %THEN %DO;
      %PUT ERROR: NO CASE(1)/CONTROL(0) GROUP VARIABLE SUPPLIED;
      %LET BAD=1;
   %END;

   %IF %LENGTH(&MVARS)=0 %THEN %DO;
      %PUT ERROR: NO MATCHING VARIABLES SUPPLIED;
      %LET BAD=1;
   %END;

  %IF %LENGTH(&WTS)=0 %THEN %DO;
      %PUT ERROR: NO WEIGHTS SUPPLIED;
      %LET BAD=1;
   %END;

   %LET NVAR=0;
   %DO %UNTIL(%SCAN(&MVARS,&NVAR+1,' ')= );
      %LET NVAR=%EVAL(&NVAR+1);
   %END;
   %LET NWTS=0;
   %DO %UNTIL(%QSCAN(&WTS,&NWTS+1,' ')= );
      %LET NWTS=%EVAL(&NWTS+1);
   %END;
   %IF &NVAR^= &NWTS %THEN %DO;
      %PUT ERROR: #VARS MUST EQUAL #WTS;
      %LET BAD=1;
   %END;

  %LET NK=0;
   %IF %QUOTE(&DMAXK)^=  %THEN %DO %UNTIL(%QSCAN(&DMAXK,&NK+1,' ')= );
      %LET NK=%EVAL(&NK+1);
   %END;
   %IF &NK>&NVAR %THEN %LET NK=&NVAR;
   %DO I=1 %TO &NVAR;
      %LET V&I=%SCAN(&MVARS,&I,' ');
   %END;

  %IF &NWTS>0 %THEN %DO;
        DATA _NULL_;
        %DO I=1 %TO &NWTS;
             %LET W&I=%SCAN(&WTS,&I,' ');
             IF &&W&I<0 THEN DO;
                  PUT 'ERROR: WEIGHTS MUST BE NON-NEGATIVE';
                  CALL SYMPUT('BAD','1');
             END;
        %END;
        RUN;
   %END;

  %IF &NK>0 %THEN %DO;
        DATA _NULL_;
        %DO I=1 %TO &NK;
             %LET K&I=%SCAN(&DMAXK,&I,' ');
             IF &&K&I<0 THEN DO;
                  PUT 'ERROR: DMAXK VALUES MUST BE NON-NEGATIVE';
                  CALL SYMPUT('BAD','1');
             END;
        %END;
        RUN;
   %END;

    %MACRO MAX1;
      %IF &DMAX^= %THEN %DO;
         & __D<=&DMAX
      %END;
      %DO I=1 %TO &NK;
         & ABS(__CA&I-__CO&I)<=&&K&I
      %END;
    %MEND MAX1;

    %MACRO REUSE1;
      %IF &REUSE =0 %THEN %DO;

      %END;
      %ELSE %DO;
          OR __USED(__K)<__J
      %END;
    %MEND REUSE1;

   %macro greedy;
    %GLOBAL BAD2;

       data __CHECK; set &DATA;
          __id=&id;
          if __id="" then delete;
          %DO I=1 %TO &NVAR;
                IF %scan(&mvars,&i)=. THEN DELETE;
           %END;
           %IF &TIME^= %THEN %DO;
                IF &TIME=. THEN DELETE;
           %END;
       run;

      *** transform data if requested/separate cases & controls;
      %if &transf=1 %then %do;
      proc standard data=__check m=0 s=1 out=_stdzd; var &mvars;
      data _caco;
        set _stdzd;
      %end;

      %if &transf=2 %then %do;
      proc rank data=__check out=_ranks; var &mvars;
      data _caco;
        set _ranks;
      %end;

      %if &transf=0 %then %do;
      data _caco;
        set __check;
      %end;


      DATA __CASE; SET _caco;
           if &group=1;
      DATA __CASE; SET __CASE END=EOF;
       KEEP __IDCA __CA1-__CA&NVAR __R &mvars
         %if &time^= %then %do;
             __catime
         %end;
          ;
         __IDCA=&ID;
         %if &time^= %then %do;
            __catime=&time;
         %end;
         %DO I=1 %TO &NVAR;
            __CA&I=&&V&I;
         %END;
         %if &seedca^= %then %do;
         SEED=&SEEDCA;
         __R=RANUNI( SEED  );
         %end;
         %else %do;
         __R=1;
         %end;

         IF EOF THEN CALL SYMPUT('NCA',_N_);
      PROC SORT; BY __R __IDCA;

      DATA __CONT; SET _caco;
         if &group=0;
      DATA __CONT; SET __CONT END=EOF;
       KEEP __IDCO __CO1-__CO&NVAR __R &mvars
        %if &time^= %then %do;
           __cotime
        %end;
        ;
         __IDCO=&ID;
         %if &time^= %then %do;
            __cotime=&time;
         %end;
         %DO I=1 %TO &NVAR;
            __CO&I=&&V&I;
         %END;
         %if &seedco^= %then %do;
         SEED=&SEEDCo;
         __R=RANUNI( SEED  );
         %end;
         %else %do;
         __R=1;
         %end;

         IF EOF THEN CALL SYMPUT('NCO',_N_);
      RUN;
      %LET BAD2=0;
      %IF &NCO < %EVAL(&NCA*&NCONTLS) %THEN %DO;
         %PUT WARNING: NOT ENOUGH CONTROLS TO MAKE REQUESTED MATCHES;
         /*%LET BAD2=1;*/
      %END;

      %IF &BAD2=0 %THEN %DO;
         PROC SORT; BY __R __IDCO; RUN;

         DATA __MATCH;
          KEEP __IDCA __CA1-__CA&NVAR __DIJ __MATCH __CONT_N
          %if &time^= %then %do;
             __catime __cotime
          %end;
          ;

          ARRAY __USED(&NCO) 8 _TEMPORARY_;
            DO __I=1 TO &NCO;
               __USED(__I)=0;
            END;
            DO __J=1 TO &NCA;
               DO __I=1 TO &NCONTLS;
                  SET __CASE POINT=__J;
                  __SMALL=.;
                  __MATCH=.;
                  DO __K=1 TO &NCO;
                     IF __USED(__K)=0 %REUSE1 THEN DO;
                        SET __CONT POINT=__K;

                       %if &dist=2 %then %do;
                        **wtd euclidian dist;
                         __D= sqrt(
                         %do k=1 %to &nvar;
                         %scan(&wts,&k)*(__ca&k - __co&k)**2
                         %if &k<&nvar %then + ;
                        %end;
                         );
                       %end;
                       %else %do;
                        **wtd sum absolute diff;
                         __D=
                        %do k=1 %to &nvar;
                        %scan(&wts,&k)*abs(__ca&k - __co&k )
                        %if &k<&nvar %then + ;
                        %end;
                          ;
                       %end;

                        IF __d^=. & (__SMALL=. | __D<__SMALL) %MAX1
                        %if &time^= %then %do;
                           & __cotime > __catime
                        %end;
                        THEN DO;
                           __SMALL=__D;
                           __MATCH=__K;
                           __DIJ=__D;
                           __CONT_N=__I;
                        END;
                     END;
                  END;
                  IF __MATCH^=. THEN DO;
                     __USED(__MATCH)=__J;
                     OUTPUT;
                  END;
               END;
            END;
            STOP;
         DATA &OUT;
          SET __MATCH;
          SET __CONT POINT=__MATCH;
          KEEP __IDCA __IDCO __CONT_N __DIJ __CA1-__CA&NVAR
               __CO1-__CO&NVAR __d1-__d&nvar __absd1-__absd&nvar  __WT1-__WT&NVAR
                  __catime __cotime __dtime;

          %if &time= %then %do;
              __cotime=.; __catime=.;
          %end;
          LABEL
                   __catime="&time/CASE"
                   __cotime="&time/CONTROL"
                   __dtime="&time/ABS. DIFF"
                __CONT_N='CONTROL/NUMBER'
                __DIJ='DISTANCE/D_IJ'
               %DO I=1 %TO &NVAR;
                __CA&I="&&V&I/CASE"
                __CO&I="&&V&I/CONTROL"
                __absd&I="&&V&I/ABS. DIFF "
                __d&I="&&V&I/DIFF "
                __WT&I="&&V&I/WEIGHT"
              %END;
                ;
             %DO I=1 %TO &NVAR;
                __d&i= (__CA&I-__CO&I);      **raw diff;
                __absd&I=abs(__CA&I-__CO&I); **abs diff;
                __WT&I=&&W&I;
             %END;
                __dtime=__cotime-__catime;

         PROC SORT DATA=&OUT; BY __IDCA __CONT_N;
         proc sort data=__case; by __IDCA;
         data &outnmca; merge __case
              &out(in=__inout where=(__cont_n=1)); by __idca;
              if __inout=0; **non-matches;

         proc sort data=__cont; by __IDCO;
         proc sort data=&out; by __IDCO;
         data &outnmco; merge __cont
              &out(in=__inout); by __idco;
              if __inout=0; **non-matched controls;
         proc sort data=&out; by __IDCA; **re-sort by case id;

       %if %upcase(&print)=Y %then %do;
         PROC PRINT data=&out LABEL SPLIT='/';
          VAR __IDCA __IDCO __CONT_N

           __DIJ
          %DO I=1 %TO &NVAR;
           __absd&I
          %END;
          %if &time^= %then %do;
           __dtime
          %end;
          %DO I=1 %TO &NVAR;
           __CA&I __CO&I
          %END;
          %if &time^= %then %do;
           __catime __cotime
          %end;
           ;
          sum __dij;

         title9'Data listing for matched cases and controls';
         footnote"Greedy matching(gmatch) macro: data=&data group=&group id=&id    ";
         footnote2"   mvars=&mvars  wts=&wts dmaxk=&dmaxk dmax=&dmax ncontls=&ncontls";
         footnote3"   transf=&transf dist=&dist time=&time seedca=&seedca  seedco=&seedco";
         footnote4"   out=&out   outnmca=&outnmca  outnmco=&outnmco";
         run;
         title9'Summary data for matched cases and controls--one obs/control';
          %if &sysver ge 8 %then %do;
         proc means data=&out  maxdec=3 fw=8
           n mean median min p10 p25 p75 p90 max sum;
         %end;
         %else %do;
         proc means data=&out maxdec=3
          n mean min max sum;
         %end;
         class __cont_n;
          var __dij

              %do I=1 %TO &NVAR;
                  __absd&I
              %end;
              %if &time^= %then %do;
                  __dtime
              %end;
              %do I=1 %TO &NVAR;
                  __ca&I
              %end;
              %if &time^= %then %do;
                  __catime
              %end;
              %do I=1 %TO &NVAR;
                  __co&I
              %end;
              %if &time^= %then %do;
                  __cotime
              %end;
                 ;
         run;
         *** estimate matching var means within matched sets for controls;
         proc means data=&out  n mean noprint; by __idca;
          var __dij
         %do i=1 %to &nvar;
            __co&i
         %end;
              __cotime
            ;
         output out=_mcont n=n_co mean=__dijm
         %do i=1 %to &nvar;
           __com&i
         %end;
             __tcom
           ;
         data _onecase; set &out; by __idca; if first.__idca;
         data __camcon; merge _onecase _mcont; by __idca;

         keep __idca n_co __dijm
             __dtime __catime  __tcom
          %do i=1 %to &nvar;
           __ca&i __com&i  __actd&i __absd&i
          %end;
         ;


         %do i=1 %to &nvar;
         __absd&i=abs(__ca&i - __com&i);
         __actd&i=(__ca&i - __com&i);
        %end;
         __dtime=__tcom-__catime
          ;

       label
        n_co="No./CONTROLS"
        __dijm="Average/Dij"
        __dtime="&time/Mean Time DIFF"
        __tcom="&time/Mean CONT TIME"

       %do i=1 %to &nvar; %let vvar=%scan(&mvars,&i);
         __absd&i="&vvar/Mean ABS. DIFF"
         __com&i="&vvar/Mean CONTROL"
       %end;
         ;
      title9'Summary data for matched cases and controls--one obs/case(using average control value)';
      %if &sysver ge 8 %then %do;
      proc means data=__camcon maxdec=3 fw=8
        n mean median min p10 p25 p75 p90 max sum;
      %end;
      %else %do;
      proc means data=__camcon maxdec=3
        n mean min max sum;
      %end;
      var n_co __dijm
      %do i=1 %to &nvar;
       __absd&i
      %end;
      %if &time^= %then %do;
       __dtime
      %end;
      %do i=1 %to &nvar;
      __ca&i
      %end;
      %if &time^= %then %do;
       __catime
      %end;
      %do i=1 %to &nvar;
      __com&i
      %end;
      %if &time^= %then %do;
      __tcom
      %end;
          ;
    %end; **end of print=y loop**;
   %END;  **end of bad2=0 loop**;
   run;
   title9; footnote;
   run;

   %mend greedy;

   %IF &BAD=0 %THEN %DO;
         %GREEDY
   %END;
%MEND GMATCH;

一个例子

   /*  **test data;
DATA FAKEREG;
        DO I = 1 TO 3000;
                *id = _n_;
                 id=i;
                SEX = MOD(I, 2);
                IF mod(I, 21) THEN CASE = 0; ELSE CASE = 1;
                *AGE = (INT(RANUNI(12378937)*10000)/100);
                 age= int(ranuni(123789837)*100);
                DROP i ;
                OUTPUT;
        END;

RUN;
data fakereg;set fakereg; timex=5; if case=0 then timex=6;

%gmatch(data=fakereg,group=case, id=id,
       mvars=age sex,wts=2 1,dmaxk= 5 0, transf=0,
       time=timex, dist=1, ncontls=1,seedca=234098,seedco=0489,
       out=regccout,outnmco=matched,print=Y);
           run;
  */

总结

在没有预设对照组的情况下，Greedy Match绝对是一个非常好用的生成虚拟对照组的方法。但在使用的过程中也一定要注意，根据控制变量法的思路，添加足够的限定条件。不然可能无法保证后面检测到的差异是由实验组和对照组的区别造成的。

Java 阻塞队列（BlockingQueue）实战与原理详解吴冰_hogan juc java 网络协议网络
引言在多线程编程中，BlockingQueue是一种非常有用的同步工具，它不仅提供了线程安全的队列访问方式，还能够自动处理生产者和消费者之间的阻塞行为。本文将基于提供的文档内容，深入探讨BlockingQueue的工作原理及其在实际应用中的使用方法，并详细介绍几种常见的BlockingQueue实现。一、阻塞队列基础1.1定义与特性BlockingQueue是一个接口，定义了支持阻塞插入和移除操作
【Docker】【Nacos】单机部署又言又语 Docker docker nacos 单机模式
【Docker】【Nacos】单机部署背景介绍环境步骤总结背景因国内访问DockerHub极不稳定，因此总结整理出本文，以便后续需要时方便查看。介绍本文介绍Docker安装Nacos并实现单机模式部署的方法及步骤。环境分类名称版本操作系统WindowsWindows11DockerDockerEngine25.0.3DockerDockerClient25.0.3DockerDockerDeskt
一、复杂度分析之——2、空间复杂度记得多吃点从零开始学算法算法 python
空间复杂度前言一、空间复杂度是什么？二、算法相关空间1、算法在运行过程中使用的内存空间主要包括以下几种。2、暂存空间可以进一步划分为三个部分。三、推算方法四、常见类型五、不同复杂度代码演示1、常数阶O(111)2、对数阶O(lognlog_nlogn)3、线性阶O(nnn)4、平方阶O(n2n^2n2)5、指数阶O(2n2^n2n)总结前言本文将介绍空间复杂度相关知识。如果下面内容看不懂的话，那就
Java中的注解与反射：深入理解getAnnotation(Class＜T＞ annotationClass)方法 AllenBright #Java基础 java 开发语言
Java的注解（Annotation）是一种元数据机制，它允许我们在代码中添加额外的信息，这些信息可以在编译时或运行时被读取和处理。结合Java的反射机制（Reflection），我们可以在运行时动态地获取类、方法、字段等元素上的注解信息。本文将深入探讨getAnnotation(ClassannotationClass)方法的使用和原理，帮助读者更好地理解Java中的注解与反射机制。1.什么是g
微服务架构设计基础之立方体模型 weixin_34349320 后端前端系统架构 ViewUI
背景对于现在的微服务架构的应用来说，对大量并发的及时响应是一项制胜能力。据用户行为分析平台统计，随行付的某一款APP产品每日请求就达到上千万次用户请求、加解密服务3000万次/日等等。这些微服务每时每刻在处理如此高强度的请求，对数据层的应对能力要求极高。如果我们把对速度的需求放在复杂的分布式数据架构背景下，是很难想象如何让应用应对如此巨大的数据访问量的。但很幸运，我们有方法做到。即立方体模型。立方
自定义数据集使用scikit-learn中的包实现线性回归方法对其进行拟合辞落山 scikit-learn 线性回归 python
1.引言简要介绍线性回归模型及其在机器学习中的应用。2.创建自定义数据集通过生成一个简单的自定义数据集来模拟问题。可以使用numpy生成数据。importnumpyasnpimportmatplotlib.pyplotasplt#生成自定义数据np.random.seed(42)X=2*np.random.rand(100,1)y=4+3*X+np.random.randn(100,1)3.使用s
python——格式化输出 pumpkin84514 python相关 python
Python提供了多种格式化输出的方法，常见的有以下几种：百分号（%）格式化str.format()方法f-string（格式化字符串字面量）模板字符串每种方法都有其独特的用法和适用场景。下面我们逐一详细讲解并举例说明。1.百分号（%）格式化这种方法类似于C语言中的printf格式，使用百分号（%）作为占位符。用法%s：字符串%d：整数%f：浮点数%%：百分号示例name="Alice"age=3
lambda函数使用方法 mm_exploration python 开发语言
目录lambda函数定义lambda函数基本语法lambda函数扩展用法lambda函数定义匿名函数lambda：是指一类无需定义标识符（函数名）的函数或子程序。所谓匿名函数，通俗地说就是没有名字的函数，lambda函数没有名字，是一种简单的、在同一行中定义函数的方法。lambda函数一般功能简单：单行expression决定了lambda函数不可能完成复杂的逻辑，只能完成非常简单的功能。由于其实
matlab——计算VPD（vapor pressure defict）小琳子要开心呀 MATLAB VPD 计算饱和水汽压 Goff-Gratch公式 matlab
需求：计算VPD（vaporpressuredefict）。介绍：饱和水汽压差（简称VPD）是指在一定温度下，饱和水汽压与空气中的实际水汽压之间的差值（百度百科）。因此，温室中VPD的理想范围是0.45kPa至1.25kPa，理想情况下约为0.85kPa。通常，大多数植物在VPD在0.8到0.95kPa之间时生长良好（维基百科）。计算方法：一、先计算饱和水汽压二、饱和水汽压减去实际水汽压。世界气象
分类算法：梯度提升树(GBT)算法原理 kkchenjj 数据挖掘机器学习算法分类数据挖掘
分类算法：梯度提升树(GBT)算法原理1.简介1.1梯度提升树的起源与发展梯度提升树(GradientBoostingTree,GBT)是一种强大的机器学习算法，它基于提升方法的原理，通过迭代地构建一系列弱分类器并组合它们来形成一个强分类器。GBT的起源可以追溯到Freund和Schapire在1996年提出的AdaBoost算法，但真正将梯度提升应用于树模型的是JeromeH.Friedman在
Z820安装Win7系统出现0X0000007B蓝屏报错无限重启的解决方法与相关问题 homelab HP Z系工作站商用电脑 windows 操作系统驱动程序
安装win7系统，一般有PE工具安装和ISO启动（光盘或U盘镜像）两种方法，但不管用哪种方法，都可能因没有加载硬盘驱动而失败，蓝屏在第二次重启后一闪而过，之后自动重启，陷入无限重启的死循环。这段信息为：AproblemhasbeendetectedandWindowshasbeenshutdowntopreventdamagetoyourcomputer.Ifthisisthefirsttimey
如何安全发布 CompletableFuture ？Java9新增方法分析 java
如何安全发布CompletableFuture？Java9新增方法分析本文未经允许禁止转载。JDK9中对于CompletableFuture做了新的增强，除了超时功能（orTimeout），还有面向继承、安全发布等相关方法。本文中，我们将详细分析各个新增方法，同时说明其安全发布的重要性，最后提出相关的实践原则。1.newIncompleteFuturepublicCompletableFuture
鸡尾酒疗法（信息学奥赛一本通-1072） Doopny@ 信息学奥赛一本通算法
【题目描述】鸡尾酒疗法，指“高效抗逆转录病毒治疗”。人们在鸡尾酒疗法的基础上又提出了很多种改进的疗法。为了验证这些治疗方法是否在疗效上比鸡尾酒疗法更好，可用通过临床对照实验的方式进行。假设鸡尾酒疗法的有效率为x，新疗法的有效率为y，如果y−x大于5%，则效果更好，如果x−y大于5%，则效果更差，否则称为效果差不多。下面给出n组临床对照实验，其中第一组采用鸡尾酒疗法，其他n−1组为各种不同的改进疗法
【python】如何将字符串列表转换为数值列表资源存储库算法强化学习 python 开发语言
目录【python】如何将字符串列表转换为数值列表方法1：使用Python的map()和float()或int()方法2：使用列表推导式(ListComprehension)方法3：使用pandas转换方法4：使用numpy转换总结：【python】如何将字符串列表转换为数值列表要将字符串列表转换为数值列表，可以使用Python的内置方法和pandas或numpy等工具。下面是几种常见的方法来实现
五种高频设计模式及其在 Spring 中的应用揭秘中國移动丶移不动设计模式 spring java 后端 spring boot
五种高频设计模式及其在Spring中的应用揭秘1.适配器模式（AdapterPattern）模式简介适配器模式是一种结构型设计模式，通过将一个接口转换为客户端期望的另一个接口，使得原本不兼容的接口可以协同工作。它的核心作用在于兼容性适配，解决“老接口”和“新需求”的冲突。模式结构目标接口：客户端期望使用的接口。适配器类：实现目标接口，并持有被适配者的引用，将被适配者的方法转换为目标接口的方法。被适
【Pandas】pandas Series describe liuweidong0802 Pandas Series pandas
Pandas2.2SeriesComputationsdescriptivestats方法描述Series.abs()用于计算Series中每个元素的绝对值Series.all()用于检查Series中的所有元素是否都为True或非零值（对于数值型数据）Series.any()用于检查Series中是否至少有一个元素为True或非零值（对于数值型数据）Series.autocorr()用于计算Se
AI DMP 数据基建：数据可视化与报表 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《AIDMP数据基建：数据可视化与报表》关键词：AIDMP，数据可视化，报表分析，数据处理技术，数据治理，企业应用，项目实战，未来发展趋势。摘要：本文旨在深入探讨AI驱动的数据管理平台（DMP）的数据基建，重点关注数据可视化与报表分析。通过详细解析数据可视化的基础、报表分析的方法，以及AIDMP的核心技术，本文将展示如何构建一个高效的数据基础设施，并探讨其在企业中的应用和未来发展趋势。《AIDMP
什么是零拷贝（Zero Copy）技术？它如何减少在数据传输过程中的性能开销？ fajianchen IT架构如何进行系统设计 linux 服务器高性能
零拷贝（ZeroCopy）技术是一种在计算机系统中优化数据传输的方法。传统上，在数据从一个地方传输到另一个地方时，需要多次的内存拷贝操作，这会导致性能开销。零拷贝技术的目标就是减少或避免这些不必要的内存拷贝，从而提高数据传输的效率。传统的数据传输过程中，例如从磁盘读取数据到应用程序的内存，通常会经历以下步骤：从磁盘读取数据到内核空间的缓冲区。将数据从内核空间的缓冲区复制到用户空间的应用程序缓冲区。
Surface Pro 指示灯亮但充不进电的解决办法 x66ccff 电脑维修经验分享
SurfacePro指示灯亮但充不进电的解决办法1、充电槽有灰尘方法：用力吹充电槽，然后再充电2、铜片氧化方法：去除表面氧化层3、插座故障导致电压偏低方法：换一个插座4、长时间充电导致不明原因的充电失败方法：（Microsoft社区建议方法）把磁吸充电头反着充十分钟，然后再正着充电即可恢复正常警告⚠：pro3机型不适用✔pro6适用5、其他原因方法：百度
Python教程：Python中如何优雅的合并两个字典！很酷的站长 Python python 开发语言
在Python的世界里，字典作为一种强大的数据结构，扮演着举足轻重的角色。而合并字典，则是我们经常遇到的操作。Python为我们提供了多种合并字典的方式，每种方式都有其独特的应用场景。今天，我们就来一起探索Python中合并两个字典的七种方法，找到最适合你的那一款！1.简单粗暴：update()方法update()方法就像一把利刃，直接将一个字典的内容更新到另一个字典中。如果存在相同的键，则更新后
Python面向对象教程：多重继承和MRO深入解析很酷的站长 Python python 开发语言
Python是一种面向对象的编程语言，其类继承机制为开发者提供了强大的工具来构建复杂的系统。多重继承允许一个类从多个基类继承属性和方法，而方法解析顺序（MRO）决定了在多重继承情况下方法的调用顺序。本文将详细介绍Python中的多重继承和方法解析顺序，涵盖基本概念、具体用法和实际应用示例。类继承的基本概念在Python中，类继承允许一个类（子类）继承另一个类（父类）的属性和方法，从而实现代码复用和
探索Python列表生成式：魔法般的快捷方式！很酷的站长 Python python 开发语言
欢迎来到Python世界的一个魅力角落，今天我们要聊聊Python列表生成式—一个强大的工具，用来创建列表的魔法般的快捷方式。让我们踏上一段有趣的学习之旅，一起探索这项Python中的神奇魔法。起步：什么是列表生成式？列表生成式，顾名思义，是生成列表的一个简单又直接的方法。它使用了一种紧凑的语法来构造列表，能够以一种更清晰、更简洁的方式来表达循环和过滤逻辑。基础示例让我们看看这个魔法是如何工作的，
小程序搜索组件功能与吸顶效果实现全解析阿贾克斯的黎明前端前端
目录小程序搜索组件功能与吸顶效果实现全解析一、创建搜索页面并实现跳转功能（一）新建搜索页面（二）实现跳转逻辑二、在首页使用搜索组件并实现吸顶效果（一）添加搜索组件到首页（二）实现吸顶效果在小程序开发过程中，搜索组件是提升用户体验、增强内容查找便捷性的关键元素。本文将详细介绍如何在小程序中实现点击搜索组件跳转到搜索页面，以及为搜索组件添加吸顶效果的方法，并附上完整代码示例，助你快速掌握这些实用技能。
Day29（补）-【AI思考】-精准突围策略——从“时间贫困“到“效率自由“的逆袭方案一个一定要撑住的学习者 #AI深度思考学习方法人工智能 unity 游戏引擎
文章目录精准突围策略——从"时间贫困"到"效率自由"的逆袭方案**第一步：目标熵减工程（建立四维坐标）**与其他学习方法的结合**第二步：清华方法本土化移植**与其他工具对比**~~第三步：游戏化改造方案~~****第四步：环境重塑工程****第五步：技术杠杆矩阵****第六步：风险对冲策略**可行性验证模型甘特图OKR看板精准突围策略——从"时间贫困"到"效率自由"的逆袭方案让思想碎片重焕生机的
selenium定位svg元素（原来如此简单） sineiy selenium 测试工具 pytest windows
1、前言最近在实现UI自动化测试，发现有些元素定位不了，特此来记录一下，也许有不对的地方，欢迎指正。我说定位不了的元素正是svg，在网上查了一通，发现也有很多小伙伴遇到这个问题。然后试了各种方法，什么By.CLASS_NAME;By.CSS_SELECTOR等等都定位不了，后面是使用了Selenium库中的ActionChains类来模拟鼠标点击操作才把这个问题解决了。2、网页结构先来看一下网页结
深入理解Java泛型 wh柒八九核心知识点 java相关 java 面试
作为一个Java程序员，日常编程早就离不开泛型。泛型自从JDK1.5引进之后，真的非常提高生产力。一个简单的泛型T，寥寥几行代码，就可以让我们在使用过程中动态替换成任何想要的类型，再也不用实现繁琐的类型转换方法。文章目录概述Java泛型实现方式类型擦除带来的缺陷不支持基本数据类型运行效率运行期间无法获取泛型实际类型Java泛型历史背景本文小结概述泛型虽然我们每天都在用，但是还有很多同学可能并不了解
Python Django ORM qq_15654157 Python python
一、ORM介绍1.什么是ORM?ORM全拼Object-RelationMapping.中文意为对象-关系映射.在MVC/MVT设计模式中的Model模块中都包括ORM2.ORM优势（1）只需要面向对象编程,不需要面向数据库编写代码.对数据库的操作都转化成对类属性和方法的操作.不用编写各种数据库的sql语句.（2）实现了数据模型与数据库的解耦,屏蔽了不同数据库操作上的差异.不在关注用的是mysql
18、智能驾驶芯片外部接口要求 OEM的牛马DRE 智能驾驶控制器硬件介绍人工智能
针对提出的关于产品关键芯片及硬件安全模块的技术保障要求：（1）产品的关键芯片应采取安全访问控制技术保障芯片的对外接口安全，保障系统不被非授权的进入为保障芯片的对外接口安全，防止系统被非授权进入，可以采取以下安全访问控制技术：访问控制保护：通过限制对芯片的访问权限来保护芯片的安全性。一种常见的访问控制方法是使用存储在芯片内部的安全密钥或密码来限制对芯片的访问。只有具有正确密钥或密码的用户才能访问芯片
深入理解Java中的泛型编程 egzosn java 开发语言
深入理解Java中的泛型编程大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！1.泛型的基础概念在Java中，泛型编程是一种强大的编程范式，它允许我们编写可以操作各种类型的代码，而不必在每次使用时重复编写代码。泛型提供了类型安全性和代码重用的机制。1.1定义泛型类和方法登录后复制packagecn.juwatech.generics;publicclassBox{pri
C#如何通过使用XpsToPdf库来转换xps为pdf文件 SunkingYang #C#入门级知识 c#pdf xps XpsToPdf 使用方法转换
文章目录英文描述中文描述XpsToPdf库地址调用方法：英文描述OutputtoPDFinWPF(forfree!)TherearetwogeneralstrategiestooutputtingtoaPDFinWPF.OneistooutputdirectlytoaPDFwhichrequiresyoutraverseavisualorflowdocumentandtranslatetoaPDF
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

Greedy Match学习笔记一 —— 匹配原理及SAS实现

Greedy Match学习笔记一 —— 匹配原理及SAS实现

Greedy Algorithm(贪婪算法)简介

基本思想

构造逻辑

何为最佳匹配

如何用SAS实现Greedy Match

方案选取及原因

SAS 代码

关于代码目的和所需数据/参数的描述

代码正文

一个例子

总结

你可能感兴趣的:(统计学方法)