weixin_30501857

SSE2 Intrinsics各函数介绍[转]

SIMD相关头文件包括：

//#include //MMX
//#include //SSE(also include ivec.h)
//#include //SSE2(also include fvec.h)


#include  //MMX
#include  //SSE(include mmintrin.h)
#include  //SSE2(include xmmintrin.h)
#include  //SSE3(include emmintrin.h)
#include //SSSE3(include pmmintrin.h)
#include //SSE4.1(include tmmintrin.h)
#include //SSE4.2(include smmintrin.h)
#include //AES(include nmmintrin.h)
#include //AVX(include wmmintrin.h)
#include //(include immintrin.h)

mmintrin.h为MMX 头文件，其中__m64的定义为：

typedef union __declspec(intrin_type) _CRT_ALIGN(8) __m64
{
    unsigned __int64    m64_u64;
    float               m64_f32[2];
    __int8              m64_i8[8];
    __int16             m64_i16[4];
    __int32             m64_i32[2];    
    __int64             m64_i64;
    unsigned __int8     m64_u8[8];
    unsigned __int16    m64_u16[4];
    unsigned __int32    m64_u32[2];
} __m64;

xmmintrin.h为SSE 头文件，此头文件里包含MMX头文件，其中__m128的定义为：

typedef union __declspec(intrin_type) _CRT_ALIGN(16) __m128 {
     float               m128_f32[4];
     unsigned __int64    m128_u64[2];
     __int8              m128_i8[16];
     __int16             m128_i16[8];
     __int32             m128_i32[4];
     __int64             m128_i64[2];
     unsigned __int8     m128_u8[16];
     unsigned __int16    m128_u16[8];
     unsigned __int32    m128_u32[4];
 } __m128;

emmintrin.h为SSE2头文件，此头文件里包含SSE头文件，其中__m128i和__m128d的定义为：

typedef union __declspec(intrin_type) _CRT_ALIGN(16) __m128i {
    __int8              m128i_i8[16];
    __int16             m128i_i16[8];
    __int32             m128i_i32[4];    
    __int64             m128i_i64[2];
    unsigned __int8     m128i_u8[16];
    unsigned __int16    m128i_u16[8];
    unsigned __int32    m128i_u32[4];
    unsigned __int64    m128i_u64[2];
} __m128i;

typedef struct __declspec(intrin_type) _CRT_ALIGN(16) __m128d {
    double              m128d_f64[2];
} __m128d;

emmintrin.h文件中各函数的介绍：

  1     /*----Floating-Point Intrinsics Using Streaming SIMD Extension 2 Instructions----*/
  2     //Arithmetic Operations(Floating Point):add、sub、mul、div、sqrt、min、max
  3     //返回一个__m128d的寄存器，r0=_A0+_B0, r1=_A1
  4     extern __m128d _mm_add_sd(__m128d _A, __m128d _B);
  5     //返回一个__m128d的寄存器，r0=_A0+_B0, r1=_A1+_B1
  6     extern __m128d _mm_add_pd(__m128d _A, __m128d _B);
  7     //返回一个__m128d的寄存器，r0=_A0-_B0, r1=_A1
  8     extern __m128d _mm_sub_sd(__m128d _A, __m128d _B);
  9     //返回一个__m128d的寄存器，r0=_A0-_B0, r1=_A1-_B1
 10     extern __m128d _mm_sub_pd(__m128d _A, __m128d _B);
 11     //返回一个__m128d的寄存器，r0=_A0*_B0, r1=_A1
 12     extern __m128d _mm_mul_sd(__m128d _A, __m128d _B);
 13     //返回一个__m128d的寄存器，r0=_A0*_B0, r1=_A1*_B1
 14     extern __m128d _mm_mul_pd(__m128d _A, __m128d _B);
 15     //返回一个__m128d的寄存器，r0=sqrt(_B0), r1=_A1
 16     extern __m128d _mm_sqrt_sd(__m128d _A, __m128d _B);
 17     //返回一个__m128d的寄存器，r0=sqrt(_A0), r1=sqrt(_A1)
 18     extern __m128d _mm_sqrt_pd(__m128d _A);
 19     //返回一个__m128d的寄存器，r0=_A0/_B0, r1=_A1
 20     extern __m128d _mm_div_sd(__m128d _A, __m128d _B);
 21     //返回一个__m128d的寄存器，r0=_A0/_B0, r1=_A1/_B1
 22     extern __m128d _mm_div_pd(__m128d _A, __m128d _B);
 23     //返回一个__m128d的寄存器，r0=min(_A0,_B0), r1=_A1
 24     extern __m128d _mm_min_sd(__m128d _A, __m128d _B);
 25     //返回一个__m128d的寄存器，r0=min(_A0,_B0), r1=min(_A1,_B1)
 26     extern __m128d _mm_min_pd(__m128d _A, __m128d _B);
 27     //返回一个__m128d的寄存器，r0=max(_A0,_B0), r1=_A1
 28     extern __m128d _mm_max_sd(__m128d _A, __m128d _B);
 29     //返回一个__m128d的寄存器，r0=max(_A0,_B0), r1=max(_A1,_B1)
 30     extern __m128d _mm_max_pd(__m128d _A, __m128d _B);
 31 
 32     //Logical Operations(Floating Point SSE2 Intrinsics):and、or、xor、 andnot
 33     //返回一个__m128d的寄存器，r0=_A0 & _B0, r1=_A1 & _B1
 34     extern __m128d _mm_and_pd(__m128d _A, __m128d _B);
 35     //返回一个__m128d的寄存器，r0=(~_A0) & _B0, r1=(~_A1) & _B1
 36     extern __m128d _mm_andnot_pd(__m128d _A, __m128d _B);
 37     //返回一个__m128d的寄存器，r0=_A0 | _B0, r1=_A1 | _B1
 38     extern __m128d _mm_or_pd(__m128d _A, __m128d _B);
 39     //返回一个__m128d的寄存器，r0=_A0 ^ _B0, r1=_A1 ^ _B1
 40     extern __m128d _mm_xor_pd(__m128d _A, __m128d _B);
 41 
 42     //Comparisions:==、<、<=、>、>=、!=
 43     //返回一个__m128d的寄存器，r0=(_A0 == _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 44     extern __m128d _mm_cmpeq_sd(__m128d _A, __m128d _B);
 45     //返回一个__m128d的寄存器，r0=(_A0 == _B0) ? 0xffffffffffffffff : 0x0, 
 46     //r1=(_A1 == _B1) ? 0xffffffffffffffff : 0x0
 47     extern __m128d _mm_cmpeq_pd(__m128d _A, __m128d _B);
 48     //返回一个__m128d的寄存器，r0=(_A0 < _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 49     extern __m128d _mm_cmplt_sd(__m128d _A, __m128d _B);
 50     //返回一个__m128d的寄存器，r0=(_A0 < _B0) ? 0xffffffffffffffff : 0x0, 
 51     //r1=(_A1 < _B1) ? 0xffffffffffffffff : 0x0
 52     extern __m128d _mm_cmplt_pd(__m128d _A, __m128d _B);
 53     //返回一个__m128d的寄存器，r0=(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 54     extern __m128d _mm_cmple_sd(__m128d _A, __m128d _B);
 55     //返回一个__m128d的寄存器，r0=(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, 
 56     //r1=(_A1 <= _B1) ? 0xffffffffffffffff : 0x0
 57     extern __m128d _mm_cmple_pd(__m128d _A, __m128d _B);
 58     //返回一个__m128d的寄存器，r0=(_A0 > _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 59     extern __m128d _mm_cmpgt_sd(__m128d _A, __m128d _B);
 60     //返回一个__m128d的寄存器，r0=(_A0 > _B0) ? 0xffffffffffffffff : 0x0, 
 61     //r1=(_A1 > _B1) ? 0xffffffffffffffff : 0x0
 62     extern __m128d _mm_cmpgt_pd(__m128d _A, __m128d _B);
 63     //返回一个__m128d的寄存器，r0=(_A0 >= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 64     extern __m128d _mm_cmpge_sd(__m128d _A, __m128d _B);
 65     //返回一个__m128d的寄存器，r0=(_A0 >= _B0) ? 0xffffffffffffffff : 0x0, 
 66     //r1=(_A1 >= _B1) ? 0xffffffffffffffff : 0x0
 67     extern __m128d _mm_cmpge_pd(__m128d _A, __m128d _B);
 68     //返回一个__m128d的寄存器，r0=(_A0 != _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 69     extern __m128d _mm_cmpneq_sd(__m128d _A, __m128d _B);
 70     //返回一个__m128d的寄存器，r0=(_A0 != _B0) ? 0xffffffffffffffff : 0x0, 
 71     //r1=(_A1 != _B1) ? 0xffffffffffffffff : 0x0
 72     extern __m128d _mm_cmpneq_pd(__m128d _A, __m128d _B);
 73     //返回一个__m128d的寄存器，r0=!(_A0 < _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 74     extern __m128d _mm_cmpnlt_sd(__m128d _A, __m128d _B);
 75     //返回一个__m128d的寄存器，r0=!(_A0 < _B0) ? 0xffffffffffffffff : 0x0, 
 76     //r1=!(_A1 < _B1) ? 0xffffffffffffffff : 0x0
 77     extern __m128d _mm_cmpnlt_pd(__m128d _A, __m128d _B);
 78     //返回一个__m128d的寄存器，r0=!(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 79     extern __m128d _mm_cmpnle_sd(__m128d _A, __m128d _B);
 80     //返回一个__m128d的寄存器，r0=!(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, 
 81     //r1=!(_A1 <= _B1) ? 0xffffffffffffffff : 0x0
 82     extern __m128d _mm_cmpnle_pd(__m128d _A, __m128d _B);
 83     //返回一个__m128d的寄存器，r0=!(_A0 > _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 84     extern __m128d _mm_cmpngt_sd(__m128d _A, __m128d _B);
 85     //返回一个__m128d的寄存器，r0=!(_A0 > _B0) ? 0xffffffffffffffff : 0x0, 
 86     //r1=!(_A1 > _B1) ? 0xffffffffffffffff : 0x0
 87     extern __m128d _mm_cmpngt_pd(__m128d _A, __m128d _B);
 88     //返回一个__m128d的寄存器，r0=!(_A0 >= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 89     extern __m128d _mm_cmpnge_sd(__m128d _A, __m128d _B);
 90     //返回一个__m128d的寄存器，r0=!(_A0 >= _B0) ? 0xffffffffffffffff : 0x0,
 91     //r1=!(_A1 >= _B1) ? 0xffffffffffffffff : 0x0
 92     extern __m128d _mm_cmpnge_pd(__m128d _A, __m128d _B);
 93     //返回一个__m128d的寄存器，r0=(_A0 ord _B0) ? 0xffffffffffffffff : 0x0, 
 94     //r1=(_A1 ord _B1) ? 0xffffffffffffffff : 0x0
 95     extern __m128d _mm_cmpord_pd(__m128d _A, __m128d _B);
 96     //返回一个__m128d的寄存器，r0=(_A0 ord _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
 97     extern __m128d _mm_cmpord_sd(__m128d _A, __m128d _B);
 98     //返回一个__m128d的寄存器，r0=(_A0 unord _B0) ? 0xffffffffffffffff : 0x0, 
 99     //r1=(_A1 unord _B1) ? 0xffffffffffffffff : 0x0
100     extern __m128d _mm_cmpunord_pd(__m128d _A, __m128d _B);
101     //返回一个__m128d的寄存器，r0=(_A0 unord _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
102     extern __m128d _mm_cmpunord_sd(__m128d _A, __m128d _B);
103     //返回一个0或1的整数，r=(_A0 != _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
104     extern int _mm_comieq_sd(__m128d _A, __m128d _B);
105     //返回一个0或1的整数，r=(_A0 < _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
106     extern int _mm_comilt_sd(__m128d _A, __m128d _B);
107     //返回一个0或1的整数，r=(_A0 <= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
108     extern int _mm_comile_sd(__m128d _A, __m128d _B);
109     //返回一个0或1的整数，r=(_A0 > _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
110     extern int _mm_comigt_sd(__m128d _A, __m128d _B);
111     //返回一个0或1的整数，r=(_A0 >= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
112     extern int _mm_comige_sd(__m128d _A, __m128d _B);
113     //返回一个0或1的整数，r=(_A0 != _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
114     extern int _mm_comineq_sd(__m128d _A, __m128d _B);
115     //返回一个0或1的整数，r=(_A0 == _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
116     extern int _mm_ucomieq_sd(__m128d _A, __m128d _B);
117     //返回一个0或1的整数，r=(_A0 < _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
118     extern int _mm_ucomilt_sd(__m128d _A, __m128d _B);
119     //返回一个0或1的整数，r=(_A0 <= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
120     extern int _mm_ucomile_sd(__m128d _A, __m128d _B);
121     //返回一个0或1的整数，r=(_A0 > _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
122     extern int _mm_ucomigt_sd(__m128d _A, __m128d _B);
123     //返回一个0或1的整数，r=(_A0 >= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
124     extern int _mm_ucomige_sd(__m128d _A, __m128d _B);
125     //返回一个0或1的整数，r=(_A0 != _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
126     extern int _mm_ucomineq_sd(__m128d _A, __m128d _B);
127 
128     //Conversion Operations
129     //返回一个__m128d的寄存器，r0=(dobule)_A0, r1=(double)_A1
130     extern __m128d _mm_cvtepi32_pd(__m128i _A);
131     //返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=0x0, r3=0x0
132     extern __m128i _mm_cvtpd_epi32(__m128d _A);
133     //返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=0x0, r3=0x0,using truncate
134     extern __m128i _mm_cvttpd_epi32(__m128d _A);
135     //返回一个__m128的寄存器，r0=(flaot)_A0, r1=(float)_A1, r2=(float)_A2, r3=(float)_A3
136     extern __m128 _mm_cvtepi32_ps(__m128i _A);
137     //返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=(int)_A2, r3=(int)_A3
138     extern __m128i _mm_cvtps_epi32(__m128 _A);
139     //返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=(int)_A2, r3=(int)_A3,using truncate
140     extern __m128i _mm_cvttps_epi32(__m128 _A);
141     //返回一个__m128的寄存器，r0=(flaot)_A0, r1=(float)_A1, r2=0.0, r3=0.0
142     extern __m128 _mm_cvtpd_ps(__m128d _A);
143     //返回一个__m128d的寄存器，r0=(dobule)_A0, r1=(double)_A1
144     extern __m128d _mm_cvtps_pd(__m128 _A);
145     //返回一个__m128的寄存器，r0=(float)_B0, r1=_B1, r2=_B2, r3=_B3
146     extern __m128 _mm_cvtsd_ss(__m128 _A, __m128d _B);
147     //返回一个__m128d的寄存器，r0=(double)_B0, r1=_A1
148     extern __m128d _mm_cvtss_sd(__m128d _A, __m128 _B);
149     //返回一个32bit整数，r=(int)_A0
150     extern int _mm_cvtsd_si32(__m128d _A);
151     //返回一个32bit整数，r=(int)_A0,using truncate
152     extern int _mm_cvttsd_si32(__m128d _A);
153     //返回一个__m128d的寄存器，r0=(double)_B, r1=_A1
154     extern __m128d _mm_cvtsi32_sd(__m128d _A, int _B);
155     //返回一个__m64的寄存器，r0=(int)_A0, r1=(int)_A1
156     extern __m64 _mm_cvtpd_pi32(__m128d _A);
157     //返回一个__m64的寄存器，r0=(int)_A0, r1=(int)_A1,using truncate
158     extern __m64 _mm_cvttpd_pi32(__m128d _A);
159     //返回一个__m128d的寄存器，r0=(dobule)_A0, r1=(double)_A1
160     extern __m128d _mm_cvtpi32_pd(__m64 _A);
161 
162     //Miscellaneous Operations(Floating-Point SSE2 Intrinsics)
163     //返回一个__m128d的寄存器，r0=_A1, r1=_B1
164     extern __m128d _mm_unpackhi_pd(__m128d _A, __m128d _B);
165     //返回一个__m128d的寄存器，r0=_A0, r1=_B0
166     extern __m128d _mm_unpacklo_pd(__m128d _A, __m128d _B);
167     //返回一个2bit整数，r=sign(_A1) << 1 | sign(_A0)
168     extern int _mm_movemask_pd(__m128d _A);
169     //返回一个__m128d的寄存器，Selects two specific double-precision,
170     // floating-point values from _A and _B, based on the mask _I,
171     //The mask must be an immediate
172     extern __m128d _mm_shuffle_pd(__m128d _A, __m128d _B, int _I);
173 
174     //Load Operations(Floating-Point SSE2 Intrinsics)
175     //返回一个__m128d的寄存器，r0=_Dp[0], r1=_Dp[1], The address _Dp must be 16-byte aligned
176     extern __m128d _mm_load_pd(double const*_Dp);
177     //返回一个__m128d的寄存器，r0=*_Dp, r1=*_Dp, The address _Dp does not need
178     //to be 16-byte aligned
179     extern __m128d _mm_load1_pd(double const*_Dp);
180     //返回一个__m128d的寄存器，r0=_Dp[1], r1=_Dp[0], The address _Dp must be 16-byte aligned
181     extern __m128d _mm_loadr_pd(double const*_Dp);
182     //返回一个__m128d的寄存器，r0=_Dp[0], r1=_Dp[1], The address _Dp does not 
183     //need to be 16-byte aligned
184     extern __m128d _mm_loadu_pd(double const*_Dp);
185     //返回一个__m128d的寄存器，r0=*_Dp, r1=0.0, The address _Dp does not 
186     //need to be 16-byte aligned
187     extern __m128d _mm_load_sd(double const*_Dp);
188     //返回一个__m128d的寄存器，r0=_A0, r1=*_Dp, The address _Dp does not 
189     //need to be 16-byte aligned
190     extern __m128d _mm_loadh_pd(__m128d _A, double const*_Dp);
191     //返回一个__m128d的寄存器，r0=*_Dp, r1=_A1, The address _Dp does not
192     //need to be 16-byte aligned
193     extern __m128d _mm_loadl_pd(__m128d _A, double const*_Dp);
194 
195     //Set Operations(Floating-Point SSE2 Intrinsics)
196     //返回一个__m128d的寄存器，r0=_W, r1=0.0
197     extern __m128d _mm_set_sd(double _W);
198     //返回一个__m128d的寄存器，r0=_A, r1=_A
199     extern __m128d _mm_set1_pd(double _A);
200     //返回一个__m128d的寄存器，r0=_Y, r1=_Z
201     extern __m128d _mm_set_pd(double _Z, double _Y);
202     //返回一个__m128d的寄存器，r0=_Y, r1=_Z
203     extern __m128d _mm_setr_pd(double _Y, double _Z);
204     //返回一个__m128d的寄存器，r0=0.0, r1=0.0
205     extern __m128d _mm_setzero_pd(void);
206     //返回一个__m128d的寄存器，r0=_B0, r1=_A1
207     extern __m128d _mm_move_sd(__m128d _A, __m128d _B);
208 
209     //Store Operations(Floating-Point SSE2 Intrinsics)
210     //返回为空，*_Dp=_A0, The address _Dp does not need to be 16-byte aligned
211     extern void _mm_store_sd(double *_Dp, __m128d _A);
212     //返回为空，_Dp[0]=_A0, _Dp[1]=_A0, The address _Dp must be 16-byte aligned
213     extern void _mm_store1_pd(double *_Dp, __m128d _A);
214     //返回为空，_Dp[0]=_A0, _Dp[1]=_A1, The address _Dp must be 16-byte aligned
215     extern void _mm_store_pd(double *_Dp, __m128d _A);
216     //返回为空，_Dp[0]=_A0, _Dp[1]=_A1, The address _Dp does not need to be 16-byte aligned
217     extern void _mm_storeu_pd(double *_Dp, __m128d _A);
218     //返回为空，_Dp[0]=_A1, _Dp[1]=_A0, The address _Dp must be 16-byte aligned
219     extern void _mm_storer_pd(double *_Dp, __m128d _A);
220     //返回为空，*_Dp=_A1
221     extern void _mm_storeh_pd(double *_Dp, __m128d _A);
222     //返回为空，*_Dp=_A0
223     extern void _mm_storel_pd(double *_Dp, __m128d _A);
224 
225     //new convert to float
226     //返回一个64bit double类型，r=_A0, Extracts the lower order floating point value
227     extern double _mm_cvtsd_f64(__m128d _A);
228 
229     //Cache Support for Streaming SIMD Extensions 2 Floating-Point Operations
230     //返回为空，_Dp[0]=_A0, _Dp[1]=_A1, Stores the data in _A to the address _Dp without
231     //polluting caches. The address _Dp must be 16-byte aligned. If the cache line 
232     //containing address _Dp is already in the cache, the cache will be updated
233     extern void _mm_stream_pd(double *_Dp, __m128d _A);
234 
235     /*------------Integer Intrinsics Using Streaming SIMD Extensions 2-------------*/
236     //Arithmetic Operations(Integer SSE2 Intrinsics):add、sub、mul、avg、min、max
237     //返回一个__m128i的寄存器，r0=_A0+_B0, r1=_A1+_B1, ... r15=_A15+_B15
238     extern __m128i _mm_add_epi8(__m128i _A, __m128i _B);
239     //返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相加，
240     //即ri=_Ai+_Bi(r0=_A0+_B0, r1=_A1+_B1, ... r7=_A7+_B7)
241     extern __m128i _mm_add_epi16(__m128i _A, __m128i _B);
242     //返回一个__m128i的寄存器，r0=_A0+_B0, r1=_A1+_B1, r2=_A2+_B2, r3=_A3+_B3
243     extern __m128i _mm_add_epi32(__m128i _A, __m128i _B);
244     //返回一个__m64的寄存器，r=_A+_B
245     extern __m64 _mm_add_si64(__m64 _A, __m64 _B);
246     //返回一个__m128i的寄存器，r0=_A0+_B0, r1=_A1+_B1
247     extern __m128i _mm_add_epi64(__m128i _A, __m128i _B);
248     //返回一个__m128i的寄存器，r0=SignedSaturate(_A0+_B0), r1=SignedSaturate(_A1+_B1), ... 
249     //r15=SignedSaturate(_A15+_B15), saturates
250     extern __m128i _mm_adds_epi8(__m128i _A, __m128i _B);
251     //返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相加，
252     //r0=SignedSaturate(_A0+_B0), r1=SignedSaturate(_A1+_B1), ... 
253     //r7=SignedSaturate(_A7+_B7), 当计算结果溢出时将其置为边界值(saturates)
254     extern __m128i _mm_adds_epi16(__m128i _A, __m128i _B);
255     //返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0+_B0), r1=UnsignedSaturate(_A1+_B1), ... 
256     //r15=UnsignedSaturate(_A15+_B15), saturates
257     extern __m128i _mm_adds_epu8(__m128i _A, __m128i _B);
258     //返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0+_B0), r1=UnsignedSaturate(_A1+_B1), ... 
259     //r7=UnsignedSaturate(_A7+_B7), saturates
260     extern __m128i _mm_adds_epu16(__m128i _A, __m128i _B);
261     //返回一个__m128i的寄存器，r0=(_A0+_B0)/2, r1=(_A1+_B1)/2, ... r15=(_A15+_B15)/2, rounds
262     extern __m128i _mm_avg_epu8(__m128i _A, __m128i _B); 
263     //返回一个__m128i的寄存器，将_A和_B中对应位置的16bit无符号整数取平均，
264     //即ri=(_Ai+_Bi)/2(r0=(_A0+_B0)/2, r1=(_A1+_B1)/2, ... r7=(_A7+_B7)/2), rounds
265     extern __m128i _mm_avg_epu16(__m128i _A, __m128i _B);
266     //返回一个__m128i的寄存器，它含有4个有符号或无符号32bit的整数，
267     //分别满足：r0=(_A0*_B0)+(_A1*_B1), r1=(_A2*_B2)+(_A3*_B3), 
268     //r2=(_A4*_B4)+(_A5*_B5), r3=(_A6*_B6)+(_A7*_B7)
269     extern __m128i _mm_madd_epi16(__m128i _A, __m128i _B);
270     //返回一个__m128i的寄存器，取_A和_B中对应位置的16bit有符号或无符号整数的最大值，
271     //即ri=max(_Ai,_Bi) (r0=max(_A0,_B1), r1=max(_A1,_B1), ... r7=max(_A7,_B7))
272     extern __m128i _mm_max_epi16(__m128i _A, __m128i _B);
273     //返回一个__m128i的寄存器，r0=max(_A0,_B1), r1=max(_A1,_B1), ... r15=max(_A15,_B15)
274     extern __m128i _mm_max_epu8(__m128i _A, __m128i _B);
275     //返回一个__m128i的寄存器，取_A和_B中对应位置的16bit有符号或无符号整数的最小值，
276     //即ri=min(_Ai, _Bi)(r0=min(_A0,_B1), r1=min(_A1,_B1), ... r7=min(_A7,_B7))
277     extern __m128i _mm_min_epi16(__m128i _A, __m128i _B);
278     //返回一个__m128i的寄存器，r0=min(_A0,_B1), r1=min(_A1,_B1), ... r15=min(_A15,_B15)
279     extern __m128i _mm_min_epu8(__m128i _A, __m128i _B);
280     //返回一个__m128i的寄存器，它含8个有符号或无符号16bit的整数，分别为_A和_B对应位置的16bit
281     //有符号或无符号整数相乘结果的高16bit数据，即ri=(_Ai*_Bi)[31:16](r0=(_A0*_B0)[31:16], 
282     //r1=(_A1*_B1)[31:16] ... r7=(_A7*_B7)[31:16])
283     extern __m128i _mm_mulhi_epi16(__m128i _A, __m128i _B);
284     //返回一个__m128i的寄存器，r0=(_A0*_B0)[31:16], r1=(_A1*_B1)[31:16] ... r7=(_A7*_B7)[31:16]
285     extern __m128i _mm_mulhi_epu16(__m128i _A, __m128i _B);
286     //返回一个__m128i的寄存器，它含8个有符号或无符号16bit的整数，分别为_A和_B对应位置的16bit
287     //有符号或无符号整数相乘结果的低16bit数据，即ri=(_Ai*_Bi)[15:0](r0=(_A0*_B0)[15:0], 
288     //r1=(_A1*_B1)[15:0] ... r7=(_A7*_B7)[15:0])
289     extern __m128i _mm_mullo_epi16(__m128i _A, __m128i _B);
290     //返回一个__m64的寄存器，r=_A0*_B0
291     extern __m64 _mm_mul_su32(__m64 _A, __m64 _B);
292     //返回一个__m128i的寄存器，r0=_A0*_B0, r1=_A2*_B2
293     extern __m128i _mm_mul_epu32(__m128i _A, __m128i _B);
294     //返回一个__m128i的寄存器，r0=abs(_A0-_B0) + abs(_A1-_B1) + ... + abs(_A7-_B7), 
295     //r1=0x0,r2=0x0, r3=0x0, r4=abs(_A8-_B8) + abs(_A9-_B9) + ... + abs(_A15-_B15), 
296     //r5=0x0, r6=0x0, r7=0x0
297     extern __m128i _mm_sad_epu8(__m128i _A, __m128i _B);
298     //返回一个__m128i的寄存器，r0=_A0-_B0, r1=_A1-_B1, ... r15=_A15-_B15
299     extern __m128i _mm_sub_epi8(__m128i _A, __m128i _B);
300     //返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相减，
301     //即ri=_Ai-_Bi(r0=_A0-_B0, r1=_A1-_B1, ... r7=_A7-_B7)
302     extern __m128i _mm_sub_epi16(__m128i _A, __m128i _B);
303     //返回一个__m128i的寄存器，r0=_A0-_B0, r1=_A1-_B1, r2=_A2-_B2, r3=_A3-_B3
304     extern __m128i _mm_sub_epi32(__m128i _A, __m128i _B);
305     //返回一个__m64的寄存器，r=_A-_B
306     extern __m64 _mm_sub_si64(__m64 _A, __m64 _B);
307     //返回一个__m128i的寄存器，r0=_A0-_B0, r1=_A1-_B1
308     extern __m128i _mm_sub_epi64(__m128i _A, __m128i _B);
309     //返回一个__m128i的寄存器，r0=SignedSaturate(_A0-_B0), r1=SignedSaturate(_A1-_B1), ... 
310     //r15=SignedSaturate(_A15-_B15), saturate
311     extern __m128i _mm_subs_epi8(__m128i _A, __m128i _B);
312     //返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相减，
313     //当计算结果溢出时将其置为边界值(saturate), r0=SignedSaturate(_A0-_B0), 
314     //r1=SignedSaturate(_A1-_B1), ... r7=SignedSaturate(_A7-_B7)
315     extern __m128i _mm_subs_epi16(__m128i _A, __m128i _B);
316     //返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0-_B0), r1=UnsignedSaturate(_A1-_B1), ...
317     //r15=UnsignedSaturate(_A15-_B15), saturate
318     extern __m128i _mm_subs_epu8(__m128i _A, __m128i _B);
319     //返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0-_B0), r1=UnsignedSaturate(_A1-_B1), ... 
320     //r15=UnsignedSaturate(_A7-_B7), saturate
321     extern __m128i _mm_subs_epu16(__m128i _A, __m128i _B);
322 
323     //Logical Operations(Integer SSE2 Intrinsics):and、or、xor、andnot
324     //返回一个__m128i的寄存器，将寄存器_A和寄存器_B的对应位进行按位与运算, r=_A & _B
325     extern __m128i _mm_and_si128(__m128i _A, __m128i _B);
326     //返回一个__m128i的寄存器，将寄存器_A每一位取非，然后和寄存器_B的每一位进行按位与运算,
327     //r=(~_A) & _B
328     extern __m128i _mm_andnot_si128(__m128i _A, __m128i _B);
329     //返回一个__m128i的寄存器，将寄存器_A和寄存器_B的对应位进行按位或运算, r=_A | _B
330     extern __m128i _mm_or_si128(__m128i _A, __m128i _B);
331     //返回一个__m128i的寄存器，将寄存器_A和寄存器_B的对应位进行按位异或运算, r=_A ^ _B
332     extern __m128i _mm_xor_si128(__m128i _A, __m128i _B);
333 
334     //Shift Operations
335     //返回一个__m128i的寄存器，r=_A << (_Imm * 8),  _Imm must be an immediate,  
336     //shifting in zeros
337     extern __m128i _mm_slli_si128(__m128i _A, int _Imm);
338     //返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count进行相同的逻辑左移,
339     //r0=_A0 << _Count, r1=_A1 << _Count, ... r7=_A7 << count,  shifting in zeros
340     extern __m128i _mm_slli_epi16(__m128i _A, int _Count);
341     //返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count寄存器中对应位置的整数
342     //进行逻辑左移, r0=_A0 << _Count, r1=_A1 << _Count, ... r7=_A7 << count,  shifting in zeros
343     extern __m128i _mm_sll_epi16(__m128i _A, __m128i _Count);
344     //返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count, r2=_A2 << count, 
345     //r3=_A3 << count,  shifting in zeros
346     extern __m128i _mm_slli_epi32(__m128i _A, int _Count);
347     //返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count, r2=_A2 << count, 
348     //r3=_A3 << count,  shifting in zeros
349     extern __m128i _mm_sll_epi32(__m128i _A, __m128i _Count);
350     //返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count,  shifting in zeros
351     extern __m128i _mm_slli_epi64(__m128i _A, int _Count);
352     //返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count,  shifting in zeros
353     extern __m128i _mm_sll_epi64(__m128i _A, __m128i _Count);
354     //返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count进行相同的算术右移,
355     //r0=_A0 >> _Count, r1=_A1 >> _Count, ... r7=_A7 >> count,  shifting in the sign bit
356     extern __m128i _mm_srai_epi16(__m128i _A, int _Count);
357     //返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count寄存器中对应位置的整数进行
358     //算术右移,r0=_A0 >> _Count, r1=_A1 >> _Count, ... r7=_A7 >> count,  shifting in the sign bit
359     extern __m128i _mm_sra_epi16(__m128i _A, __m128i _Count);
360     //返回一个__m128i的寄存器，r0=_A0 >> _Count, r1=_A1 >> _Count, r3=_A3 >> count, 
361     //r4=_A4 >> count,  shifting in the sign bit
362     extern __m128i _mm_srai_epi32(__m128i _A, int _Count);
363     //返回一个__m128i的寄存器，r0=_A0 >> _Count, r1=_A1 >> _Count, r3=_A3 >> count,
364     //r4=_A4 >> count,  shifting in the sign bit
365     extern __m128i _mm_sra_epi32(__m128i _A, __m128i _Count);
366     //返回一个__m128i的寄存器，r=srl(_A, _Imm * 8),   _Imm must be an immediate,  
367     //shifting in zeros
368     extern __m128i _mm_srli_si128(__m128i _A, int _Imm);
369     //返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count进行相同的逻辑右移，
370     //移位填充值为0,r0=srl(_A0, _Count), r1=srl(_A1, _Count), ... r7=srl(_A7, _Count), 
371     //shifting in zeros
372     extern __m128i _mm_srli_epi16(__m128i _A, int _Count);
373     //返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count寄存器中对应位置的整数
374     //进行逻辑右移，移位填充值为0, r0=srl(_A0, _Count), r1=srl(_A1, _Count), ... 
375     //r7=srl(_A7, _Count),  shifting in zeros
376     extern __m128i _mm_srl_epi16(__m128i _A, __m128i _Count);
377     //返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), r2=srl(_A2, _Count),
378     //r3=srl(_A3, _Count),  shifting in zeros
379     extern __m128i _mm_srli_epi32(__m128i _A, int _Count);
380     //返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), r2=srl(_A2, _Count),
381     //r3=srl(_A3, _Count),  shifting in zeros
382     extern __m128i _mm_srl_epi32(__m128i _A, __m128i _Count);
383     //返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), shifting in zeros
384     extern __m128i _mm_srli_epi64(__m128i _A, int _Count);
385     //返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), shifting in zeros
386     extern __m128i _mm_srl_epi64(__m128i _A, __m128i _Count);
387 
388     //Comparison Intrinsics(SSE2):==、>、<
389     //返回一个__m128i的寄存器，r0=(_A0 == _B0) ? 0xff : 0x00, 
390     //r1=(_A1 == _B1) ? 0xff : 0x0, ... r15=(_A15 == _B15) ? 0xff : 0x0
391     extern __m128i _mm_cmpeq_epi8(__m128i _A, __m128i _B);
392     //返回一个__m128i的寄存器，分别比较寄存器_A和寄存器_B对应位置16bit整数是否相等，若相等，
393     //该位置返回0xffff，否则返回0x0，即ri=(_Ai==_Bi)?0xffff:0x0(r0=(_A0 == _B0) ? 0xffff : 0x00, 
394     //r1=(_A1 == _B1) ? 0xffff : 0x0, ... r7=(_A7 == _B7) ? 0xffff : 0x0)
395     extern __m128i _mm_cmpeq_epi16(__m128i _A, __m128i _B);
396     //返回一个__m128i的寄存器，r0=(_A0 == _B0) ? 0xffffffff : 0x00, 
397     //r1=(_A1 == _B1) ? 0xffffffff : 0x0,
398     //r2=(_A2 == _B2) ? 0xffffffff : 0x0, r3=(_A3 == _B3) ? 0xffffffff : 0x0
399     extern __m128i _mm_cmpeq_epi32(__m128i _A, __m128i _B);
400     //返回一个__m128i的寄存器，r0=(_A0 > _B0) ? 0xff : 0x00, r1=(_A1 > _B1) ? 0xff : 0x0, ...
401     //r15=(_A15 > _B15) ? 0xff : 0x0
402     extern __m128i _mm_cmpgt_epi8(__m128i _A, __m128i _B);
403     //返回一个__m128i的寄存器，分别比较寄存器_A的每个16bit整数是否大于寄存器_B对应位置16bit的整数，
404     //若大于，该位置返回0xffff，否则返回0x0，
405     //即ri=(_Ai>_Bi)?0xffff:0x0(r0=(_A0 > _B0) ? 0xffff : 0x00, 
406     //r1=(_A1 > _B1) ? 0xffff : 0x0, ... r7=(_A7 > _B7) ? 0xffff : 0x0)
407     extern __m128i _mm_cmpgt_epi16(__m128i _A, __m128i _B);
408     //返回一个__m128i的寄存器，r0=(_A0 > _B0) ? 0xffffffff : 0x00,
409     //r1=(_A1 > _B1) ? 0xffffffff : 0x0,
410     //r2=(_A2 > _B2) ? 0xffffffff : 0x0, r3=(_A3 > _B3) ? 0xffffffff : 0x0
411     extern __m128i _mm_cmpgt_epi32(__m128i _A, __m128i _B);
412     //返回一个__m128i的寄存器，r0=(_A0 < _B0) ? 0xff : 0x00, r1=(_A1 < _B1) ? 0xff : 0x0, ... 
413     //r15=(_A15 < _B15) ? 0xff : 0x0
414     extern __m128i _mm_cmplt_epi8(__m128i _A, __m128i _B);
415     //返回一个__m128i的寄存器，分别比较寄存器_A的每个16bit整数是否小于寄存器_B对应位置16bit整数，
416     //若小于，该位置返回0xffff，否则返回0x0，
417     //即ri=(_Ai<_Bi)?0xffff:0x0(r0=(_A0 < _B0) ? 0xffff : 0x00, 
418     //r1=(_A1 < _B1) ? 0xffff : 0x0, ... r7=(_A7 < _B7) ? 0xffff : 0x0)
419     extern __m128i _mm_cmplt_epi16(__m128i _A, __m128i _B);
420     //返回一个__m128i的寄存器，r0=(_A0 < _B0) ? 0xffffffff : 0x00,
421     //r1=(_A1 < _B1) ? 0xffffffff : 0x0, 
422     //r2=(_A2 < _B2) ? 0xffffffff : 0x0, r3=(_A3 < _B3) ? 0xffffffff : 0x0
423     extern __m128i _mm_cmplt_epi32(__m128i _A, __m128i _B);
424 
425     //Conversion Intrinsics: int <-----> __m128i
426     //返回一个__m128i的寄存器，r0=_A, r1=0x0, r2=0x0, r3=0x0
427     extern __m128i _mm_cvtsi32_si128(int _A);
428     //返回一个32bit整数，r=_A0
429     extern int _mm_cvtsi128_si32(__m128i _A);
430 
431     //Miscellaneous Operations(Integer SSE2 Intrinsics)
432     //返回一个__m128i的寄存器，r0=SignedSaturate(_A0), r1=SignedSaturate(_A1), ... 
433     //r7=SignedSaturate(_A7), r8=SignedSaturate(_B0), r9=SignedSaturate(_B1), ... 
434     //r15=SignedSaturate(_B7),  saturate
435     extern __m128i _mm_packs_epi16(__m128i _A, __m128i _B);
436     //返回一个__m128i的寄存器，r0=SignedSaturate(_A0), r1=SignedSaturate(_A1), 
437     //r2=SignedSaturate(_A2),r3=SignedSaturate(_A3), r4=SignedSaturate(_B0), 
438     //r5=SignedSaturate(_B1), r6=SignedSaturate(_B2), r7=SignedSaturate(_B3),  saturate
439     extern __m128i _mm_packs_epi32(__m128i _A, __m128i _B);
440     //返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0), r1=UnsignedSaturate(_A1), ... 
441     //r7=UnsignedSaturate(_A7),r8=UnsignedSaturate(_B0), r9=UnsignedSaturate(_B1), ... 
442     //r15=UnsignedSaturate(_B7),  saturate
443     extern __m128i _mm_packus_epi16(__m128i _A, __m128i _B);
444     //返回一个16bit整数，根据_Imm从_A中8个16bit数中选取对应编号的数,
445     //r=(_Imm == 0) ? _A0 : ((_Imm == 1) ? _A1 : ... (_Imm == 7) ? _A7), 
446     //_Imm must be an immediate, zero extends
447     extern int _mm_extract_epi16(__m128i _A, int _Imm);
448     //返回一个__m128i的寄存器，根据_Imm将_A中8个16bit数中对应编号的数替换为_B,
449     //r0=(_Imm == 0) ? _B : _A0; r1=(_Imm == 1) : _B : _A1, ... r7=(_Imm == 7) ? _B : _A7
450     extern __m128i _mm_insert_epi16(__m128i _A, int _B, int _Imm);
451     //返回一个16bit整数，r=(_A15[7] << 15) | (_A14[7] << 14) ... (_A1[7] << 1) | _A0[7], 
452     //zero extends the upper bits
453     extern int _mm_movemask_epi8(__m128i _A);
454     //返回一个__m128i的寄存器，它是将_A中128bit数据以32bit为单位重新排列得到的，_Imm为有
455     //一个四元组，表示重新排列的顺序。当_A中原本存储的整数为16bit时，这条指令将其两两一组
456     //进行排列。例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7), _Imm=(2,3,0,1),其中_Ai为16bit整数，
457     //_A0为低位，返回结果为(_A2,_A3,_A0,_A1,_A6,_A7,_A4,_A5),  _Imm must be an immediate
458     extern __m128i _mm_shuffle_epi32(__m128i _A, int _Imm);
459     //返回一个__m128i的寄存器，它是将_A中高64bit数据以16bit为单位重新排列得到的，_Imm为一个四元组，
460     //表示重新排列的顺序。_A中低64bit数据顺序不变。例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7), 
461     //_Imm=(2,3,0,1),其中_Ai为16bit整数，_A0为低位，返回结果为(_A0,_A1,_A2,_A3,_A5,_A4,_A7,_A6), 
462     //_Imm must be an immediate 
463     extern __m128i _mm_shufflehi_epi16(__m128i _A, int _Imm);
464     //返回一个__m128i的寄存器，它是将_A中低64bit数据以16bit为单位重新排列得到的，_Imm为一个四元组，
465     //表示重新排列的顺序。_A中高64bit数据顺序不变。例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),
466     //_Imm=(2,3,0,1),其中_Ai为16bit整数，_A0为低位，返回结果为(_A1,_A0,_A3,_A2,_A5,_A4,_A7,_A6),   
467     //_Imm must be an immediate
468     extern __m128i _mm_shufflelo_epi16(__m128i _A, int _Imm);
469     //返回一个__m128i的寄存器，r0=_A8, r1=_B8, r2=_A9, r3=_B9, ... r14=_A15, r15=_B15
470     extern __m128i _mm_unpackhi_epi8(__m128i _A, __m128i _B);
471     //返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的高64bit数以16bit为单位交织在一块。
472     //例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
473     //其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A4,_B4,_A5,_B5,_A6,_B6,_A7,_B7),
474     //r0=_A4, r1=_B4, r2=_A5, r3=_B5, r4=_A6, r5=_B6, r6=_A7, r7=_B7
475     extern __m128i _mm_unpackhi_epi16(__m128i _A, __m128i _B);
476     //返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的高64bit数以32bit为单位交织在一块。
477     //例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
478     //其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A4,_A5,_B4,_B5,_A6,_A7,_B6,_B7),
479     //r0=_A2, r1=_B2, r2=_A3, r3=_B3
480     extern __m128i _mm_unpackhi_epi32(__m128i _A, __m128i _B);
481     //返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的高64bit数以64bit为单位交织在一块。
482     //例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
483     //其中_Ai,_Bi为16bit整数，_A0,_B0为低位，
484     //返回结果为(_A4,_A5,_A6,_A7,_B4,_B5,_B6,_B7), r0=_A1, r1=_B1
485     extern __m128i _mm_unpackhi_epi64(__m128i _A, __m128i _B);
486     //返回一个__m128i的寄存器，r0=_A0, r1=_B0, r2=_A1, r3=_B1, ... r14=_A7, r15=_B7
487     extern __m128i _mm_unpacklo_epi8(__m128i _A, __m128i _B);
488     //返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的低64bit数以16bit为单位交织在一块。
489     //例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
490     //其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A0,_B0,_A1,_B1,_A2,_B2,_A3,_B3),
491     //r0=_A0, r1=_B0, r2=_A1, r3=_B1, r4=_A2, r5=_B2, r6=_A3, r7=_B3
492     extern __m128i _mm_unpacklo_epi16(__m128i _A, __m128i _B);
493     //返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的低64bit数以32bit为单位交织在一块。
494     //例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
495     //其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A0,_A1,_B0,_B1,_A2,_A3,_B2,_B3),
496     //r0=_A0, r1=_B0, r2=_A1, r3=_B1
497     extern __m128i _mm_unpacklo_epi32(__m128i _A, __m128i _B);
498     //返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的低64bit数以32bit为单位交织在一块。
499     //例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
500     //其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A0,_A1,_A2,_A3,_B0,_B1,_B2,_B3), 
501     //ro=_A0, r1=_B0
502     extern __m128i _mm_unpacklo_epi64(__m128i _A, __m128i _B);
503 
504     //Load Operations(Integer SSE2 Intrinsics)
505     //返回为一个__m128i的寄存器，它将_P指向的数据读到指定寄存器中，实际使用时，
506     //_P一般是通过类型转换得到的, Address _P must be 16-byte aligned
507     extern __m128i _mm_load_si128(__m128i const*_P);
508     //返回一个__m128i的寄存器，Loads 128-bit value, Address _P does not need be 16-byte aligned
509     extern __m128i _mm_loadu_si128(__m128i const*_P);
510     //返回一个__m128i的寄存器，r0=*p[63:0], r1=0x0, zeroing the upper 64 bits of the result
511     extern __m128i _mm_loadl_epi64(__m128i const*_P);
512 
513     //Set Operations(Integer SSE2 Intrinsics)
514     //返回一个__m128i的寄存器，r0=_Q0, r1=_Q1
515     extern __m128i _mm_set_epi64(__m64 _Q1, __m64 _Q0);
516     //返回一个__m128i的寄存器，r0=_I0, r1=_I1, r2=_I2, r3=_I3
517     extern __m128i _mm_set_epi32(int _I3, int _I2, int _I1, int _I0);
518     //返回一个__m128i的寄存器，使用8个具体的short型数据来设置寄存器存放数据,
519     //r0=_W0, r1=_W1, ... r7=_W7
520     extern __m128i _mm_set_epi16(short _W7, short _W6, short _W5, short _W4, 
521                                     short _W3, short _W2, short _W1, short _W0);
522     //返回一个__m128i的寄存器，r0=_B0, r1=_B1, ... r15=_B15
523     extern __m128i _mm_set_epi8(char _B15, char _B14, char _B13, char _B12, char _B11, 
524                     char _B10, char _B9,char _B8, char _B7, char _B6, char _B5, char _B4, 
525                     char _B3, char _B2, char _B1, char _B0);
526     //返回一个__m128i的寄存器，r0=_Q, r1=_Q
527     extern __m128i _mm_set1_epi64(__m64 _Q);
528     //返回一个__m128i的寄存器，r0=_I, r1=_I, r2=_I, r3=_I
529     extern __m128i _mm_set1_epi32(int _I);
530     //返回一个__m128i的寄存器，r0=_W, r1=_W, ... r7=_W
531     extern __m128i _mm_set1_epi16(short _W);
532     //返回一个__m128i的寄存器，r0=_B, r1=_B, ... r15=_B
533     extern __m128i _mm_set1_epi8(char _B);
534     //返回一个__m128i的寄存器，r=_Q
535     extern __m128i _mm_setl_epi64(__m128i _Q);
536     //返回一个__m128i的寄存器，r0=_Q0, r1=_Q1
537     extern __m128i _mm_setr_epi64(__m64 _Q0, __m64 _Q1);
538     //返回一个__m128i的寄存器，r0=_I0, r1=_I1, r2=_I2, r3=_I3
539     extern __m128i _mm_setr_epi32(int _I0, int _I1, int _I2, int _I3);
540     //返回一个__m128i的寄存器，r0=_W0, r1=_W1, ... r7=_W7
541     extern __m128i _mm_setr_epi16(short _W0, short _W1, short _W2, short _W3, 
542                                     short _W4, short _W5, short _W6, short _W7);
543     //返回一个__m128i的寄存器，r0=_B15, r1=_B14, ... r15=_B0
544     extern __m128i _mm_setr_epi8(char _B15, char _B14, char _B13, char _B12, char _B11, 
545         char _B10, char _B9, char _B8, char _B7, char _B6, char _B5, char _B4,  
546         char _B3, char _B2, char _B1, char _B0);
547     //返回一个__m128i的寄存器，r=0x0
548     extern __m128i _mm_setzero_si128(void);
549 
550     //Store Operations(Integer SSE2 Intrinsics)
551     //返回为空，它将寄存器_B中的数据存储到_P指向的地址中，实际使用时，
552     //_P一般是通过类型转换得到的, *_P = _B, Address _P must be 16-byte aligned
553     extern void _mm_store_si128(__m128i *_P, __m128i _B);
554     //返回为空，*_P=_B, Address _P does not need to be 16-byte aligned
555     extern void _mm_storeu_si128(__m128i *_P, __m128i _B);
556     //返回为空，*_P[63:0] =_Q0, lower 64 bits
557     extern void _mm_storel_epi64(__m128i *_P, __m128i _Q);
558     //返回为空，if(_N0[7]) _P[0]=_D0, if(_N1[7]) _P[1]=_D1, ... if(_N15[7]) _P[15]=_D15, 
559     //The high bit of each byte in the selector _N determines whether the corresponding byte 
560     //in _D will be stored. Address _P does not need to be 16-byte aligned
561     extern void _mm_maskmoveu_si128(__m128i _D, __m128i _N, char *_P);
562 
563     //Integer, moves
564     //返回一个__m128i的寄存器，r0=_Q0, r1=0x0, zeroing the upper bits
565     extern __m128i _mm_move_epi64(__m128i _Q);
566     //返回一个__m128i的寄存器，r0=_Q, r1=0x0, zeroing the upper bits
567     extern __m128i _mm_movpi64_epi64(__m64 _Q);
568     //返回一个__m64的寄存器，r=_Q0
569     extern __m64 _mm_movepi64_pi64(__m128i _Q);
570 
571     //Cache Support for Steaming SIMD Extensions 2 Integer Operations
572     //返回为空，*_P=_A, Stores the data in _A to the address _P without polluting the caches.
573     //If the cache line containing address _P is already in the cache, the cache will be updated. 
574     //Address _P must be 16-byte aligned
575     extern void _mm_stream_si128(__m128i *_P, __m128i _A);
576     //返回为空，Cache line containing _P is flushed and invalidated from 
577     //all caches in the coherency domain
578     extern void _mm_clflush(void const*_P);
579     //返回为空，Guarantees that every load instruction that precedes, in program order, the load 
580     //fence instruction is globally visible before any load instruction 
581     //that follows the fence in program order
582     extern void _mm_lfence(void);
583     //返回为空，Guarantees that every memory access that precedes, in program order, 
584     //the memory fence instruction is globally visible before any memory instruction 
585     //that follows the fence in program order
586     extern void _mm_mfence(void);
587     //返回为空，*_P=_I, Stores the data in _I to the address _P without polluting the caches. 
588     //If the cache line containing address _P is already in the cache, the cache will be updated
589     extern void _mm_stream_si32(int *_P, int _I);
590     //返回为空，The execution of the next instruction is delayed an implementation specific 
591     //amount of time. The instruction does not modify the architectural state. This intrinsic
592     //provides especially significant performance gain
593     extern void _mm_pause(void);
594 
595     /*---Support for casting between various SP, DP, INT vector types. Note that these do no 
596         conversion of values, they just change the type----*/
597     //返回一个__m128的寄存器，Applies a type cast to reinterpret two 64-bit floating 
598     //point values passed in as a 128-bit parameter as packed 32-bit floating point values
599     extern __m128  _mm_castpd_ps(__m128d);
600     //返回一个__m128i的寄存器，Applies a type cast to reinterpret two 64-bit
601     //floating point values passed in as a 128-bit parameter as packed 32-bit integers
602     extern __m128i _mm_castpd_si128(__m128d);
603     //返回一个__m128d的寄存器，Applies a type cast to reinterpret four 32-bit floating 
604     //point values passed in as a 128-bit parameter as packed 64-bit floating point values
605     extern __m128d _mm_castps_pd(__m128);
606     //返回一个__m128i的寄存器，Applies a type cast to reinterpret four 32-bit floating 
607     //point values passed in as a 128-bit parameter as packed 32-bit integers
608     extern __m128i _mm_castps_si128(__m128);
609     //返回一个__m128的寄存器，Applies a type cast to reinterpret four 32-bit integers 
610     //passed in as a 128-bit parameter as packed 32-bit floating point values
611     extern __m128  _mm_castsi128_ps(__m128i);
612     //返回一个__m128d的寄存器，Applies a type cast to reinterpret four 32-bit 
613     //integers passed in as a 128-bit parameter as packed 64-bit floating point values
614     extern __m128d _mm_castsi128_pd(__m128i);

reference:

http://blog.csdn.net/fengbingchun/article/details/18460199

转载于:https://www.cnblogs.com/galoishelley/p/4033254.html

你可能感兴趣的:(SSE2 Intrinsics各函数介绍[转])

通过Stream将List＜Long＞转List＜String＞不开心找医生ly java
ListstringList=longList.stream().map(long->long+"").collect(Collectors.toList()));
java deque linkedlist_java 中 linkedList使用 weixin_39956558 java deque linkedlist
java中linkedList使用1介绍2特点下面是LinkedList最重要特性:操作list元素从开始或结束反序不是线程安全每个元素是个node节点，节点保持之前和之后引用保持插入有序虽然LinkedLIst不是线程安全，我们创建线程安全版本LinkedList，调用Listlist=Collections.synchronizedList(newLinkedList(...));3比较Arr
c# 核心技术指南——第2章 c# 语言基础伦比兔 C#核心技术指南 c#开发语言
本书中几乎所有的程序和代码片段都可以作为交互式示例在LINQPad中运行。阅读本书时使用这些示例可以加快你的学习进度。在LINQPad中编辑执行这些示例可以立即得到结果，无须在VisualStudio中建立项目和解决方案。2.1第一个C#程序在C#中，语句按顺序执行，每个语句都以分号结尾。类将函数成员和数据成员聚合在一起形成面向对象的构建单元。Console类将处理命令行的输入输出功能聚合在一起，
JAVA LIST＜Long＞快速转LIST＜String＞ LeeShaoQing java 学习 java
偶然间发现一个问题，获取List传给前端，拿到的值最后两位变成了00。这是因为当Long过长时，到前端数据拉取后几位可能会自动变成0，所以要先处理成String发给前端。ListbindingList=systemSiteExpensesConfigService.getBindingServiceType(bindingServiceTypeDTO);Liststrings=bindingLis
电力行业 | 抽水蓄能场景下，百万测点数据如何统一采集与接入？ DolphinDB智臾科技物联网 dolphindb 数据库抽水蓄能电力数据采集数据接入
在电力行业，抽水蓄能是目前最成熟、已经大规模化应用、兼顾发电和储能的一项技术。为了保障电站的平稳运行，借助物联网、大数据等技术，对电站各类运行设备进行实时采集，如机组振动、油压波动、瓦温变化等生产监测数据，已成为电站稳定运维的重要技术手段。在之前的文章储能业|低成本部署！DolphinDB打造抽水蓄能一体化解决方案-CSDN博客中，我们介绍了DolphinDB在抽水蓄能场景中的全链路解决方案。今天
单表高效管理异构数据：点位管理引擎快速上手指南 DolphinDB智臾科技工业物联网物联网 DolphinDB 物联网点位点位管理数据处理
点位即设备上用于采集、监测和控制的各类传感器和执行器，是物联网应用场景中最重要的数据单位，通过对众多点位进行管理，企业可以实现设备监控预警、实时监测等方案。高效地存储和管理点位数据对于每一个企业和用户而言都是至关重要的。在本篇文章中，我们将详细介绍如何使用DolphinDB点位管理引擎（IOTDB引擎）来管理和存储复杂的点位数据，提升点位数据管理效率。本教程提供完整的测试代码和测试数据，初学者也可
Java List＜Long＞转List＜String＞剩下的远方开发 java
直接上示例：有时候需要将Long集合转为String类型的集合。finalStringcontractLineNumList=shareContractListEntities.stream().map(ShareContractListEntity::getContractLineNum).map(x->x+“”).collect(Collectors.joining(","));分析：shar
【C#程序设计】教学讲义——第二章：简单C#程序设计刘一哥GIS 《GIS程序设计》C#程序设计谭浩强面向对象类
教学目录2.1面向对象的概念2.2建立简单的应用程序2.3窗体和Label控件2.4文本框-属性2.5按钮控件本章小结2.1面向对象的概念2.1.1对象和类1.对象对象是客观世界中对象的模型化。对象是有着特殊数据（属性）与操作（行为）的实体，对象的操作（行为）称为方法。程序中的对象是模型化了的客观世界的对象，它是代码和数据的封装体，用数据表示属性，用代码（过程或函数）表示方法。一个程序对象的属性用
C#哈希加密：原理、实现与应用阿蒙Armon C#工作中的应用 c#哈希算法开发语言
C#哈希加密：原理、实现与应用在当今数字化时代，数据安全是每个应用程序都必须重视的问题。哈希加密作为一种重要的加密技术，在密码存储、数据完整性验证、数字签名等领域发挥着关键作用。本文将深入探讨C#中哈希加密的原理、常用算法以及实际应用，并通过代码示例展示如何在C#中实现哈希加密。一、哈希加密基础哈希加密（也称为哈希函数或散列函数）是一种将任意长度的输入数据转换为固定长度输出的算法。这个固定长度的输
Vxe-table @cell-click 事件中，传递给处理函数的入参对象墨着染霜华 javascript 前端 html
在vxe-table的@cell-click事件中，传递给处理函数的对象包含了丰富的信息，可以帮助你了解用户点击的单元格的详细情况。根据vxe-table的文档和使用惯例，这个对象通常包含以下属性：主要属性row:当前行的数据对象。$rowIndex:当前行的索引（从0开始）。column:当前列的信息对象，其中包含：field:列绑定的数据字段名。title:列标题。等其他列配置项...$col
Django ORM 1. 创建模型（Model）博观而约取 Python django 数据库 python
1.ORM介绍什么是ORM？ORM，全称Object-RelationalMapping（对象关系映射），一种通过对象操作数据库的技术。它的核心思想是：我们不直接写SQL，而是用Python对象（类/实例）来操作数据库表和记录。ORM就像一个“翻译官”，帮我们把Python代码翻译成数据库能听懂的SQL命令。为什么使用ORM?Django中的ORM提供了一个高层次、抽象化的接口来操作数据库，它的优
JavaScript 数组操作大全 csdn_HPL JavaScript javascript 前端开发语言
JavaScript提供了丰富的数组操作方法，可以分为以下几类：创建数组//字面量方式constarr1=[1,2,3];//构造函数方式constarr2=newArray(1,2,3);//创建指定长度的空数组constarr3=newArray(5);//创建长度为5的空数组//Array.of()-解决构造函数参数歧义问题constarr4=Array.of(5);//[5],而不是长度为
探秘SQLite：打造高效嵌入式数据库应用的实用指南 dfvcbipanjr 数据库 sqlite oracle python
探秘SQLite：打造高效嵌入式数据库应用的实用指南SQLite是一种广泛应用的嵌入式数据库引擎，因其不依赖于独立的服务器进程，且在各大操作系统、浏览器、手机等设备中都能找到它的身影，成为开发者的首选。这篇文章旨在介绍SQLite的基本概念、使用方法以及一些实用的编程示例，帮助您更好地在应用中嵌入SQLite数据库。主要内容1.SQLite简介SQLite是用C语言编写的一个轻量级数据库引擎，被设
MyBatis-Plus 分页功能详解
MyBatis-Plus分页功能详解1.前言MyBatis-Plus是MyBatis的增强工具，在MyBatis的基础上只做增强不做改变，简化开发、提高效率。其中分页功能是日常开发中非常常用的功能，本文将详细介绍MyBatis-Plus的分页功能使用。2.配置分页插件首先需要在SpringBoot项目中配置分页插件：@ConfigurationpublicclassMybatisPlusConfi
PettingZoo:多智能体强化学习的标准API 资源存储库多智能体强化学习人工智能深度学习
PettingZoo:AStandardAPIforMulti-AgentReinforcementLearningPettingZoo:多智能体强化学习的标准API目录Abstract摘要1Introduction1介绍2BackgroundandRelatedWorks2背景及相关工作2.1PartiallyObservableStochasticGamesandRLlib2.1部分可观察随机
浅谈Qt和C++的关系 Terrarily qt5 qt c++
Qt和C++Qt是QML和JavaScript的C++扩展功能工具包，并且Qt是由C++开发的，所以C++贯穿了整个Qt的项目。我会着重从c++的角度来介绍Qt。从C++的角度分析Qt，然后你会发现Qt通过内省数据的机制实现了许多现代语言的特性。这个是通过Qt的基础类QObject来实现的。Qt使用源对象信息实现了信号和槽的回调绑定。每个信号都能绑定任意数量的槽函数或者其他的信号。当一个信号弄一个
Qt设置窗口置顶（避免窗口隐藏）空名Noname qt
转自个人博客方法一说在前面：本方法比较通用，但经过我的使用，发现其存在问题，而下面方法二正常使用存在问题：在窗口置顶后，会自动隐藏，即便在设置窗口置顶后手动对窗口使用show()或setVisible(true)等方法显示出来，也会出现窗口闪烁的现象，极不自然。对你的主窗口QMainWindow或者主控件QWidget使用以下方法，都是Qt自带的。窗口置顶也是一个标志，先获取窗口已有的所有标志，再
C++使用大小括号初始化变量空名Noname c++开发语言
转自个人博客本文对普通变量、普通类对象在初始化时使用()和{}的情况进行区分说明，以免混淆不清。一般使用()是使用构造函数初始化，使用{}是使用列表初始化，如下。1.基本初始化（略过）这里大概对基本初始化方式做一个归纳1.1默认初始化即只声明，让其调用默认构造函数。对于基本变量类型（如int、double…），只声明就不会定义具体的初始值。对于类对象，就会调用可以不用填参数的默认构造函数，如果没有
Python开发AI智能体(三)———Langchain定义提示词模板【本人】 Agent智能体 python 人工智能 langchain 语言模型
前言上篇文章给大家介绍AI项目检测平台LangSmish以及开源框架Langchain的使用，并且带领大家编写了一个案例。这篇文章将介绍在Langchain框架中如何定义提示词模板一、什么是提示词模板？提示词模板（PromptTemplate）是大语言模型（LLM）应用开发中的核心概念，本质是预定义的提示结构框架。它通过将静态文本与动态变量结合，实现标准化、可复用的提示生成机制。它提示词可以是一个
一文教你学会使用 ts 泛型；ts 泛型常用知识点 GGhhccc javascript 开发语言前端 typescript
文章目录1.泛型是什么？为什么要用泛型？2.泛型如何使用泛型类泛型约束3.泛型部分实用工具类型ExcludeExtractOmitPick4.结语最近回头复习了一下ts泛型的知识，做一些笔记的总结分享~1.泛型是什么？为什么要用泛型？引用官网的例子，此时有一个需求：我们要定义一个函数，他会返回任何传入他的值。这个情况下，我们如果已知他的数据类型（假定是number），就可以写出以下代码：funct
将Python Tkinter程序转换为手机可运行的Web应用 - 详细教程随机森林404 python 智能手机前端
前言作为一名Python开发者，你可能已经使用Tkinter创建了一些桌面GUI应用。但是如何让这些应用也能在手机上运行呢？本教程将详细介绍如何将基于Tkinter的Python程序转换为手机可访问的Web应用，让你的应用随时随地可用！一、为什么需要转换？Tkinter是Python的标准GUI库，但它主要针对桌面环境。移动设备(Android/iOS)上无法直接运行Tkinter程序，主要原因有
TS中的泛型（学习笔记）小码龙~ TS 学习笔记前端 typescript
文章目录前言一、泛型是什么？二、泛型的分类三、泛型的基本使用3.1函数中的泛型使用3.2接口中的泛型使用(运用广泛)3.2类型别名中的泛型使用(运用广泛)3.2类中的泛型使用总结前言泛型的基本使用一、泛型是什么？泛型（Generics）是指在定义函数、接⼝或类的时候，不预先指定具体的类型，⽽在使⽤的时候再指定类型的⼀种特性，简单来说泛型其实就是类型参数，在定义的时候定义形参(类型变量)，使⽤的时候
【Linux】nmcli设置bond 在成都搬砖的鸭鸭 Linux linux 运维
目录1、介绍2、配置步骤【1】创建bond连接【2】添加从属接口【3】激活bond口1、介绍nmcli是NetworkManager提供的网络管理工具，nmcli设置的bond可以持久化，因为会写入配置文件，下面我们就来通过nmcli来配置bond聚合口。2、配置步骤【1】创建bond连接[root@xxx~]#nmcliconnaddtypebondcon-namebond0ifnamebond
TS 函数泛型和泛型约束邱志刚 TS 前端
仅供参考，自己学习记笔记。//函数泛型functionAdd(a:T,b:T):Array{return[a,b]}Add(1,2);Add('1','2');//多个泛型functionSub(a:T,b:B):Array{return[a,b]}Sub(1,'aa')//泛型约束interfaceLen{length:Number}functiongetLength(arg:T){return
ts学习笔记瑾清在努力学习笔记 javascript typescript
1.介绍ts是js的超集，他融合了其他语言的优势，将js带到了一个新的高度js,es,ts的关系：ECMAScript是JavaScript的标准，TypeScript是JavaScript的超集2.为什么使用ts？1.发现问题js---运行后报错ts---运行之前可检查出错误（静态类型检查）2.非异常故障错别字，未调用函数，基本逻辑错误constuser={name:'小明'，age:26}us
（转载）20个JavaScript重点知识点（11）this机制 lzhdim javascript 前端 vue.js 开发语言 ecmascript
this是JavaScript中最容易让人困惑的概念之一。它的指向取决于函数的调用方式而非定义位置，且在不同场景下表现不同。一、this的本质this是一个动态绑定的执行上下文对象，指向当前函数运行时的“所有者”。它的值在函数被调用时确定，而非定义时。理解this的关键在于分析函数是如何被调用的。二、绑定规则1.默认绑定(独立函数调用)当函数作为独立函数调用时(非方法、构造函数等)，非严格模式下t
JS学习日记（jQuery库）红中马喽 javascript 学习 jquery 笔记开发语言
前言今天先更新jQuery库的介绍，它是一个用来帮助快速开发的工具介绍jQuery是一个快速，小型且功能丰富的JavaScript库，jQuery设计宗旨是“writeless，domore”，即倡导写更少的代码，做更多的事，它封装JavaScript常用的功能代码，提供一种简便的方式进行使用，大大提高了开发效率，jQuery目前支持的浏览器包括Chrome，edge，firefox，ie9+,S
番外：MySQL的一些事务处理红中马喽 mysql 数据库学习笔记开发语言后端
前言因为前天没更新，多补一更，简单介绍一下后端数据库MySQL的事务处理什么是事务处理事务（Transaction）：事务是一组SQL语句的执行单元，这些语句被视为一个单独的工作单元。事务的主要目的是保证数据库操作的原子性，即这些操作要么全部执行，要么全部不执行简单来说，事务是用来保证数据库的一致性，完整性的，关于事务处理我们需要提到ACID性A.原子性（Atomicity）：事务中的所有操作要么
【LeetCode】滑动窗口相关算法题在成都搬砖的鸭鸭 Golang刷LeetCode 算法 leetcode
目录1、介绍2、核心思想3、算法题【1】长度最小的子数组1、介绍滑动窗口算法是一种高效处理数组/字符串子序列化问题的技术，它通过维护一个动态的窗口来避免不必要的重复计算。2、核心思想1、窗口定义：使用两个指针表示当前考察的子序列2、窗口移动：右指针扩张，扩大窗口范围，包含新元素；左指针收缩，缩小窗口范围，排除旧元素3、状态维护：在窗口移动过程中维护关键状态信息3、算法题【1】长度最小的子数组Lee
TS泛型笔记红中马喽笔记
1.泛型基础概念定义：泛型是TypeScript中允许创建可复用组件的特性，这些组件可以支持多种数据类型，而非单一特定类型。核心优势：代码复用性：同一组件可处理不同类型数据类型安全：在编译阶段捕获类型错误灵活性：保持代码的灵活性同时提供强类型支持泛型函数//基础泛型函数语法functionidentity(arg:T):T{returnarg;}//使用方式constresult=identity
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key