fengbingchun

SSE2 Intrinsics各函数介绍

SIMD相关头文件包括：

//#include <ivec.h>//MMX
//#include <fvec.h>//SSE(also include ivec.h)
//#include <dvec.h>//SSE2(also include fvec.h)


#include <mmintrin.h> //MMX
#include <xmmintrin.h> //SSE(include mmintrin.h)
#include <emmintrin.h> //SSE2(include xmmintrin.h)
#include <pmmintrin.h> //SSE3(include emmintrin.h)
#include <tmmintrin.h>//SSSE3(include pmmintrin.h)
#include <smmintrin.h>//SSE4.1(include tmmintrin.h)
#include <nmmintrin.h>//SSE4.2(include smmintrin.h)
#include <wmmintrin.h>//AES(include nmmintrin.h)
#include <immintrin.h>//AVX(include wmmintrin.h)
#include <intrin.h>//(include immintrin.h)

mmintrin.h为MMX 头文件，其中__m64的定义为：

typedef union __declspec(intrin_type) _CRT_ALIGN(8) __m64
{
    unsigned __int64    m64_u64;
    float               m64_f32[2];
    __int8              m64_i8[8];
    __int16             m64_i16[4];
    __int32             m64_i32[2];    
    __int64             m64_i64;
    unsigned __int8     m64_u8[8];
    unsigned __int16    m64_u16[4];
    unsigned __int32    m64_u32[2];
} __m64;

xmmintrin.h为SSE 头文件，此头文件里包含MMX头文件，其中__m128的定义为：

typedef union __declspec(intrin_type) _CRT_ALIGN(16) __m128 {
     float               m128_f32[4];
     unsigned __int64    m128_u64[2];
     __int8              m128_i8[16];
     __int16             m128_i16[8];
     __int32             m128_i32[4];
     __int64             m128_i64[2];
     unsigned __int8     m128_u8[16];
     unsigned __int16    m128_u16[8];
     unsigned __int32    m128_u32[4];
 } __m128;

emmintrin.h为SSE2头文件，此头文件里包含SSE头文件，其中__m128i和__m128d的定义为：

typedef union __declspec(intrin_type) _CRT_ALIGN(16) __m128i {
    __int8              m128i_i8[16];
    __int16             m128i_i16[8];
    __int32             m128i_i32[4];    
    __int64             m128i_i64[2];
    unsigned __int8     m128i_u8[16];
    unsigned __int16    m128i_u16[8];
    unsigned __int32    m128i_u32[4];
    unsigned __int64    m128i_u64[2];
} __m128i;

typedef struct __declspec(intrin_type) _CRT_ALIGN(16) __m128d {
    double              m128d_f64[2];
} __m128d;

emmintrin.h文件中各函数的介绍：

	/*----Floating-Point Intrinsics Using Streaming SIMD Extension 2 Instructions----*/
	//Arithmetic Operations(Floating Point):add、sub、mul、div、sqrt、min、max
	//返回一个__m128d的寄存器，r0=_A0+_B0, r1=_A1
	extern __m128d _mm_add_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0+_B0, r1=_A1+_B1
	extern __m128d _mm_add_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0-_B0, r1=_A1
	extern __m128d _mm_sub_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0-_B0, r1=_A1-_B1
	extern __m128d _mm_sub_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0*_B0, r1=_A1
	extern __m128d _mm_mul_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0*_B0, r1=_A1*_B1
	extern __m128d _mm_mul_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=sqrt(_B0), r1=_A1
	extern __m128d _mm_sqrt_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=sqrt(_A0), r1=sqrt(_A1)
	extern __m128d _mm_sqrt_pd(__m128d _A);
	//返回一个__m128d的寄存器，r0=_A0/_B0, r1=_A1
	extern __m128d _mm_div_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0/_B0, r1=_A1/_B1
	extern __m128d _mm_div_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=min(_A0,_B0), r1=_A1
	extern __m128d _mm_min_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=min(_A0,_B0), r1=min(_A1,_B1)
	extern __m128d _mm_min_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=max(_A0,_B0), r1=_A1
	extern __m128d _mm_max_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=max(_A0,_B0), r1=max(_A1,_B1)
	extern __m128d _mm_max_pd(__m128d _A, __m128d _B);

	//Logical Operations(Floating Point SSE2 Intrinsics):and、or、xor、 andnot
	//返回一个__m128d的寄存器，r0=_A0 & _B0, r1=_A1 & _B1
	extern __m128d _mm_and_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(~_A0) & _B0, r1=(~_A1) & _B1
	extern __m128d _mm_andnot_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0 | _B0, r1=_A1 | _B1
	extern __m128d _mm_or_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0 ^ _B0, r1=_A1 ^ _B1
	extern __m128d _mm_xor_pd(__m128d _A, __m128d _B);

	//Comparisions:==、<、<=、>、>=、!=
	//返回一个__m128d的寄存器，r0=(_A0 == _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpeq_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 == _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 == _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpeq_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 < _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmplt_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 < _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 < _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmplt_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmple_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 <= _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmple_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 > _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpgt_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 > _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 > _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpgt_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 >= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpge_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 >= _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 >= _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpge_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 != _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpneq_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 != _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 != _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpneq_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 < _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpnlt_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 < _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=!(_A1 < _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpnlt_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpnle_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 <= _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=!(_A1 <= _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpnle_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 > _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpngt_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 > _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=!(_A1 > _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpngt_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 >= _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpnge_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=!(_A0 >= _B0) ? 0xffffffffffffffff : 0x0,
	//r1=!(_A1 >= _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpnge_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 ord _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 ord _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpord_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 ord _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpord_sd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 unord _B0) ? 0xffffffffffffffff : 0x0, 
	//r1=(_A1 unord _B1) ? 0xffffffffffffffff : 0x0
	extern __m128d _mm_cmpunord_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(_A0 unord _B0) ? 0xffffffffffffffff : 0x0, r1=_A1
	extern __m128d _mm_cmpunord_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 != _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
	extern int _mm_comieq_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 < _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
	extern int _mm_comilt_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 <= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
	extern int _mm_comile_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 > _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
	extern int _mm_comigt_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 >= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
	extern int _mm_comige_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 != _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
	extern int _mm_comineq_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 == _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
	extern int _mm_ucomieq_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 < _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
	extern int _mm_ucomilt_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 <= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 1 is returned
	extern int _mm_ucomile_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 > _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
	extern int _mm_ucomigt_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 >= _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
	extern int _mm_ucomige_sd(__m128d _A, __m128d _B);
	//返回一个0或1的整数，r=(_A0 != _B0) ? 0x1 : 0x0, If _A and _B is a NaN, 0 is returned
	extern int _mm_ucomineq_sd(__m128d _A, __m128d _B);

	//Conversion Operations
	//返回一个__m128d的寄存器，r0=(dobule)_A0, r1=(double)_A1
	extern __m128d _mm_cvtepi32_pd(__m128i _A);
	//返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=0x0, r3=0x0
	extern __m128i _mm_cvtpd_epi32(__m128d _A);
	//返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=0x0, r3=0x0,using truncate
	extern __m128i _mm_cvttpd_epi32(__m128d _A);
	//返回一个__m128的寄存器，r0=(flaot)_A0, r1=(float)_A1, r2=(float)_A2, r3=(float)_A3
	extern __m128 _mm_cvtepi32_ps(__m128i _A);
	//返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=(int)_A2, r3=(int)_A3
	extern __m128i _mm_cvtps_epi32(__m128 _A);
	//返回一个__m128i的寄存器，r0=(int)_A0, r1=(int)_A1, r2=(int)_A2, r3=(int)_A3,using truncate
	extern __m128i _mm_cvttps_epi32(__m128 _A);
	//返回一个__m128的寄存器，r0=(flaot)_A0, r1=(float)_A1, r2=0.0, r3=0.0
	extern __m128 _mm_cvtpd_ps(__m128d _A);
	//返回一个__m128d的寄存器，r0=(dobule)_A0, r1=(double)_A1
	extern __m128d _mm_cvtps_pd(__m128 _A);
	//返回一个__m128的寄存器，r0=(float)_B0, r1=_B1, r2=_B2, r3=_B3
	extern __m128 _mm_cvtsd_ss(__m128 _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=(double)_B0, r1=_A1
	extern __m128d _mm_cvtss_sd(__m128d _A, __m128 _B);
	//返回一个32bit整数，r=(int)_A0
	extern int _mm_cvtsd_si32(__m128d _A);
	//返回一个32bit整数，r=(int)_A0,using truncate
	extern int _mm_cvttsd_si32(__m128d _A);
	//返回一个__m128d的寄存器，r0=(double)_B, r1=_A1
	extern __m128d _mm_cvtsi32_sd(__m128d _A, int _B);
	//返回一个__m64的寄存器，r0=(int)_A0, r1=(int)_A1
	extern __m64 _mm_cvtpd_pi32(__m128d _A);
	//返回一个__m64的寄存器，r0=(int)_A0, r1=(int)_A1,using truncate
	extern __m64 _mm_cvttpd_pi32(__m128d _A);
	//返回一个__m128d的寄存器，r0=(dobule)_A0, r1=(double)_A1
	extern __m128d _mm_cvtpi32_pd(__m64 _A);

	//Miscellaneous Operations(Floating-Point SSE2 Intrinsics)
	//返回一个__m128d的寄存器，r0=_A1, r1=_B1
	extern __m128d _mm_unpackhi_pd(__m128d _A, __m128d _B);
	//返回一个__m128d的寄存器，r0=_A0, r1=_B0
	extern __m128d _mm_unpacklo_pd(__m128d _A, __m128d _B);
	//返回一个2bit整数，r=sign(_A1) << 1 | sign(_A0)
	extern int _mm_movemask_pd(__m128d _A);
	//返回一个__m128d的寄存器，Selects two specific double-precision,
	// floating-point values from _A and _B, based on the mask _I,
	//The mask must be an immediate
	extern __m128d _mm_shuffle_pd(__m128d _A, __m128d _B, int _I);

	//Load Operations(Floating-Point SSE2 Intrinsics)
	//返回一个__m128d的寄存器，r0=_Dp[0], r1=_Dp[1], The address _Dp must be 16-byte aligned
	extern __m128d _mm_load_pd(double const*_Dp);
	//返回一个__m128d的寄存器，r0=*_Dp, r1=*_Dp, The address _Dp does not need
	//to be 16-byte aligned
	extern __m128d _mm_load1_pd(double const*_Dp);
	//返回一个__m128d的寄存器，r0=_Dp[1], r1=_Dp[0], The address _Dp must be 16-byte aligned
	extern __m128d _mm_loadr_pd(double const*_Dp);
	//返回一个__m128d的寄存器，r0=_Dp[0], r1=_Dp[1], The address _Dp does not 
	//need to be 16-byte aligned
	extern __m128d _mm_loadu_pd(double const*_Dp);
	//返回一个__m128d的寄存器，r0=*_Dp, r1=0.0, The address _Dp does not 
	//need to be 16-byte aligned
	extern __m128d _mm_load_sd(double const*_Dp);
	//返回一个__m128d的寄存器，r0=_A0, r1=*_Dp, The address _Dp does not 
	//need to be 16-byte aligned
	extern __m128d _mm_loadh_pd(__m128d _A, double const*_Dp);
	//返回一个__m128d的寄存器，r0=*_Dp, r1=_A1, The address _Dp does not
	//need to be 16-byte aligned
	extern __m128d _mm_loadl_pd(__m128d _A, double const*_Dp);

	//Set Operations(Floating-Point SSE2 Intrinsics)
	//返回一个__m128d的寄存器，r0=_W, r1=0.0
	extern __m128d _mm_set_sd(double _W);
	//返回一个__m128d的寄存器，r0=_A, r1=_A
	extern __m128d _mm_set1_pd(double _A);
	//返回一个__m128d的寄存器，r0=_Y, r1=_Z
	extern __m128d _mm_set_pd(double _Z, double _Y);
	//返回一个__m128d的寄存器，r0=_Y, r1=_Z
	extern __m128d _mm_setr_pd(double _Y, double _Z);
	//返回一个__m128d的寄存器，r0=0.0, r1=0.0
	extern __m128d _mm_setzero_pd(void);
	//返回一个__m128d的寄存器，r0=_B0, r1=_A1
	extern __m128d _mm_move_sd(__m128d _A, __m128d _B);

	//Store Operations(Floating-Point SSE2 Intrinsics)
	//返回为空，*_Dp=_A0, The address _Dp does not need to be 16-byte aligned
	extern void _mm_store_sd(double *_Dp, __m128d _A);
	//返回为空，_Dp[0]=_A0, _Dp[1]=_A0, The address _Dp must be 16-byte aligned
	extern void _mm_store1_pd(double *_Dp, __m128d _A);
	//返回为空，_Dp[0]=_A0, _Dp[1]=_A1, The address _Dp must be 16-byte aligned
	extern void _mm_store_pd(double *_Dp, __m128d _A);
	//返回为空，_Dp[0]=_A0, _Dp[1]=_A1, The address _Dp does not need to be 16-byte aligned
	extern void _mm_storeu_pd(double *_Dp, __m128d _A);
	//返回为空，_Dp[0]=_A1, _Dp[1]=_A0, The address _Dp must be 16-byte aligned
	extern void _mm_storer_pd(double *_Dp, __m128d _A);
	//返回为空，*_Dp=_A1
	extern void _mm_storeh_pd(double *_Dp, __m128d _A);
	//返回为空，*_Dp=_A0
	extern void _mm_storel_pd(double *_Dp, __m128d _A);

	//new convert to float
	//返回一个64bit double类型，r=_A0, Extracts the lower order floating point value
	extern double _mm_cvtsd_f64(__m128d _A);

	//Cache Support for Streaming SIMD Extensions 2 Floating-Point Operations
	//返回为空，_Dp[0]=_A0, _Dp[1]=_A1, Stores the data in _A to the address _Dp without
	//polluting caches. The address _Dp must be 16-byte aligned. If the cache line 
	//containing address _Dp is already in the cache, the cache will be updated
	extern void _mm_stream_pd(double *_Dp, __m128d _A);

	/*------------Integer Intrinsics Using Streaming SIMD Extensions 2-------------*/
	//Arithmetic Operations(Integer SSE2 Intrinsics):add、sub、mul、avg、min、max
	//返回一个__m128i的寄存器，r0=_A0+_B0, r1=_A1+_B1, ... r15=_A15+_B15
	extern __m128i _mm_add_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相加，
	//即ri=_Ai+_Bi(r0=_A0+_B0, r1=_A1+_B1, ... r7=_A7+_B7)
	extern __m128i _mm_add_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=_A0+_B0, r1=_A1+_B1, r2=_A2+_B2, r3=_A3+_B3
	extern __m128i _mm_add_epi32(__m128i _A, __m128i _B);
	//返回一个__m64的寄存器，r=_A+_B
	extern __m64 _mm_add_si64(__m64 _A, __m64 _B);
	//返回一个__m128i的寄存器，r0=_A0+_B0, r1=_A1+_B1
	extern __m128i _mm_add_epi64(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=SignedSaturate(_A0+_B0), r1=SignedSaturate(_A1+_B1), ... 
	//r15=SignedSaturate(_A15+_B15), saturates
	extern __m128i _mm_adds_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相加，
	//r0=SignedSaturate(_A0+_B0), r1=SignedSaturate(_A1+_B1), ... 
	//r7=SignedSaturate(_A7+_B7), 当计算结果溢出时将其置为边界值(saturates)
	extern __m128i _mm_adds_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0+_B0), r1=UnsignedSaturate(_A1+_B1), ... 
	//r15=UnsignedSaturate(_A15+_B15), saturates
	extern __m128i _mm_adds_epu8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0+_B0), r1=UnsignedSaturate(_A1+_B1), ... 
	//r7=UnsignedSaturate(_A7+_B7), saturates
	extern __m128i _mm_adds_epu16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0+_B0)/2, r1=(_A1+_B1)/2, ... r15=(_A15+_B15)/2, rounds
	extern __m128i _mm_avg_epu8(__m128i _A, __m128i _B); 
	//返回一个__m128i的寄存器，将_A和_B中对应位置的16bit无符号整数取平均，
	//即ri=(_Ai+_Bi)/2(r0=(_A0+_B0)/2, r1=(_A1+_B1)/2, ... r7=(_A7+_B7)/2), rounds
	extern __m128i _mm_avg_epu16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它含有4个有符号或无符号32bit的整数，
	//分别满足：r0=(_A0*_B0)+(_A1*_B1), r1=(_A2*_B2)+(_A3*_B3), 
	//r2=(_A4*_B4)+(_A5*_B5), r3=(_A6*_B6)+(_A7*_B7)
	extern __m128i _mm_madd_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，取_A和_B中对应位置的16bit有符号或无符号整数的最大值，
	//即ri=max(_Ai,_Bi) (r0=max(_A0,_B1), r1=max(_A1,_B1), ... r7=max(_A7,_B7))
	extern __m128i _mm_max_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=max(_A0,_B1), r1=max(_A1,_B1), ... r15=max(_A15,_B15)
	extern __m128i _mm_max_epu8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，取_A和_B中对应位置的16bit有符号或无符号整数的最小值，
	//即ri=min(_Ai, _Bi)(r0=min(_A0,_B1), r1=min(_A1,_B1), ... r7=min(_A7,_B7))
	extern __m128i _mm_min_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=min(_A0,_B1), r1=min(_A1,_B1), ... r15=min(_A15,_B15)
	extern __m128i _mm_min_epu8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它含8个有符号或无符号16bit的整数，分别为_A和_B对应位置的16bit
	//有符号或无符号整数相乘结果的高16bit数据，即ri=(_Ai*_Bi)[31:16](r0=(_A0*_B0)[31:16], 
	//r1=(_A1*_B1)[31:16] ... r7=(_A7*_B7)[31:16])
	extern __m128i _mm_mulhi_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0*_B0)[31:16], r1=(_A1*_B1)[31:16] ... r7=(_A7*_B7)[31:16]
	extern __m128i _mm_mulhi_epu16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它含8个有符号或无符号16bit的整数，分别为_A和_B对应位置的16bit
	//有符号或无符号整数相乘结果的低16bit数据，即ri=(_Ai*_Bi)[15:0](r0=(_A0*_B0)[15:0], 
	//r1=(_A1*_B1)[15:0] ... r7=(_A7*_B7)[15:0])
	extern __m128i _mm_mullo_epi16(__m128i _A, __m128i _B);
	//返回一个__m64的寄存器，r=_A0*_B0
	extern __m64 _mm_mul_su32(__m64 _A, __m64 _B);
	//返回一个__m128i的寄存器，r0=_A0*_B0, r1=_A2*_B2
	extern __m128i _mm_mul_epu32(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=abs(_A0-_B0) + abs(_A1-_B1) + ... + abs(_A7-_B7), 
	//r1=0x0,r2=0x0, r3=0x0, r4=abs(_A8-_B8) + abs(_A9-_B9) + ... + abs(_A15-_B15), 
	//r5=0x0, r6=0x0, r7=0x0
	extern __m128i _mm_sad_epu8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=_A0-_B0, r1=_A1-_B1, ... r15=_A15-_B15
	extern __m128i _mm_sub_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相减，
	//即ri=_Ai-_Bi(r0=_A0-_B0, r1=_A1-_B1, ... r7=_A7-_B7)
	extern __m128i _mm_sub_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=_A0-_B0, r1=_A1-_B1, r2=_A2-_B2, r3=_A3-_B3
	extern __m128i _mm_sub_epi32(__m128i _A, __m128i _B);
	//返回一个__m64的寄存器，r=_A-_B
	extern __m64 _mm_sub_si64(__m64 _A, __m64 _B);
	//返回一个__m128i的寄存器，r0=_A0-_B0, r1=_A1-_B1
	extern __m128i _mm_sub_epi64(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=SignedSaturate(_A0-_B0), r1=SignedSaturate(_A1-_B1), ... 
	//r15=SignedSaturate(_A15-_B15), saturate
	extern __m128i _mm_subs_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将_A和_B中对应位置的16bit有符号或无符号整数分别相减，
	//当计算结果溢出时将其置为边界值(saturate), r0=SignedSaturate(_A0-_B0), 
	//r1=SignedSaturate(_A1-_B1), ... r7=SignedSaturate(_A7-_B7)
	extern __m128i _mm_subs_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0-_B0), r1=UnsignedSaturate(_A1-_B1), ...
	//r15=UnsignedSaturate(_A15-_B15), saturate
	extern __m128i _mm_subs_epu8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0-_B0), r1=UnsignedSaturate(_A1-_B1), ... 
	//r15=UnsignedSaturate(_A7-_B7), saturate
	extern __m128i _mm_subs_epu16(__m128i _A, __m128i _B);

	//Logical Operations(Integer SSE2 Intrinsics):and、or、xor、andnot
	//返回一个__m128i的寄存器，将寄存器_A和寄存器_B的对应位进行按位与运算, r=_A & _B
	extern __m128i _mm_and_si128(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将寄存器_A每一位取非，然后和寄存器_B的每一位进行按位与运算,
	//r=(~_A) & _B
	extern __m128i _mm_andnot_si128(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将寄存器_A和寄存器_B的对应位进行按位或运算, r=_A | _B
	extern __m128i _mm_or_si128(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，将寄存器_A和寄存器_B的对应位进行按位异或运算, r=_A ^ _B
	extern __m128i _mm_xor_si128(__m128i _A, __m128i _B);

	//Shift Operations
	//返回一个__m128i的寄存器，r=_A << (_Imm * 8),  _Imm must be an immediate,  
	//shifting in zeros
	extern __m128i _mm_slli_si128(__m128i _A, int _Imm);
	//返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count进行相同的逻辑左移,
	//r0=_A0 << _Count, r1=_A1 << _Count, ... r7=_A7 << count,  shifting in zeros
	extern __m128i _mm_slli_epi16(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count寄存器中对应位置的整数
	//进行逻辑左移, r0=_A0 << _Count, r1=_A1 << _Count, ... r7=_A7 << count,  shifting in zeros
	extern __m128i _mm_sll_epi16(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count, r2=_A2 << count, 
	//r3=_A3 << count,  shifting in zeros
	extern __m128i _mm_slli_epi32(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count, r2=_A2 << count, 
	//r3=_A3 << count,  shifting in zeros
	extern __m128i _mm_sll_epi32(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count,  shifting in zeros
	extern __m128i _mm_slli_epi64(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，r0=_A0 << _Count, r1=_A1 << _Count,  shifting in zeros
	extern __m128i _mm_sll_epi64(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count进行相同的算术右移,
	//r0=_A0 >> _Count, r1=_A1 >> _Count, ... r7=_A7 >> count,  shifting in the sign bit
	extern __m128i _mm_srai_epi16(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count寄存器中对应位置的整数进行
	//算术右移,r0=_A0 >> _Count, r1=_A1 >> _Count, ... r7=_A7 >> count,  shifting in the sign bit
	extern __m128i _mm_sra_epi16(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，r0=_A0 >> _Count, r1=_A1 >> _Count, r3=_A3 >> count, 
	//r4=_A4 >> count,  shifting in the sign bit
	extern __m128i _mm_srai_epi32(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，r0=_A0 >> _Count, r1=_A1 >> _Count, r3=_A3 >> count,
	//r4=_A4 >> count,  shifting in the sign bit
	extern __m128i _mm_sra_epi32(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，r=srl(_A, _Imm * 8),   _Imm must be an immediate,  
	//shifting in zeros
	extern __m128i _mm_srli_si128(__m128i _A, int _Imm);
	//返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count进行相同的逻辑右移，
	//移位填充值为0,r0=srl(_A0, _Count), r1=srl(_A1, _Count), ... r7=srl(_A7, _Count), 
	//shifting in zeros
	extern __m128i _mm_srli_epi16(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，将寄存器_A中的8个16bit整数按照_Count寄存器中对应位置的整数
	//进行逻辑右移，移位填充值为0, r0=srl(_A0, _Count), r1=srl(_A1, _Count), ... 
	//r7=srl(_A7, _Count),  shifting in zeros
	extern __m128i _mm_srl_epi16(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), r2=srl(_A2, _Count),
	//r3=srl(_A3, _Count),  shifting in zeros
	extern __m128i _mm_srli_epi32(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), r2=srl(_A2, _Count),
	//r3=srl(_A3, _Count),  shifting in zeros
	extern __m128i _mm_srl_epi32(__m128i _A, __m128i _Count);
	//返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), shifting in zeros
	extern __m128i _mm_srli_epi64(__m128i _A, int _Count);
	//返回一个__m128i的寄存器，r0=srl(_A0, _Count), r1=srl(_A1, _Count), shifting in zeros
	extern __m128i _mm_srl_epi64(__m128i _A, __m128i _Count);

	//Comparison Intrinsics(SSE2):==、>、<
	//返回一个__m128i的寄存器，r0=(_A0 == _B0) ? 0xff : 0x00, 
	//r1=(_A1 == _B1) ? 0xff : 0x0, ... r15=(_A15 == _B15) ? 0xff : 0x0
	extern __m128i _mm_cmpeq_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，分别比较寄存器_A和寄存器_B对应位置16bit整数是否相等，若相等，
	//该位置返回0xffff，否则返回0x0，即ri=(_Ai==_Bi)?0xffff:0x0(r0=(_A0 == _B0) ? 0xffff : 0x00, 
	//r1=(_A1 == _B1) ? 0xffff : 0x0, ... r7=(_A7 == _B7) ? 0xffff : 0x0)
	extern __m128i _mm_cmpeq_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0 == _B0) ? 0xffffffff : 0x00, 
	//r1=(_A1 == _B1) ? 0xffffffff : 0x0,
	//r2=(_A2 == _B2) ? 0xffffffff : 0x0, r3=(_A3 == _B3) ? 0xffffffff : 0x0
	extern __m128i _mm_cmpeq_epi32(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0 > _B0) ? 0xff : 0x00, r1=(_A1 > _B1) ? 0xff : 0x0, ...
	//r15=(_A15 > _B15) ? 0xff : 0x0
	extern __m128i _mm_cmpgt_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，分别比较寄存器_A的每个16bit整数是否大于寄存器_B对应位置16bit的整数，
	//若大于，该位置返回0xffff，否则返回0x0，
	//即ri=(_Ai>_Bi)?0xffff:0x0(r0=(_A0 > _B0) ? 0xffff : 0x00, 
	//r1=(_A1 > _B1) ? 0xffff : 0x0, ... r7=(_A7 > _B7) ? 0xffff : 0x0)
	extern __m128i _mm_cmpgt_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0 > _B0) ? 0xffffffff : 0x00,
	//r1=(_A1 > _B1) ? 0xffffffff : 0x0,
	//r2=(_A2 > _B2) ? 0xffffffff : 0x0, r3=(_A3 > _B3) ? 0xffffffff : 0x0
	extern __m128i _mm_cmpgt_epi32(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0 < _B0) ? 0xff : 0x00, r1=(_A1 < _B1) ? 0xff : 0x0, ... 
	//r15=(_A15 < _B15) ? 0xff : 0x0
	extern __m128i _mm_cmplt_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，分别比较寄存器_A的每个16bit整数是否小于寄存器_B对应位置16bit整数，
	//若小于，该位置返回0xffff，否则返回0x0，
	//即ri=(_Ai<_Bi)?0xffff:0x0(r0=(_A0 < _B0) ? 0xffff : 0x00, 
	//r1=(_A1 < _B1) ? 0xffff : 0x0, ... r7=(_A7 < _B7) ? 0xffff : 0x0)
	extern __m128i _mm_cmplt_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=(_A0 < _B0) ? 0xffffffff : 0x00,
	//r1=(_A1 < _B1) ? 0xffffffff : 0x0, 
	//r2=(_A2 < _B2) ? 0xffffffff : 0x0, r3=(_A3 < _B3) ? 0xffffffff : 0x0
	extern __m128i _mm_cmplt_epi32(__m128i _A, __m128i _B);

	//Conversion Intrinsics: int <-----> __m128i
	//返回一个__m128i的寄存器，r0=_A, r1=0x0, r2=0x0, r3=0x0
	extern __m128i _mm_cvtsi32_si128(int _A);
	//返回一个32bit整数，r=_A0
	extern int _mm_cvtsi128_si32(__m128i _A);

	//Miscellaneous Operations(Integer SSE2 Intrinsics)
	//返回一个__m128i的寄存器，r0=SignedSaturate(_A0), r1=SignedSaturate(_A1), ... 
	//r7=SignedSaturate(_A7), r8=SignedSaturate(_B0), r9=SignedSaturate(_B1), ... 
	//r15=SignedSaturate(_B7),  saturate
	extern __m128i _mm_packs_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=SignedSaturate(_A0), r1=SignedSaturate(_A1), 
	//r2=SignedSaturate(_A2),r3=SignedSaturate(_A3), r4=SignedSaturate(_B0), 
	//r5=SignedSaturate(_B1), r6=SignedSaturate(_B2), r7=SignedSaturate(_B3),  saturate
	extern __m128i _mm_packs_epi32(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=UnsignedSaturate(_A0), r1=UnsignedSaturate(_A1), ... 
	//r7=UnsignedSaturate(_A7),r8=UnsignedSaturate(_B0), r9=UnsignedSaturate(_B1), ... 
	//r15=UnsignedSaturate(_B7),  saturate
	extern __m128i _mm_packus_epi16(__m128i _A, __m128i _B);
	//返回一个16bit整数，根据_Imm从_A中8个16bit数中选取对应编号的数,
	//r=(_Imm == 0) ? _A0 : ((_Imm == 1) ? _A1 : ... (_Imm == 7) ? _A7), 
	//_Imm must be an immediate, zero extends
	extern int _mm_extract_epi16(__m128i _A, int _Imm);
	//返回一个__m128i的寄存器，根据_Imm将_A中8个16bit数中对应编号的数替换为_B,
	//r0=(_Imm == 0) ? _B : _A0; r1=(_Imm == 1) : _B : _A1, ... r7=(_Imm == 7) ? _B : _A7
	extern __m128i _mm_insert_epi16(__m128i _A, int _B, int _Imm);
	//返回一个16bit整数，r=(_A15[7] << 15) | (_A14[7] << 14) ... (_A1[7] << 1) | _A0[7], 
	//zero extends the upper bits
	extern int _mm_movemask_epi8(__m128i _A);
	//返回一个__m128i的寄存器，它是将_A中128bit数据以32bit为单位重新排列得到的，_Imm为有
	//一个四元组，表示重新排列的顺序。当_A中原本存储的整数为16bit时，这条指令将其两两一组
	//进行排列。例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7), _Imm=(2,3,0,1),其中_Ai为16bit整数，
	//_A0为低位，返回结果为(_A2,_A3,_A0,_A1,_A6,_A7,_A4,_A5),  _Imm must be an immediate
	extern __m128i _mm_shuffle_epi32(__m128i _A, int _Imm);
	//返回一个__m128i的寄存器，它是将_A中高64bit数据以16bit为单位重新排列得到的，_Imm为一个四元组，
	//表示重新排列的顺序。_A中低64bit数据顺序不变。例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7), 
	//_Imm=(2,3,0,1),其中_Ai为16bit整数，_A0为低位，返回结果为(_A0,_A1,_A2,_A3,_A5,_A4,_A7,_A6), 
	//_Imm must be an immediate 
	extern __m128i _mm_shufflehi_epi16(__m128i _A, int _Imm);
	//返回一个__m128i的寄存器，它是将_A中低64bit数据以16bit为单位重新排列得到的，_Imm为一个四元组，
	//表示重新排列的顺序。_A中高64bit数据顺序不变。例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),
	//_Imm=(2,3,0,1),其中_Ai为16bit整数，_A0为低位，返回结果为(_A1,_A0,_A3,_A2,_A5,_A4,_A7,_A6),   
	//_Imm must be an immediate
	extern __m128i _mm_shufflelo_epi16(__m128i _A, int _Imm);
	//返回一个__m128i的寄存器，r0=_A8, r1=_B8, r2=_A9, r3=_B9, ... r14=_A15, r15=_B15
	extern __m128i _mm_unpackhi_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的高64bit数以16bit为单位交织在一块。
	//例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
	//其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A4,_B4,_A5,_B5,_A6,_B6,_A7,_B7),
	//r0=_A4, r1=_B4, r2=_A5, r3=_B5, r4=_A6, r5=_B6, r6=_A7, r7=_B7
	extern __m128i _mm_unpackhi_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的高64bit数以32bit为单位交织在一块。
	//例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
	//其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A4,_A5,_B4,_B5,_A6,_A7,_B6,_B7),
	//r0=_A2, r1=_B2, r2=_A3, r3=_B3
	extern __m128i _mm_unpackhi_epi32(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的高64bit数以64bit为单位交织在一块。
	//例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
	//其中_Ai,_Bi为16bit整数，_A0,_B0为低位，
	//返回结果为(_A4,_A5,_A6,_A7,_B4,_B5,_B6,_B7), r0=_A1, r1=_B1
	extern __m128i _mm_unpackhi_epi64(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，r0=_A0, r1=_B0, r2=_A1, r3=_B1, ... r14=_A7, r15=_B7
	extern __m128i _mm_unpacklo_epi8(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的低64bit数以16bit为单位交织在一块。
	//例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
	//其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A0,_B0,_A1,_B1,_A2,_B2,_A3,_B3),
	//r0=_A0, r1=_B0, r2=_A1, r3=_B1, r4=_A2, r5=_B2, r6=_A3, r7=_B3
	extern __m128i _mm_unpacklo_epi16(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的低64bit数以32bit为单位交织在一块。
	//例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
	//其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A0,_A1,_B0,_B1,_A2,_A3,_B2,_B3),
	//r0=_A0, r1=_B0, r2=_A1, r3=_B1
	extern __m128i _mm_unpacklo_epi32(__m128i _A, __m128i _B);
	//返回一个__m128i的寄存器，它将寄存器_A和寄存器_B的低64bit数以32bit为单位交织在一块。
	//例如，_A=(_A0,_A1,_A2,_A3,_A4,_A5,_A6,_A7),_B=(_B0,_B1,_B2,_B3,_B4,_B5,_B6,_B7),
	//其中_Ai,_Bi为16bit整数，_A0,_B0为低位，返回结果为(_A0,_A1,_A2,_A3,_B0,_B1,_B2,_B3), 
	//ro=_A0, r1=_B0
	extern __m128i _mm_unpacklo_epi64(__m128i _A, __m128i _B);

	//Load Operations(Integer SSE2 Intrinsics)
	//返回为一个__m128i的寄存器，它将_P指向的数据读到指定寄存器中，实际使用时，
	//_P一般是通过类型转换得到的, Address _P must be 16-byte aligned
	extern __m128i _mm_load_si128(__m128i const*_P);
	//返回一个__m128i的寄存器，Loads 128-bit value, Address _P does not need be 16-byte aligned
	extern __m128i _mm_loadu_si128(__m128i const*_P);
	//返回一个__m128i的寄存器，r0=*p[63:0], r1=0x0, zeroing the upper 64 bits of the result
	extern __m128i _mm_loadl_epi64(__m128i const*_P);

	//Set Operations(Integer SSE2 Intrinsics)
	//返回一个__m128i的寄存器，r0=_Q0, r1=_Q1
	extern __m128i _mm_set_epi64(__m64 _Q1, __m64 _Q0);
	//返回一个__m128i的寄存器，r0=_I0, r1=_I1, r2=_I2, r3=_I3
	extern __m128i _mm_set_epi32(int _I3, int _I2, int _I1, int _I0);
	//返回一个__m128i的寄存器，使用8个具体的short型数据来设置寄存器存放数据,
	//r0=_W0, r1=_W1, ... r7=_W7
	extern __m128i _mm_set_epi16(short _W7, short _W6, short _W5, short _W4, 
									short _W3, short _W2, short _W1, short _W0);
	//返回一个__m128i的寄存器，r0=_B0, r1=_B1, ... r15=_B15
	extern __m128i _mm_set_epi8(char _B15, char _B14, char _B13, char _B12, char _B11, 
					char _B10, char _B9,char _B8, char _B7, char _B6, char _B5, char _B4, 
					char _B3, char _B2, char _B1, char _B0);
	//返回一个__m128i的寄存器，r0=_Q, r1=_Q
	extern __m128i _mm_set1_epi64(__m64 _Q);
	//返回一个__m128i的寄存器，r0=_I, r1=_I, r2=_I, r3=_I
	extern __m128i _mm_set1_epi32(int _I);
	//返回一个__m128i的寄存器，r0=_W, r1=_W, ... r7=_W
	extern __m128i _mm_set1_epi16(short _W);
	//返回一个__m128i的寄存器，r0=_B, r1=_B, ... r15=_B
	extern __m128i _mm_set1_epi8(char _B);
	//返回一个__m128i的寄存器，r=_Q
	extern __m128i _mm_setl_epi64(__m128i _Q);
	//返回一个__m128i的寄存器，r0=_Q0, r1=_Q1
	extern __m128i _mm_setr_epi64(__m64 _Q0, __m64 _Q1);
	//返回一个__m128i的寄存器，r0=_I0, r1=_I1, r2=_I2, r3=_I3
	extern __m128i _mm_setr_epi32(int _I0, int _I1, int _I2, int _I3);
	//返回一个__m128i的寄存器，r0=_W0, r1=_W1, ... r7=_W7
	extern __m128i _mm_setr_epi16(short _W0, short _W1, short _W2, short _W3, 
									short _W4, short _W5, short _W6, short _W7);
	//返回一个__m128i的寄存器，r0=_B15, r1=_B14, ... r15=_B0
	extern __m128i _mm_setr_epi8(char _B15, char _B14, char _B13, char _B12, char _B11, 
		char _B10, char _B9, char _B8, char _B7, char _B6, char _B5, char _B4,  
		char _B3, char _B2, char _B1, char _B0);
	//返回一个__m128i的寄存器，r=0x0
	extern __m128i _mm_setzero_si128(void);

	//Store Operations(Integer SSE2 Intrinsics)
	//返回为空，它将寄存器_B中的数据存储到_P指向的地址中，实际使用时，
	//_P一般是通过类型转换得到的, *_P = _B, Address _P must be 16-byte aligned
	extern void _mm_store_si128(__m128i *_P, __m128i _B);
	//返回为空，*_P=_B, Address _P does not need to be 16-byte aligned
	extern void _mm_storeu_si128(__m128i *_P, __m128i _B);
	//返回为空，*_P[63:0] =_Q0, lower 64 bits
	extern void _mm_storel_epi64(__m128i *_P, __m128i _Q);
	//返回为空，if(_N0[7]) _P[0]=_D0, if(_N1[7]) _P[1]=_D1, ... if(_N15[7]) _P[15]=_D15, 
	//The high bit of each byte in the selector _N determines whether the corresponding byte 
	//in _D will be stored. Address _P does not need to be 16-byte aligned
	extern void _mm_maskmoveu_si128(__m128i _D, __m128i _N, char *_P);

	//Integer, moves
	//返回一个__m128i的寄存器，r0=_Q0, r1=0x0, zeroing the upper bits
	extern __m128i _mm_move_epi64(__m128i _Q);
	//返回一个__m128i的寄存器，r0=_Q, r1=0x0, zeroing the upper bits
	extern __m128i _mm_movpi64_epi64(__m64 _Q);
	//返回一个__m64的寄存器，r=_Q0
	extern __m64 _mm_movepi64_pi64(__m128i _Q);

	//Cache Support for Steaming SIMD Extensions 2 Integer Operations
	//返回为空，*_P=_A, Stores the data in _A to the address _P without polluting the caches.
	//If the cache line containing address _P is already in the cache, the cache will be updated. 
	//Address _P must be 16-byte aligned
	extern void _mm_stream_si128(__m128i *_P, __m128i _A);
	//返回为空，Cache line containing _P is flushed and invalidated from 
	//all caches in the coherency domain
	extern void _mm_clflush(void const*_P);
	//返回为空，Guarantees that every load instruction that precedes, in program order, the load 
	//fence instruction is globally visible before any load instruction 
	//that follows the fence in program order
	extern void _mm_lfence(void);
	//返回为空，Guarantees that every memory access that precedes, in program order, 
	//the memory fence instruction is globally visible before any memory instruction 
	//that follows the fence in program order
	extern void _mm_mfence(void);
	//返回为空，*_P=_I, Stores the data in _I to the address _P without polluting the caches. 
	//If the cache line containing address _P is already in the cache, the cache will be updated
	extern void _mm_stream_si32(int *_P, int _I);
	//返回为空，The execution of the next instruction is delayed an implementation specific 
	//amount of time. The instruction does not modify the architectural state. This intrinsic
	//provides especially significant performance gain
	extern void _mm_pause(void);

	/*---Support for casting between various SP, DP, INT vector types. Note that these do no 
		conversion of values, they just change the type----*/
	//返回一个__m128的寄存器，Applies a type cast to reinterpret two 64-bit floating 
	//point values passed in as a 128-bit parameter as packed 32-bit floating point values
	extern __m128  _mm_castpd_ps(__m128d);
	//返回一个__m128i的寄存器，Applies a type cast to reinterpret two 64-bit
	//floating point values passed in as a 128-bit parameter as packed 32-bit integers
	extern __m128i _mm_castpd_si128(__m128d);
	//返回一个__m128d的寄存器，Applies a type cast to reinterpret four 32-bit floating 
	//point values passed in as a 128-bit parameter as packed 64-bit floating point values
	extern __m128d _mm_castps_pd(__m128);
	//返回一个__m128i的寄存器，Applies a type cast to reinterpret four 32-bit floating 
	//point values passed in as a 128-bit parameter as packed 32-bit integers
	extern __m128i _mm_castps_si128(__m128);
	//返回一个__m128的寄存器，Applies a type cast to reinterpret four 32-bit integers 
	//passed in as a 128-bit parameter as packed 32-bit floating point values
	extern __m128  _mm_castsi128_ps(__m128i);
	//返回一个__m128d的寄存器，Applies a type cast to reinterpret four 32-bit 
	//integers passed in as a 128-bit parameter as packed 64-bit floating point values
	extern __m128d _mm_castsi128_pd(__m128i);

你可能感兴趣的:(SSE2 Intrinsics各函数介绍)

只出现一次的数字无敌的牛算法算法 leetcode 数据结构
这个题目动了点脑筋，由于它们时无序的，所以我们如果去找的话比较费劲，可能要循环嵌套再嵌套，所以我们先利用库中自带的sort函数进行排序，把这些数从小到大以此排列，然后我们进行判断哪个数出现了一次即可。这里只要注意会有只有一个元素的vector要单另出来进行判断。还有再vector末尾的元素也要单另出来进行判断。此外我们进行普遍操作即可。如果一个数只出现一次，那么该数的前一个数和后一个数都应该与其不
算法练习篇目：删除有序数组中的重复项无敌的牛算法数据结构
由于题目是非严格递增数组，这个我们可以利用库中自带的函数erase来进行操作，如果连续两个字符相等你就删除一个。进行循环知道删除完毕。具体代码如下：classSolution{public:intremoveDuplicates(vector&nums){intpos=1;autoit=nums.begin();while(it!=nums.end()-1){if(*it==*(it+1)){nu
【An】Animate 2024 动画设计制作 Alger_Hamlet 动画
【An】Animate2024动画设计制作文章目录【An】Animate2024动画设计制作一、介绍二、效果三、下载一、介绍AdobeAnimate2024是一款动画设计制作软件。集成了诸多绘图工具、高级动画特效和灵活的交互设计功能，让用户能够轻松绘制出精美的角色与场景，并通过精细的时间轴控制实现流畅的动画效果。无论是二维动画、HTML5广告、互动网页、游戏元素还是教育课件，Animate2024
告别枯燥工作，走向自动化俊哥工具 rpa photoshop excel macos python pygame
嘿，小伙伴们！今天给你们介绍两款超实用的RPA办公自动化软件，用它们，再也不用像机器一样做重复劳动啦，超省时间！工具名称：影刀RPA（类似产品，八爪鱼RPA，操作上没差别）机器人流程自动化（Roboticprocessautomation，简称RPA）工具类型：电脑软件，国内功能简介：-自动化管理：这软件太厉害了！它能控制键盘和鼠标，就像真人操作一样。比如，自动帮你发送按键、移动鼠标、打开文件夹、
C++11·部分重要语法III 2401_86702190 c++开发语言
目录emplaceemplace和push区别例：list的模拟实现部分代码默认移动构造和移动赋值默认函数的控制小知识emplaceC++11以后STL容器新增了emplace系列接口，均为模版可变参数，功能是插入，但总体而言比push和insert更高效，而且有更新的玩法，假设一个容器container，emplace可以支持直接插入构造T对象的参数，可以直接在容器空间构造T对象。emplace
QT斗地主游戏(通信基层搭建) 四代目水门 QT学习笔记 qt 游戏 java
一、客户端架构主控制器（Main_Controller）管理多个子界面控制器：登录、用户界面、游戏大厅、游戏界面使用状态切换模式：根据Socket连接状态动态切换界面（连接界面/游戏界面）通过slot_开头的槽函数实现界面跳转逻辑（如登录成功跳转用户界面）网络通信模块Socket类：基于QTcpSocket封装TCP通信实现消息分帧协议（4字节长度头+JSON数据）支持JSON数据收发，按标题（t
轮毂电机类型及其控制技术新能源汽车--三电老K 电机驱动控制技术单片机嵌入式硬件汽车学习方法
近年来，随着电动汽车的兴起，轮毂电机重新引起了重视。轮毂电机驱动系统的布置非常灵活，可以使电动汽车成为两个前轮驱动、两个后轮驱动或四轮驱动。(1)动力控制由硬连接改为软连接型式。通过电子线控技术，实现各电动轮从零到最大速度的无级变速和各电动轮间的差速要求，从而省略了传统汽车所需的机械式操纵换档装置、离合器、变速器、传动轴和机械差速器等，使驱动系统和整车结构简洁，有效可利用空间大，传动效率提高。(2
多层感知机（MLP）全面指南 MobiCetus 强化学习开发语言 java 算法 c++python eclipse github
多层感知机（MLP）是一种人工神经网络，由多个神经元层组成。MLP中的神经元通常使用非线性激活函数，使得网络能够学习数据中的复杂模式。MLP在机器学习中非常重要，因为它能够学习数据中的非线性关系，使其成为分类、回归和模式识别等任务中的强大模型。神经网络基础神经网络或人工神经网络是机器学习中的基本工具，支持着许多最先进的算法和应用，广泛应用于计算机视觉、自然语言处理、机器人技术等领域。一个神经网络由
介绍FRAMES：一个统一的检索增强生成评估框架 ZHOU_CAMP llm_benchmark 人工智能
引言大型语言模型（LLMs）在认知任务上取得了显著进步，检索增强生成（RAG）技术成为提升模型性能的重要方法。然而，现有的评估方法往往孤立地测试模型的检索能力、事实性和推理能力，无法全面反映模型在真实场景中的表现。为了解决这一问题，谷歌DeepMind和哈佛大学的研究团队提出了FRAMES（Factuality,Retrieval,AndreasoningMEasurementSet），这是一个高
【Cursor】介绍有个人神神叨叨人工智能 ide
定义Cursor是一个集成了先进大型语言模型（LLM）如GPT-4、Claude3.5的代码编辑器，可以理解为在VSCode中集成了AI辅助编程助手。它通过自然语言理解和代码生成技术，帮助开发者更高效地编写和理解代码。核心概念LLM（LargeLanguageModels）：大型语言模型，如GPT-4和Claude3.5，用于理解和生成代码。自然语言编程：使用自然语言与编程环境交互，简化代码生成过
conda create --prefix 命令安装虚拟环境到指定路径报错 Javy Wang Python conda python 虚拟环境路径
安装conda虚拟环境到指定路径时，很多教程介绍如下命令condacreate--prefix=/usr/local/py36python=3.6但是我在两台不同的ubuntu服务器上使用上述命令却出现了不同的结果，一台成功安装，另一台报错。最后试了很多次，发现使用condacreate--p命令成功了，如下所示百思不得解就去看了一些官方文档，发现正确的命令是condacreate-p，p就表示p
ERP、MES和CRM三大企业系统的详细介绍及对比分析 jakeswang coreJava java ERP
以下是关于ERP、MES和CRM三大企业系统的详细介绍及对比分析：1.ERP（企业资源计划，EnterpriseResourcePlanning）核心功能：集成管理：财务、采购、库存、生产、人力资源等核心业务流程资源优化：实现企业人、财、物等资源的统一规划和调度数据分析：提供跨部门报表和决策支持典型模块：财务管理（总账、应收应付）供应链管理（SCM）生产计划（MRP）人力资源管理（HRM）优势：打
Python只读取Excel文件的一部分数据，比如特定范围的行和列？自不量力的A同学 python excel 开发语言
如何只读取Excel文件的一部分数据，比如特定范围的行和列？在Python中，如果你只想读取Excel文件的特定范围，可以使用以下方法：pandas:Pandas是一个强大的数据处理库，它有一个内置函数read_excel()用于读取Excel文件。你可以通过指定sheet_name参数选择特定的工作表，并通过iloc或loc（基于行和列标签）来选择特定的行和列。例如：Pythonimportpa
RISC-V AIA学习3---APLIC 第一部分 Hug Freedom. risc-v 学习
先介绍一下什么是APLIC1.APLIC的背景与必要性为什么需要APLIC？APLIC是RISC-V架构中升级版的中断控制器，专门处理通过物理线路（而非电子消息）传递的硬件中断。就像传统邮局处理实体信件，APLIC负责处理这类“实体中断信号”。与旧版PLIC的区别APLIC是“高级版”，不兼容旧的PLIC。就像智能手机不兼容老式大哥大，新系统需要APLIC才能支持最新的中断管理功能。2.何时使用A
Dubbo（26）Dubbo的配置方式有哪些？辞暮尔尔-烟火年年微服务 dubbo
Dubbo支持多种配置方式，包括XML配置、注解配置以及基于SpringBoot的配置方式。每种配置方式都有其独特的优势和使用场景。下面详细介绍这三种配置方式，并结合具体代码示例进行说明。1.XML配置XML配置是最传统的配置方式，通过Spring的配置文件来描述Dubbo的各类配置。示例代码pom.xmlorg.apache.dubbodubbo-spring-boot-starter2.7.8
毕业设计基于Astart的寻路算法设计与实现 m0_71572237 算法毕业设计 python 毕设
文章目录0简介算法介绍广度优先搜索Dijkstra算法最佳优先搜索A*算法启发函数关于距离曼哈顿距离对角距离欧几里得距离算法实现坐标点与地图算法主体测试入口实现效果最后0简介今天学长向大家分享一个毕业设计项目毕业设计基于Astart的寻路算法设计与实现项目运行效果：毕业设计基于Astart的自动寻路算法项目分享:见文末!算法介绍A*（念做：AStar）算法是一种很常用的路径查找和图形遍历算法。它有
(4-6）轨迹规划算法和优化：基于萤火虫算法优化（FLA）算法的无人机的路径规划系统码农三叔人工智能无人机算法 python 运动控制路径规划萤火虫算法优
FireflyAlgorithm（萤火虫算法，FLA）是一种启发式优化算法，其灵感来源于萤火虫的闪烁行为。FLA算法通过模拟萤火虫群体中的个体之间的相互吸引和相对亮度来搜索解空间，主要应用于全局优化问题，例如路径规划、函数优化等。FireflyAlgorithm（萤火虫算法，FLA）是一种启发式优化算法，其灵感来源于萤火虫的闪烁行为。FLA算法通过模拟萤火虫群体中的个体之间的相互吸引和相对亮度来搜
产品缺陷检测：自动化检测系统设计_5.电气与电子检测技术 zhubeibei168 检验检测&人脸识别自动化数据挖掘人工智能机器学习工业检测
5.电气与电子检测技术在自动化检测系统中，电气与电子检测技术是至关重要的组成部分。这些技术不仅用于检测产品的电气性能，还用于控制检测系统的各个部分，确保整个系统高效、准确地运行。本节将详细介绍几种常见的电气与电子检测技术，包括传感器技术、信号处理、电路设计和控制系统的应用。5.1传感器技术传感器是自动化检测系统中用于采集数据的关键设备。在产品缺陷检测中，常用的传感器类型包括光电传感器、图像传感器、
RLHF微调大模型---PPO原理和代码实战韭菜盖饭大模型大模型微调 RLHF 人工智能大模型
目录一、前言二、RLHF原理2.1、利用RewardModel2.2、利用ActorModel2.3、优势函数2.4、训练ActorModel2.5、训练CriticModel三、代码四、参考一、前言RLHF:ReinformentLearningHumanFeedback。中文含义是：基于人类反馈的强化学习，用奖励模型RewardModel来训练SFT模型；生成模型使用奖励或惩罚来更新其策略，以
python和c中作用域的差异 m0_55576290 python c++python c语言开发语言
好的，我将详细列举Python和C语言在作用域规则上的主要差异，并为每种差异提供具体的代码示例，以便更清晰地理解它们之间的不同。1.块级作用域（BlockScope）C语言在C语言中，任何用{}包裹的代码块（如if语句、for循环等）都会创建一个新的作用域。示例#includeintmain(){intx=10;//局部变量，作用域为整个main函数if(x>5){inty=20;//局部变量，作
深度学习平台demo(基础知识）- Keras相关知识点整理(tensorflow2.4) 竹叶青lvye 深度学习平台demo keras tensorflow 深度学习可视化
Demo程序中的卷积神经网络用的keras，所以是初次接触的童靴，可能会陌生，这里简单介绍下，具体的一些知识点还是从官方文档获取,博主只列举几个常用的。毕竟17年的时候就曾用keras落地过实际项目，后来keras被集成到tensorflow2.x里了，所以博主对此框架还是有一定的了解。应用Applications-Keras中文文档https://keras.io/zh/applications
探索全球大都市：世界城市数据集裴辰垚Simone
探索全球大都市：世界城市数据集去发现同类优质开源项目:https://gitcode.com/该项目提供了一个全面的全球主要城市数据库，源自权威的地理信息资源——GeoNames。这个开源的数据包专为那些寻求全球城市信息的开发者、研究人员和数据分析爱好者而设计。项目介绍这个数据集包含了人口超过15,000的城市，每条记录都附有国家和次级行政区域（如美国的州或法国的地区）信息，以减少名称歧义。对于像
使用Python爬虫抓取地理信息并生成热力图展示不同地区情况 Python爬虫项目 2025年爬虫实战项目 python 爬虫信息可视化开发语言人工智能搜索引擎
引言地理信息热力图在数据可视化中被广泛应用，它通过颜色的渐变来展示不同地区的数值变化，帮助我们更直观地理解空间数据的分布情况。在实际应用中，热力图通常被用于展示城市分布、气候变化、交通流量、人口密度等信息。对于数据分析师来说，地理信息的抓取与分析能力是非常重要的技能。本文将介绍如何使用Python爬虫抓取地理信息数据，并生成热力图，展示不同地区的情况。我们将使用最新的Python技术栈，包括爬虫、
k8s存储介绍（四）hostpath 小刘爱喇石( ˝ᗢ̈˝ ) kubernetes 容器云原生
目录KuberneteshostPath详解1.什么是hostPath？2.hostPath的使用示例1：将宿主机的/data目录挂载到Pod示例2：挂载Docker的/var/run/docker.sock以访问宿主机的Docker示例3：限制hostPath的类型3.hostPath的适用场景4.hostPath的局限性❌不适用于多节点集群⚠️存在安全风险⚠️可能引发数据一致性问题5.host
工作中遇到的spark SQL小问题：包含某个或某些字符的条件 Terry_trans spark sql 大数据
今天又来总结工作中遇到的问题了，今天是SQL，spark引擎需求描述，筛选渠道包含”线上化“的数据也就是讨论where里面的这个筛选条件怎么写一般起手都是whereQDlike'%线上化%‘学习了其他的写法:1.INSTR函数whereINSTR(QD,"线上化")0：INSTR是一个函数，用于返回子字符串在字符串中第一次出现的位置。如果QD列包含“线上化”，则INSTR(QD,"线上化")的返回
数字电子时钟程序与旋转LED技术实战想法臃肿
本文还有配套的精品资源，点击获取简介：本文介绍了一种结合编程和硬件设备的创新电子技术——数字电子时钟程序与旋转LED，旨在通过动态显示时间来提供新的视觉体验。文章详细阐述了程序的编程核心，包括使用C++、Python或Arduino等编程语言读取时间数据，并通过LED阵列展示时间。同时，也探讨了LED的驱动方式、亮度控制、闪烁抑制和电源管理等硬件设计要点。此外，本文还涉及了旋转LED效果的实现方法
Hadoop分布式文件系统HDFS AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Hadoop分布式文件系统HDFS作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：大数据存储，分布式计算，海量数据处理，高可用性，容错机制1.背景介绍1.1问题的由来随着互联网技术和数字设备的普及，企业级数据量呈现出爆炸式的增长趋势。传统的单机或小型集群的数据存储与管理方式已无法满足大规模数据处理的需求。数据的快速增长对存储系统的容量、性能以
JS设计模式之观察者模式：观察者与可观察对象的巧妙互动前端梦工厂+ JavaScript 设计模式 javascript 设计模式前端
一.前言在前端开发中，我们经常会遇到需要对用户的操作进行响应的场景，例如页面上的按钮点击、输入框内容变化等。为了实现这种响应式的设计，我们可以使用观察者模式来解耦各个组件之间的依赖关系。本文将详细介绍观察者模式的原理和实现方法，并通过实例代码演示如何使用观察者模式来实现一个简单的响应式系统。我们将从以下几个方面展开分析：基本定义和核心概念如何实现观察者模式在前端开发中的应用场景使用注意事项希望通过
C#秒如何转为时分秒格式未来无限 C#语言 c#开发语言秒时分秒
将秒数转换为分钟和秒数可以通过简单的数学运算来实现。假设你有一个整数表示秒数，可以通过以下方式转换为分钟：将秒数除以3600来获取时钟的整数部分。将秒数求余3600的结果除以60来获取分钟的整数部分。用秒数求余60来获取余下的秒数。具体实现函数如下：//////秒转化为时分秒int参数格式/////////publicstaticstringGetTimeLength(inttotalSecond
单例模式（Singleton Pattern） m0_55576290 c++设计模式单例模式 javascript 开发语言
单例模式（SingletonPattern）任务管理器可以作为一个全局的任务配置管理类，使用单例模式保证全局只有一个实例。这样你可以避免在应用程序中创建多个任务管理对象，保持配置参数的统一。示例：classTaskManager{private:staticTaskManager*instance;TaskManager(){}//私有构造函数public:staticTaskManager*ge
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 alxw4616@msn.com * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，