E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
SSE2
Assembly x64 Intro -
SSE2
Hadamard 4 DC
/*dcvaluepickupandhdm_4x4*/voidWelsHadamardT4Dc_c(int16_t*pLumaDc,int16_t*pDct){ int32_tp[16],s[4]; int32_ti,iIdx; for(i=0;i>1,-32768,32767); pLumaDc[i+8]=WELS_CLIP3((s[0]-s[1]+1)>>1,-32768,32767);
fanbird2008
·
2015-12-18 09:00
Assembly x64 Intro -
SSE2
IDCT I16X16 DC
/* *pfIDctI16x16Dc:dolumaidctofanMBforI16x16mode,whenonlydcvaluearenon-zero */voidWelsIDctRecI16x16Dc_c(uint8_t*pRec,int32_tiStride,uint8_t*pPred,int32_tiPredStride,int16_t*pDctDc){ int32_ti,j; for(i=
fanbird2008
·
2015-12-18 09:00
Assembly x64 Intro -
SSE2
IDCT
voidWelsIDctFourT4Rec_c(uint8_t*pRec,int32_tiStride,uint8_t*pPred,int32_tiPredStride,int16_t*pDct){ int32_tiDstStridex4 =iStride<<2; int32_tiPredStridex4=iPredStride<<2; WelsIDctT4Rec_c(pRec,
fanbird2008
·
2015-12-18 09:00
Assembly x64 Intro -
SSE2
DCT
voidWelsDctFourT4_c(int16_t*pDct,uint8_t*pPixel1,int32_tiStride1,uint8_t*pPixel2,int32_tiStride2){ int32_tstride_1=iStride1movq xmm0,[r1]; punpcklbw %1,%3=>punpcklbwxmm0,xmm7=>变换为8个word(16bits
fanbird2008
·
2015-12-18 09:00
Assembly x64 Intro -
SSE2
Diff 8 Load
;***********************************************************************;voidWelsDctFourT4_sse2(int16_t*pDct,uint8_t*pix1,int32_ti_pix1,uint8_t*pix2,int32_ti_pix2);************************************
fanbird2008
·
2015-12-16 21:00
Assembly x64 Intro -
SSE2
8DC Load
%macroSSE2_Load8DC6 movdqa %1, %6 ;%1=dc0dc1 paddw %1, %5 psraw %1, $06 ;(dc+32)>>6 movdqa %2, %1 psrldq %2, 4 punpcklwd %2, %2 punpckldq
fanbird2008
·
2015-12-16 16:00
Assembly x64 Intro -
SSE2
Diff 4x8 Store
%macroSSE2_StoreDiff4x8p8 SSE2_StoreDiff8p %1,%3,%4,[%5], [%6] SSE2_StoreDiff8p %1,%3,%4,[%5+%7], [%6+%8] SSE2_StoreDiff8p %2,%3,%4,[%5+8], [%6+8] SSE2_StoreDiff8p %2
fanbird2008
·
2015-12-16 16:00
Assembly x64 Intro -
SSE2
4x8 Store
%macroSSE2_Store4x8p6 SSE2_XSawpqdq,%2,%3,%6 SSE2_XSawpqdq,%4,%5,%3 MOVDQ [%1+0x00],%2 MOVDQ [%1+0x10],%4 MOVDQ [%1+0x20],%6 MOVDQ [%1+0x30],%3%endmacro;forTRANSPOSE%macroSSE2_XSaw
fanbird2008
·
2015-12-16 16:00
Assembly x64 Intro -
SSE2
4x8 Load
%macroSSE2_Load4x8p6 MOVDQ %2, [%1+0x00] MOVDQ %4, [%1+0x10] MOVDQ %6, [%1+0x20] MOVDQ %3, [%1+0x30] SSE2_XSawpqdq,%4,%3,%5 ;为什么要做这两步??? SSE2_XSawpqdq,%2,%6,%3%endm
fanbird2008
·
2015-12-16 16:00
Assembly x64 Intro -
SSE2
2x4x4W Transpose
;in:xmm0,xmm1,xmm2,xmm3, xmm4pOut: xmm0,xmm1,xmm3,xmm4%macroSSE2_TransTwo4x4W5 SSE2_XSawpwd, %1,%2,%5 SSE2_XSawpwd, %3,%4,%2 SSE2_XSawpdq, %1,%3,%4 SSE2_XSawpdq, %5,%2,%3 SSE2_XSawpqdq,%1,%5
fanbird2008
·
2015-12-16 11:00
Assembly x64 Intro -
SSE2
4x4D Transpose
;in:xmm1,xmm2,xmm3,xmm4,xmm5 pOut: xmm1,xmm4,xmm5,mm3%macroSSE2_Trans4x4D5 SSE2_XSawpdq, %1,%2,%5 SSE2_XSawpdq, %3,%4,%2 SSE2_XSawpqdq,%1,%3,%4 SSE2_XSawpqdq,%5,%2,%3%endmacro;forTRANSPOSE%mac
fanbird2008
·
2015-12-16 10:00
Assembly x64 Intro -
SSE2
Copy8Times
;copyadwintoaxmmfor8times%macroSSE2_Copy8Times2 movd %1,%2 punpcklwd%1,%1 pshufd %1, %1, 0%endmacro SSE2_Copy8Timesxmm1,r2d ;xmm1=b,b,b,b,b,b,b,b假设r2d=0x0000003f上述将展开如下:movdxmm1,r2d
fanbird2008
·
2015-12-16 09:00
Assembly x64 Intro -
SSE2
Copy16Times
;copyadbintoaxmmfor16times%macroSSE2_Copy16Times2 movd %1,%2 pshuflw %1,%1,0 punpcklqdq %1,%1 packuswb %1, %1%endmacro movzxr2d,byte[r0] ;pixelpDataforlef
fanbird2008
·
2015-12-16 09:00
centos 6.7 安装kvm
flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts mmx fxsr sse
sse2
Qiudays
·
2015-11-16 10:51
虚拟化
kvm
虚拟化
centos 6.7 安装kvm
flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts mmx fxsr sse
sse2
Qiudays
·
2015-11-16 10:51
kvm
虚拟化
centos 6.7 安装kvm
flags: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts mmx fxsr sse
sse2
Qiudays
·
2015-11-16 10:51
kvm
虚拟化
SSE2
指令集系列之一----浮点运算指令
SSE2
与SSE1使用相同寄存器,指令描述约定: MM指64位MMX寄存器 XMM指128XMM寄存器 m32 指32位内存变量 m128指128位内存变量 本小结主要描述双精度浮点运算指令
·
2015-11-13 08:35
运算
SSE2
指令集系列之二----整数运算相关指令
本小节描述的是
SSE2
整数运算指令。 5.
·
2015-11-13 08:27
运算
SSE3指令集系列----数据加载与算术运算指令
LDDQU xmm, m128 从非对齐的内存地址中加载128位数到XMM寄存器,此条指令比
SSE2
·
2015-11-13 08:26
数据
SSE3指令集系列
数据加载存储指令 LDDQU xmm, m128 从非对齐的内存地址中加载128位数到XMM寄存器,此条指令比
SSE2
·
2015-11-13 08:18
指令
SSE2
指令集系列之一
SSE2
与SSE1使用相同寄存器,指令描述约定: MM指64位MMX寄存器XMM指128XMM寄存器 m32 指32位内存变量m128指128位内存变量
SSE2
主要是双精度浮点运算指令
·
2015-11-13 08:16
指令
SSE2
指令集系列之二
本小结描述的是
SSE2
整数运算指令。 5.
·
2015-11-13 08:16
指令
Visual C++ 编译器选项
列出编译器选项 /AI 指定在解析传递到 #using 指令的文件引用时搜索的目录 /arch 使用 SSE 或
SSE2
指令生成代码 /C 在预处理期间保留注释 /c 编译但不链接
·
2015-11-12 11:29
C++
iDeneb v1.6 安装教程(含中文自定义详细驱动说明)
此教程重点在二楼: 最低配置: CPU
SSE2
x86,512MB 内存, 10 GB可用空间的目标分区, 显卡OpenGL的兼容 建议配置: CPU Intel Core 或AMD x2
·
2015-11-11 08:17
ide
在dell dimension 5150 上安装mac os x for pc 10.4.8 手记 2] 声卡的安装
忘了说明了,安装的是JAS MAC OS X 10.4.8 INTEL AMD
SSE2
SSE3 [好像是这么个名字,记不清了] 还是要提醒,需要先看本系列的一篇安装TIPS 其实安装完后只插前面板的耳机口
·
2015-11-05 08:55
Mac OS X
在dell dimension 5150 上安装mac os x for pc 10.4.8 手记 0] TIPS
这是一套自己摸索出来的方法,主要应对dell的显卡 首先悼念在此次冒险中英勇牺牲的光驱和光盘们 安装版本JAS 10.4.8 AMD Intel
SSE2
SSE3 首先的问题是使用
·
2015-11-05 08:55
Mac OS X
ununtu 下安装 Nvidia 显卡驱动
本人电脑硬件配置:CPU : AMD Athlon(tm) II X2 215 Processor × 2 显示卡 : GeForce 6150SE nForce 430/integrated/
SSE2
·
2015-10-31 17:45
nVidia
代码优化--优化浮点数取整
原文: http://blog.csdn.net/housisong/article/details/1616026 tag: 浮点数转换为整数,fpu,sse,
sse2
,读缓冲区优化
·
2015-10-31 11:46
代码优化
在dell dimension 5150 上安装 leopard 手记
安装到了一半,突然提示[error]service name already exists,然后就重启,也启动不起来 还是JAS的版本比较适合我,选择的是JaS OsX86 10.5.2 Intel
SSE2
·
2015-10-31 10:39
Leopard
用
SSE2
实现NV12转RGB32
最近要用到Intel的media SDK播放H264视频,发现intel的SDK转码出来的帧缓冲是NV12像素格式的,需要自己转换成RGB32格式。虽然这种代码网上找找一大堆,但还是自己动动手吧。 google了一下转换公式: C = Y - 16D = U - 128E = V - 128R = clip(round(1.164383 * C + 1.596027 * E))G = clip
·
2015-10-23 08:04
实现
Intel64及IA-32架构优化指南——3.8 浮点方面的考虑
3.8.1 优化浮点代码的准则 用户/源编码规则13:用适当的开关来允许编译器使用
SSE2
,SSE3指令。 遵从这个过程来调查你的浮点应用的性能: ● 理解编译器如何处理浮点代
·
2015-10-21 11:03
int
Visual C++ 编译器选项
列出编译器选项 /AI 指定在解析传递到 #using 指令的文件引用时搜索的目录 /arch 使用 SSE 或
SSE2
指令生成代码 /C 在预处理期间保留注释 /c 编译但不链接
·
2015-10-21 10:11
C++
DirectX11 XNA数学库之矩阵
XNA数学库之矩阵1.XNA数学库之矩阵介绍跟XNA向量一样为了使用
SSE2
优化指令,XNA矩阵XMMATRIX的实现使用了四个向量。
sinat_24229853
·
2015-09-27 19:00
数学
矩阵
Matrix
XNA
directx11
电脑管家win10检测提示内存小于2g的解决办法
升级win10对处理器(CPU)的最低要求是1GHz(千兆赫)以上,并且支持PAE、NX、
SSE2
特性,由于部分机器在BIOS里关闭了CPU的相关特性,也可能导致win10升级检查不通过。
佚名
·
2015-07-30 11:37
__m128i 等针对SIMD指令集linux中未定义符号
-msse,-msse2,-msse3,-mmmx,-m3dnow这些标记启用了x86和x86-64构架的SSE、
SSE2
、SSE3、MMX和3DNow!指令集。
lien0906
·
2015-04-14 15:00
SSE2
介绍及其简单用法举例
SSE2
,全名为StreamingSIMDExtensions2,是一种IA-32架构的SIMD指令集。
SSE2
是在2001年随着Intel发表第一代Pentium4处理器也一并推出的指令集。
kezunhai
·
2015-04-03 11:00
sse
mmx
开源库Simd在vs2010中的编译及简单使用
Simd是开源的图像处理库,它提供了很多高性能的算法,这些优化算法主要由SIMD指令来实现,包括SSE、
SSE2
、SSSE3、SSE4.1、SSE4.2、AVX等,此库可以应用在windows/linux32bit
fengbingchun
·
2015-03-29 19:00
电脑安装win10系统需要哪些配置?WIN10最低配置要求
1、对处理器的要求:1GHz或者更高(支持pae、nx和
sse2
)2、内存要求:1GB(32位)或2GB(64位)3、硬盘空间要求:16GB
佚名
·
2015-01-22 10:40
Windows 10 预览版安装
Microsoft于2014年10月2日发布Wn10技术预览版,下面是安装过程硬件要求:与Windows8和8.1配置要求相同处理器:1GHz以上,支持PAE、NX、以及
SSE2
;内存:1GB(32位)
mca_mvp
·
2014-10-03 09:42
技术
Microsoft
windows8
DirectX
处理器
1 assert/signal failures have occurred; MATLAB will abort in 10 seconds
在Matlab和java的混合编程中,启动Tomcat后,访问页面Tomcat出现如题错误,然后google后,发现可能是两个问题:1.processor不支持,好像是说processor要支持
sse2
fansy1990
·
2014-09-18 15:00
java
matlab
Matlab混合编程
java混合编程
测试CPU的特性
、Corei5-2500k 最后更新日期:2014-04-23kagula 描述:我忘记这段代码从哪里download下来,但是经测试可以用, 通过这段代码的学习,可以写一个测试CPU是否支持SSE/
SSE2
lee353086
·
2014-08-08 11:00
Intel 的AVX2指令集解读
在IntelSandyBridge微架构中,Intel引入了256位SIMD扩展AVX,这套指令集在兼容原MMX、SSE、
SSE2
对128位整点SIMD支持的基础上,把支持的总向量数据宽度扩展成了256
vbskj
·
2014-08-06 22:00
Intel大坑之一:丢失的
SSE2
128bit/64bit 位移指令,马航MH370??
缘由最近在写一些字符串函数的优化,兴趣使然,可是写的过程中,想要实现 SSE2128bit/64bit的按bit逻辑位移,遇到了一个大坑,且听我娓娓道来。我并不想用什么马航370来博眼球,当我写下这个标题的时候,的确没有马航370这个字眼,可是当我写到一半的时候,突然就冒出了马航370这几个字,如果你认真阅读了我的文章,也许你也应该思考一下,这128bit/64bit的位移指令到底是去哪了?石沉大
shines
·
2014-06-26 13:00
Intel
mmx
SSE2
PSLLQ
PSLLDQ
windows软件包2013对系统处理器的要求是什么
2、处理器:1.6GHz或更高速度,含
SSE2
支持。Pentium4或更新处理器以及AMDK8或更新处理器支持
SSE2
。3、内存:1GBRAM或更高4、分辨率:最低1024×5
佚名
·
2014-04-24 11:08
解决VirtualBox安装win8报"Your PC needs to restart...."错误
在用VirtualBox安装win8、win2012时,会报如下图问题,这是因为:要求CPU必须支持PhysicalAddressExtension(PAE),NX和
SSE2
。
penseestroller
·
2014-04-19 14:24
Oracle
服务器
虚拟机
工具应用
解决VirtualBox安装win8报"Your PC needs to restart...."错误
在用VirtualBox安装win8、win2012时,会报如下图问题,这是因为:要求CPU必须支持PhysicalAddressExtension(PAE),NX和
SSE2
。
penseestroller
·
2014-04-19 14:24
oracle
虚拟机
服务器
处理器
启动命令
AVX Intrinsics各函数介绍
SIMD相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//
SSE2
(alsoincludefvec.h) #
fengbingchun
·
2014-04-13 13:00
程序优化:算法对上SIMD+OMP(3)
MMX,SSE,
SSE2
(AMD已经通过交叉授权取得该技术)看起来真有那么美好么?让我们拭目以待。 在处理中同样使用了定点数技术。
vbskj
·
2014-04-05 03:00
程序优化:算法对上SIMD+OMP(0)
随着MMX,SSE,
SSE2
硬件的普及,越来越多的编译器开始支持SIMD指令编程,程序员编写程序时可以很方便的利用先进的硬件为程序带来更大的性能提升,所为“花一样钱补两样”,真是惠而不费,程序员的福音。
vbskj
·
2014-04-05 03:00
AES(Advanced Encryption Standard) Intrinsics各函数介绍
SIMD相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//
SSE2
(alsoincludefvec.h)
fengbingchun
·
2014-03-27 21:00
上一页
1
2
3
4
5
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他