E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
simd
DirectX11 学习笔记5 - D3DXMath 库
directx11特别推出了一个数学库用于向量矩阵的计算,而且使用128位同时计算4条32位数据(
SIMD
)之前基本是用的directx10math.h这个头文件。
cq361106306
·
2014-10-06 12:00
C++
DirectX
directx11
GPU高性能计算之CUDA-第一章
2.指令级并行-->线程级并行-->处理器级并行-->节点级并行3.指令级并行办法:超标量,乱序执行,超流水,超长指令字,
SIMD
,分支预测。超长指令字可以减少访存。
Hipercomer
·
2014-09-23 17:00
GPU
高性能计算
用PGCL为安卓编写有效的OpenCL代码
2013-09-1114:17 897人阅读 评论(0) 收藏 举报在前一篇文章中,我们介绍了创建一款可用于OpenCL的安卓应用所的安卓应用所需的基本步骤,这款应用可与作为OpenCL计算设备的NEON/
SIMD
dj0379
·
2014-09-19 03:00
numpy性能优化
相比于原生的Python,利用NumPy数组可以获得显著的性能加速,尤其是当你的计算遵循单指令多数据流(
SIMD
)范式时。然而,利用NumPy也有可能
pipisorry
·
2014-09-05 23:00
python
matlab
矩阵
线性代数
numpy
ZFXEngine开发笔记-SSE版本的ZFXVector
SSE介绍 在学习3D游戏编程大师技巧的时候,就了解到,可是使用一种称之为“单指令,多数据(
SIMD
)”的技术来编写3D数学库。
i_dovelemon
·
2014-08-27 15:00
算法
数学
3D
3D引擎
AVX 指令集架构简介
AVX指令集架构的改进和增强的功能:128位
SIMD
寄存器xmm0-xmm15扩展为256位的ymm0-ymm15寄存器支持256位的矢量运算,由原来128位扩展为256位指令可支持最多4个操作数,实现目标操作数无需损毁原来的内容引进新的
vbskj
·
2014-08-06 23:00
AVX官方入门介绍
Intel®AdvancedVectorExtensions(Intel®AVX)isasetofinstructionsfordoingSingleInstructionMultipleData(
SIMD
vbskj
·
2014-08-06 23:00
Intel 的AVX2指令集解读
在IntelSandyBridge微架构中,Intel引入了256位
SIMD
扩展AVX,这套指令集在兼容原MMX、SSE、SSE2对128位整点
SIMD
支持的基础上,把支持的总向量数据宽度扩展成了256
vbskj
·
2014-08-06 22:00
Linux下VFP NEON浮点编译
NEON:
SIMD
(SingleInstructionMultipleData单指令多重数据)指令集,其针对多媒体和讯号处理程式具备标准化的加速能力。
liujia2100
·
2014-05-27 22:00
AVX Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h) #
fengbingchun
·
2014-04-13 13:00
.NET中的
SIMD
在Mono六年之后,微软的CLR实现最终通过RyuJIT提供了对
SIMD
的支持。RyuJIT目前仍处在社区预览阶段,它是下一代的.NETJIT编译器。
Jonathan Allen
·
2014-04-12 00:00
程序优化:算法对上
SIMD
+OMP(4)
使用Intrinsics技术,实现
SIMD
,再加上OMP这次很简单,只需在循环上加上OpenMP的指示:#paragmompparallelforfor(inth=0;h<1024;h++){ ..
vbskj
·
2014-04-05 03:00
程序优化:算法对上
SIMD
+OMP(2)
传统方法+OpenMP使用OpenMP对传统方法进行优化。感谢OpenMP,实现多线程优化方便多了!多核时代,OpenMP将成为我们的利器!float test_Normal_OMP_Filter(){ BYTE*buf=(BYTE*)malloc(1024*1024* sizeof(int)); //分配内存 BYTE*ptr=buf;//内存指针 //背景色,用于和前景色进行溶合
vbskj
·
2014-04-05 03:00
程序优化:算法对上
SIMD
+OMP(3)
使用Intrinsics方法,实现
SIMD
处理 使用Intrinsics,可以利用硬件的
SIMD
指令进行处理。MMX,SSE,SSE2(AMD已经通过交叉授权取得该技术)看起来真有那么美好么?
vbskj
·
2014-04-05 03:00
程序优化:算法对上
SIMD
+OMP(1)
传统处理方法 传统处理方法纯粹基于C++,通过指针操作进行处理。通常的优化是使用定点数来代替浮点数,这里使用的方法为: 比值=(颜色分量值*65535)/255 转换成位移操作: 比值=(颜色分量值>8 进行一步简化: 比值=颜色分量值>16; *(ptr+1)=((int)*(ptr+1)*(65535-dg)+backgr
vbskj
·
2014-04-05 03:00
程序优化:算法对上
SIMD
+OMP(0)
随着MMX,SSE,SSE2硬件的普及,越来越多的编译器开始支持
SIMD
指令编程,程序员编写程序时可以很方便的利用先进的硬件为程序带来更大的性能提升,所为“花一样钱补两样”,真是惠而不费,程序员的福音。
vbskj
·
2014-04-05 03:00
AES(Advanced Encryption Standard) Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h)
fengbingchun
·
2014-03-27 21:00
SSE4.1和SSE4.2 Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h)
fengbingchun
·
2014-03-25 21:00
SSE3和SSSE3 Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h)
fengbingchun
·
2014-03-16 12:00
MMX Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h) #
fengbingchun
·
2014-03-01 18:00
ARM处理器NEON编程及优化技巧——矩阵乘法的实例
ARM的NEON协处理器技术是一个64/128-bit的混合
SIMD
架构,用于加速包括视频编码解码、音频解码编码、3D图像、语音和图像等多媒体和信号处理应用。
ceasar11
·
2014-02-19 11:00
编码
ARM
neon
ARM处理器NEON编程及优化技巧—左移右移等移位操作
ARM的NEON协处理器技术是一个64/128-bit的混合
SIMD
架构,用于加速包括视频编码解码、音频解码编码、3D图像、语音和图像等多媒体和信号处理应用。
ceasar11
·
2014-02-19 11:00
编码
ARM
neon
SSE Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h)
fengbingchun
·
2014-02-16 19:00
SSE2介绍及其简单用法举例
SSE2,全名为StreamingSIMDExtensions2,是一种IA-32架构的
SIMD
指令集。SSE2是在2001年随着Intel发表第一代Pentium4处理器也一并推出的指令集。
fengbingchun
·
2014-01-19 21:00
SSE2 Intrinsics各函数介绍
SIMD
相关头文件包括://#include//MMX //#include//SSE(alsoincludeivec.h) //#include//SSE2(alsoincludefvec.h)
fengbingchun
·
2014-01-18 21:00
ARM Cortex系列(A8/A9/A15/A7) NEON多媒体处理
SIMD
引擎优化
Cortex-A9的NEON多媒体处理器是基于ARMv7的
SIMD
(SingleInstructionMultipleData)和向量浮点VFPv3(VectorFloating-Point)指令集的,
yxnyxnyxnyxnyxn
·
2014-01-14 17:00
vs2010 调试模式下XMMatrix赋值造成越界访问
本来想用下新的
simd
代替下d3dmatrix结果遇到vs2010这奇葩bug,果断为了不影响后续,暂时先不用xmath了,全套完
x954818696
·
2014-01-10 22:00
跨平台使用Intrinsic函数范例1——使用SSE、AVX指令集 处理 单精度浮点数组求和(支持vc、gcc,兼容Windows、Linux、Mac)
本文面对对SSE等
SIMD
指令集有一定基础的读者,以单精度浮点数组求和为例演示了如何跨平台使用SSE、AVX指令集。
ceasar11
·
2014-01-09 10:00
编码
ARM
intrinsic
图像处理的简单优化-06:
SIMD
关于
SIMD
及为CPU做优化的指引文章请参考这里。内存的特殊要求
SIMD
使用的内存必须在16字节边界对齐,通过使用_mm_malloc()函数,很容易就实现。
igame
·
2013-12-31 09:09
优化
图像处理
C++
图像处理的简单优化-06:
SIMD
关于
SIMD
及为CPU做优化的指引文章请参考这里。内存的特殊要求
SIMD
使用的内存必须在16字节边界对齐,通过使用_mm_malloc()函数,很容易就实现。
igame
·
2013-12-31 09:00
C++
优化
SIMD
图像处理
单数据多指令(
SIMD
) MMX SSE AVX
概述
SIMD
是指单指令多数据技术,它已经成为Intel处理器的重要性能扩展。
dellme99
·
2013-12-30 11:05
平台软件性能优化
使用STL vector 作为XNAMath快速灵活的
SIMD
数据容器
原文链接: http://www.qsoftz.com/mirza/?p=59简介这篇文章是关于如何将传统的STLvector作为XNAMath类型容器使用.因为SSE/SSE2指令集要求数据必须对齐到16字节的边界,所以vector的分配器必须替换成一个可以对齐的内存分配器(x86架构).本文适用于想在代码中引入新鲜空气的x86Windows开发者,你将会看到如何把强大的XNAMath和灵活的S
xoyojank
·
2013-12-29 18:00
SIMD
Intrinsics头文件与
SIMD
指令集、Visual Studio版本对应表!
VSVisualStudiointrin.hAll Architectures8.02005mmintrin.hMMX intrinsics6.06.0 SP5+PP5xmmintrin.hStreaming
SIMD
dj0379
·
2013-12-12 02:00
支持NEON指令集的android编译设置
支持NEON指令集android编译设置从ARMv7开始ARM提供高级单指令多数据(
SIMD
)扩展亦称NEON技术
zhenwenxian
·
2013-12-01 15:00
NEON指令集
网络工程师突击 五
***********网络工程速记********阵列处理机属于
SIMD
计算机。
yxh1157686920
·
2013-11-03 21:33
网络工程师
计算机
处理机
Cyber_Security
网络工程师突击 五
***********网络工程速记********阵列处理机属于
SIMD
计算机。
yxh1157686920
·
2013-11-03 21:33
计算机
网络工程师
处理机
OpenCL kernel优化——线程数目的确定
workgroup和work-item在数目上有以下几点影响:1.本地内存和全局内存有较多数据互访的,尽量减少workgroup的数量,应尽可能接近设备上计算单元或者
SIMD
eric41050808
·
2013-10-10 11:00
OpenCL
用PGCL为安卓编写有效的OpenCL代码
在前一篇文章中,我们介绍了创建一款可用于OpenCL的安卓应用所的安卓应用所需的基本步骤,这款应用可与作为OpenCL计算设备的NEON/
SIMD
扩展程序并行运行于多个ARMCPU内核。
zhangoi391
·
2013-09-11 14:00
OpenMPI、MapReduce简单比较
因此适合在
SIMD
及SPMD并行计算机上运行,例如在向量机上通过数据并行求解问题。消息传递即各个并行执行
biggoodbobo
·
2013-08-30 10:00
mapreduce
负载均衡
分布式
并行计算
并行编程
arm学习笔记一(arm概述及其基本编程模型)
体系结构的版本及命名方法arm体系统构的6个版本的特点arm体系的变种1thumb指令集(t变种)2长乘法指令(M变种)3增强型dsp指令(E变种)4java加速器jazelle(J变种)5arm媒体功能扩展(
SIMD
retacn_yue
·
2013-08-24 10:00
ARM
基于
SIMD
指令的内积运算
内积运算是向量投影、测度计算中的常见运算,本节给出内积运算的
SIMD
加速版本,需要引用头文件“#include”。
u011747351
·
2013-08-23 20:00
windows7 64位机上,libjpeg-turbo的安装和使用
libjpeg-turbo是对libjpeg的扩展,支持
SIMD
指令,如X86架构的MMX、SSE、SSE2、3DNOW,ARM架构的NEON,在对jpeg进行编码和解码的过程中能提高速度。
fengbingchun
·
2013-08-22 10:00
自定义宏实现任意字节对齐
使用MMX、SSE、AVX等
SIMD
指令集进行汇编加速时,若地址是8、16、32字节对齐时,能使用对齐的数据读取、写入指令,从而进一步优化速度。
cmsbupt
·
2013-08-19 14:00
为不规则应用设计新一代超大型多线程架构
这些应用需求推动着处理器设计往更快的
SIMD
(单指令,多数据)架构单
Antonino Tumeo, Simone Secchi, and Oreste Villa
·
2013-08-02 00:00
面向对象vs面向数据
http://blog.csdn.net/xoyojank/article/details/8739957要点摘录:
SIMD
,Cachefriendly其实大多数做引擎的人都有考虑,好多人都会说"SSE
niexiao2008
·
2013-07-26 14:00
Intrinsic 基础入门【1】
intel-intrinsics-guideMicrosoft官方网站上关于Intrinsic的介绍:http://msdn.microsoft.com/zh-cn/library/vstudio/tzkfha43(v=vs.100).aspx各种
SIMD
cmsbupt
·
2013-07-18 13:00
通用处理器的并行设计思想
从底层来看,采用
SIMD
技术是让数据实现并行,通过让一条指令处理多组数据,减少总的指令数,提高程序的执行效率。 采
益慧凌云
·
2013-06-03 21:58
处理器
VLIW
NEON的一些总结
blog.sina.com.cn/s/blog_4ae178ba01013yax.html2、http://blog.csdn.net/conowen/article/details/72559203、【整理】
SIMD
lyuan1314
·
2013-05-21 11:00
neon
GCC中的Intrinsics头文件与
SIMD
指令集、宏、参数的对应表
原文地址:http://www.cnblogs.com/zyl910/archive/2012/08/27/intrin_table_gcc.html列名解释——GCC470:GCC4.7.0(Fedora17)。/usr/lib/gcc/i686-redhat-linux/4.7.0/include/。GCC462:GCC4.6.2(MinGW)。\lib\gcc\mingw32\4.6.2\i
nancygreen
·
2013-05-03 16:00
A Simple Wrapper of DirectX Math
ASimpleWrapperofDirectXMath关于DirectXMathDirectXMath最初叫做XNAMath,是一个跨平台的C++数学库,全
SIMD
指令优化,目前的版本是3.03,支持x86
clayman
·
2013-05-01 14:00
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他