E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
SIMD
2018-03-01 【Linux下在GCC环境使用
SIMD
】
在支持
SIMD
的CPU中,包含着一些特别宽的寄存器(比如512位)。通过特别的指令,可以在这些寄存器上执行指定操作。
巴普洛夫学习
·
2018-03-01 19:15
一道简单面试题引出的优化方法讨论 (Ⅱ)
从上一篇一道简单面试题引出的优化方法讨论(Ⅰ)中,我们已经了解到了这个问题使用
SIMD
和SMT进行优化的实现方法,我会在第二篇中继续探讨使用SIMT优化的实现方法。
goooxu
·
2018-02-12 15:10
优化
面试
SIMT和
SIMD
百度百科:SIMTSIMT中文译为单指令多线程,英文全称为SingleInstructionMultipleThreadsGPU中的SIMT体系结构相对于CPU的
SIMD
中的概念。
Tiger-Li
·
2018-01-15 21:33
计算机体系结构
【优化技巧】
SIMD
- Single Instruction Multiple Data
SIMD
-SingleInstructionMultipleData现代微处理器中使用一条指令进行多个数据运算的技术对于矢量运算和矩阵运算可以迅速地执行被广泛运用于游戏引擎的数学库中对于矢量和矩阵的运算
干嚼狗尾草
·
2017-12-19 15:04
编程技巧干货
深度学习中向量化与非向量化计算的差别
使用向量化(Vectorization)计算,速度是非向量化(non-Vectorization)计算的300倍,因为向量化计算使用了python的内建函数,调用了CPU/GPU的
SIMD
指令集进行计算
悦凡-
·
2017-12-04 09:57
深度学习2:为什么深度学习要使用numpy库
通常,深度学习模型都是运行在GPU(图像处理器单元),因为它有
SIMD
并行化指令,所以能够快速处理图片。
haimianjie2012
·
2017-11-26 23:56
深度学习
深度学习
Ubuntu 安装libjpeg-turbo库
libjpeg-turbo是libjpeg的一个复刻,它采用单指令流多数据流(
SIMD
)指令来加速JPEG编码和解码基础效率。许多项目现在使用libjpeg-turbo而不是libjpeg。
Dancer__Sky
·
2017-11-25 14:56
jpeg-turbo
Ubuntu 安装libjpeg-turbo库
libjpeg-turbo是libjpeg的一个复刻,它采用单指令流多数据流(
SIMD
)指令来加速JPEG编码和解码基础效率。许多项目现在使用libjpeg-turbo而不是libjpeg。
Dancer__Sky
·
2017-11-25 14:56
jpeg-turbo
每秒解析千兆字节的JSON解析器开源,秒杀一大波解析器!
我们希望在进行完全验证(包括字符编码)的同时尽可能使用常用的
SIMD
指
cpongo2
·
2017-11-25 04:37
SSE指令集优化学习:双线性插值
1.什么是SSE说到SSE,首先要弄清楚的一个概念是
SIMD
(单指令多数据流,SingleInstructionMultipleData),是一种数据并行技术,能
djzhao
·
2017-10-31 21:38
c++
滤镜
并行加速实战 二维中值滤波器
中值滤波器使用了快速3x3中值滤波器数据类型16U摘要我们以下将使用1.
SIMD
:SSE,AVX2.multiThread:openmp,std::thread3.
SIMD
+multiThread:AVX
billbliss
·
2017-09-29 09:44
C/C++编程
OpenMP
cv
SIMD
海思3559平台验证neon优化rgb转灰度图算法
NEON简介NEON就是一种基于
SIMD
思想的ARM技术,相比于ARMv6或之前的架构,NEON结合了64-bit和128-bit的
SIMD
指令集,提供128-bit宽的向量运算(vectoroperations
nan1994
·
2017-09-12 16:02
arm
neon
嵌入式
SIMD
计算median filter(中值滤波向量化计算)
1.medianfilter是一种非线性平滑技术,它将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值.中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。方法是用某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调
myth_0c21
·
2017-08-30 22:50
C#代码中插入X86汇编
这两天在看C#
SIMD
相关的东西,在爆栈上面搜到一段代码,表示很震惊,还是得贴出来…1[UnmanagedFunctionPointer(CallingConvention.StdCall)]2delegatevoidVectorAddDelegate
egmkang
·
2017-08-29 18:00
SSE图像算法优化系列九:灵活运用
SIMD
指令16倍提升Sobel边缘检测的速度(4000*3000的24位图像时间由480ms降低到30ms)。
闲话少说,
SIMD
指令集,这个古老的东西,从第一代开始算起,也快有近20年的历史了,从最开始的MMX技术,
Imageshop
·
2017-08-04 18:00
ARM NEON编程初探——一个简单的BGR888转YUV444实例详解
原文请猛戳这里最近在学习ARM的
SIMD
指令集NEON,发现这方面的资料真是太少了,我便来给NEON凑凑人气,姑且以这篇入门文章来分享一些心得吧。
galois
·
2017-07-10 00:00
arm
MPI并行程序设计学习整理
这篇文章可能会随着学习的深入不断的更新~IntroductiontoMPI学MPI的时候,老师首先给我们回顾了一下并行编程的一些模式:并行可以分为两种:一种是任务并行,另一种是数据并行,根据这两种性质可以分为以下4种模式:
SIMD
Algorithm_goddness
·
2017-06-08 17:17
数据相关(数据分析/大数据)
ARM NEON常用函数总结
NEON技术是ARMCortex™-A系列处理器的128位
SIMD
(单指令,多数据)架构扩展,旨在为消费性多媒体应用程序提供灵活、强大的加速功能,从而显著改善用户体验。
无眠栀
·
2017-06-02 21:37
iOS
学习
软件体系结构设计|描述与架构风格
架构风格计算机硬件系统中包含的两个重要因素:基本硬件模块:控制器、运算器、内存储器、外存储器、输入设备……硬件模块之间的连接关系:总线(控制总线、地址总线、数据总线)计算机系统体系结构的风格:SISD:单指令流单数据流串行处理器
SIMD
_Summer tree
·
2017-05-15 16:52
软件工程
【图像算法优化】开篇:
simd
-library介绍及几个优化技巧
本系列主要涉及图像处理算法的优化技巧,都是通过学习
simd
-library中的代码,然后进行总结,包括basic部分跟neon优化部分。
Denny#
·
2017-04-01 00:33
【图像算法】
图像处理优化技巧
优化shader程序的一些tips
首先要树立几个思想:1.gpu是
SIMD
的架构,即单指令多数据流架构,即在gpu上同时执行n个数据和执行1个数据的效率是一样的,我们要尽量的把并行的计算搬到gpu上2.gpu是以向量计算为基础设计
leonwei
·
2017-02-17 19:00
Multicore Programming
SIMD
SIMD
介绍SSE的指令StreamingSIMDExtensions函数命名举例应用转载请注明出处:http://blog.csdn.net/c602273091/article/details/55045956
SIMD
Snail_Walker
·
2017-02-13 11:15
CMU:
How
to
Write
Fast
Code
18-645:How
to
Write
Fast
Code
SSE图像算法优化系列一:一段BGR2Y的
SIMD
代码解析。
一个同事在github上淘到一个基于
SIMD
的RGB转Y(彩色转灰度或者转明度)的代码,我抽了点时间看了下,顺便学习了一些
SIMD
指令,这里把学习过程中的一些理解和认识共享给大家。
Imageshop
·
2017-01-08 22:00
向量化并行也是一门手艺
(博客的内容不一定非常详细,但可以激发思考和启发技术进步)向量化并行最常见的一种说法是
SIMD
,在并行编程的层次较低时常常被采用。
betterlord
·
2016-12-23 23:28
ES6学习17(
SIMD
)
概述
SIMD
(发音/sim-dee/)是“SingleInstruction/MultipleData”的缩写,意为“单指令,多数据”。
exialym
·
2016-10-20 15:52
JavaScript
SIMD
SIMD
单指令流多数据流(SingleInstructionMultipleData,
SIMD
)是一种采用一个控制器来控制多个处理器,同时对一组数据(又称“数据向量”)中的每一个分别执行相同的操作从而实现空间上的并行性的技术
hellochenlu
·
2016-08-30 16:47
并行计算
neon基础知识
neon介绍Neon是适用于ARMCortex-A系列处理器的一种
SIMD
(SingleInstruction,MultipleData)扩展结构。
EmSoftEn
·
2016-07-05 20:18
arm
neon
并行程序设计模型
该模型在
SIMD
计算机与SPMD计算机上均可以实现,这取决于粒度的大
qq100440110
·
2016-07-04 21:00
并行计算
parallel
openmp
DirectXMath
DirectXMathDirectXMath微软为图形应用程序提供的数学库,支持
SIMD
的,C++形式的API。
chenjinxian_3D
·
2016-06-29 21:00
几种并行计算模型的区别(BSP LogP PRAM)
PRAM模型PRAM(ParallelRandomAccessMachine,随机存取并行机器)模型,也称为共享存储的
SIMD
模型,是一种抽象的并行计算模型,它是从串行的RAM模型直接发展起来的。
qq100440110
·
2016-06-13 15:00
并行计算
指令选择器调查(6)
通过允许输入及模式具有任意的图形状,指令选择器能够接受整个函数为输入——这被称为全局指令选择——有可能处理各种机器指令,包括硬件循环及
SIMD
指令。
wuhui_gdnt
·
2016-06-03 11:00
compiler
编译器
Study Notes: OpenMP gramma and notes
2/MIMD和
SIMD
最大的区别是,MIMD意思就是用到multi-core而
SIMD
则是同一个core。3/使用OpenMP需要在GCC的compiler上加上-fopenmp且如果需要使用内置运行
firehotest
·
2016-05-12 01:32
Program
Optimisation
Study Notes: OpenMP gramma and notes
2/MIMD和
SIMD
最大的区别是,MIMD意思就是用到multi-core而
SIMD
则是同一个core。 3/使用OpenMP需要在GCC的compiler上加上-fopenmp且如果需要使用内置
Firehotest
·
2016-05-12 01:00
SSE指令集优化学习:双线性插值
1.什么是SSE说到SSE,首先要弄清楚的一个概念是
SIMD
(单指令多数据流,SingleInstructionMultipleData),是一种数据并行技术,能够在一条指令中同时对多个数据执行运算操作
lovelq522
·
2016-05-06 17:00
优化
七周七并发模型
并发还是并行并发是同一时间应对多件事情的能力并发是问题域中的概念并发程序的执行通常是不确定的并行是同一时间动手做多件事的能力并行是方法域中的概念并行程序是确定性的,并行不引入不确定性并行架构位级并行例如64bit计算机,可以并行处理64位数的8字节指令级并行CPU处理看上去是串行的结果,但内部其实是并行的优化数据级并行
SIMD
锅巴GG
·
2016-04-30 01:30
SSE指令集优化学习:双线性插值
1.什么是SSE说到SSE,首先要弄清楚的一个概念是
SIMD
(单指令多数据流,SingleInstructionMultipleData),是一种数据并行技术,能够在一条指令中同时对多个数据执行运算操作
Brook_icv
·
2016-04-29 11:00
SIMD
指令初学
SIMD
即singleinstructionmultipledata,单指令流多数据流,也就是说一次运算指令可以执行多个数据流,这样在很多时候可以提高程序的运算速度。
woxiaohahaa
·
2016-04-05 21:00
关于SSE的一些资料
之前查到的,觉得还不错,一直没时间看,放这里先存着https://software.intel.com/en-us/articles/using-intel-streaming-
simd
-extensions-and-intel-integrated-performance-primitives-to-accelerate-algorithmshttp
waytofall
·
2016-03-03 11:00
多核程序设计的相关基础知识----以误差扩散算法为例
单指令多数据流机器(
SIMD
)几乎所有的计算机都实现了
SIMD
功能
wangyaninglm
·
2016-01-31 23:00
设计
多核
代码调优
openmp
关于
SIMD
指令的一些问题
今天看CSAPP,看到关于
SIMD
指令的东西,所以在网上找了点资料.资料来源于1)上交精品课2)以XLC/C++编译器为例使用向量技术编程如果侵权,请联系我删除以下简单的贴一下内容单指令流多数据流(
SIMD
victo2012
·
2016-01-23 22:00
CSAPP
libjpeg:实现jpeg内存压缩暨error_exit错误异常处理和个性化参数设置
libjpeg-turbo是与libjpeg接口兼容的一个jpeg编/解码库,其主要的特点就是利用
SIMD
指令(如X86架构的MMX/SSE/SSE2,ARM架构的NEON)来加速jpeg图像的编/解码
10km
·
2016-01-20 10:27
c/c++/c++11
jpeg
libjpeg:实现jpeg内存压缩暨error_exit错误异常处理和个性化参数设置
libjpeg-turbo是与libjpeg接口兼容的一个jpeg编/解码库,其主要的特点就是利用
SIMD
指令(如X86架构的MMX/SSE/SSE2,ARM架构的NEON)来加速jpeg图像的编/解码
10km
·
2016-01-20 10:00
libjpeg
图像压缩
内存压缩
error-exit
mingw(gcc)编译libjpeg-turbo
libjpeg-turbo是与libjpeg接口兼容的一个jpeg编/解码库,其主要的特点就是利用
SIMD
指令(如X86架构的MMX/SSE/SSE2,ARM架构的NEON)来加速jpeg图像的编/解码
10km
·
2016-01-15 17:16
jpeg
mingw(gcc)编译libjpeg-turbo
libjpeg-turbo是与libjpeg接口兼容的一个jpeg编/解码库,其主要的特点就是利用
SIMD
指令(如X86架构的MMX/SSE/SSE2,ARM架构的NEON)来加速jpeg图像的编/解码
10km
·
2016-01-15 17:00
MinGW
SIMD
libjpeg
turbo
【问题解决记录】无法识别的标志“-sdlMode”,在“p2”中
本文为大便一箩筐的原创内容,转载请注明出处,谢谢:http://www.cnblogs.com/dbylk/这是本人第一次使用MarkDown编辑器,试试看效果—w—,下面是正文:一、报错原因昨天用
SIMD
大便一箩筐
·
2016-01-15 16:00
CUDA Study Notes
的缩写)是由AMD开发的一套
SIMD
多
K346K346
·
2016-01-06 18:00
Android NDK开发之 NEON基础介绍
这是官方介绍:http://www.arm.com/zh/products/processors/technologies/neon.php一、NEON简介ARM®NEON™通用
SIMD
引擎可有效处理当前和将来的多媒体格式
Eason.wxd
·
2015-12-30 14:24
移动开发
Android NDK开发之 NEON基础介绍
这是官方介绍:http://www.arm.com/zh/products/processors/technologies/neon.php一、NEON简介ARM®NEON™ 通用
SIMD
引擎可有效处理当前和将来的多媒体格式
App_12062011
·
2015-12-30 14:00
libyuv库的使用
它是跨平台的,可在Windows、Linux、Mac、Android等操作系统,x86、x64、arm架构上进行编译运行,支持SSE、AVX、NEON等
SIMD
指令加速。
fengbingchun
·
2015-12-16 08:00
XNA数学库中的XMVECTOR
目前推荐使用XNA数学库,因为其建立在
SIMD
指令上,以更好的利用Windows及XBox360上特殊的硬件寄存器(128位,可以同时操作4个32位数)。
闪电猫ddx
·
2015-11-15 14:14
XNA
数学库
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他