Morning21

HSA DSE 初探索

本文主要将目前三种HSA模拟器设计文献进行翻译总结，文献请查看上传文件。

gem5-gpu: http://download.csdn.net/detail/lpn709695399/9620482

multi2sim: http://download.csdn.net/detail/lpn709695399/9621438

socrocket: http://download.csdn.net/detail/lpn709695399/9620483

http://download.csdn.net/detail/lpn709695399/9608852

gem5-gpu: A Heterogeneous CPU-GPU Simulator
-> 2013
集成CPU与GPU系统的模拟器，基于gem5(CPU)与GPGPU-sim(GPU)搭建
most memory accesses基于Ruby搭建，gem5中的可配置存储系统：
1. cache一致性
2. CPU/GPU共享虚拟地址，独享物理地址

可以运行CUDA 3.2的代码，非阻塞运行，CPU与GPU可并行运行，本文提供软件架构和性能分析，并提出扩展方案 <---如何实现非阻塞运行

1. Introduction
gem5为全系统多核模拟器，有多种CPU、指令集和存储模型；另外gem5支持面向对象的设计，灵活多变的配置方案。逐渐成熟的技术使得gem5成为评估通用CPUs和多核平台的主要工具。 <---是否包含ARM

GPGPU-sim为GPGPU的模拟器，为GPGPU的CU(compute units，如NVIDIA中的SM)和GPU的存储系统进行建模

gem5-gpu借鉴GPGPU-sim中的CU模型和 gem5的CPU和存储系统模型
采用execution-driven simulation
trace-driven的prtition方法比较好
[1] MacSim中采用了更加细化的方法，相对于Multi2Sim和FusionSim，具有更灵活的存储架构和一致性协议，仿真时间比较长
优势：
1.Detailed cache coherence model
2.Full-system simulation
3.Checkpointing
4.Tightly integrated with the latest gem5 simulator
5.Increased extensibility of GPGPU programming model and entire system architecture
DMA engine可以对CPU和GPU地址空间进行数据搬运建模

2 Heterogeneous Computing
GPGPU计算是计算迁移（Computation Offloading）的代表
计算迁移：针对特定的工作任务，受当前计算系统资源的限制，需要将计算任务分配到其他外部平台，比如a cluster, grid, or a cloud。可以用到Artificial intelligence, Artifitial Vision and object tracking, or computational decision making
data-parallel image processing, scientific, and numerical algorithms

迁移到GPU的任务称为Kernel，Kernel可以分为许多线程，而只占用GPU一条指令的SIMT执行
Work units offloaded to the GPU are called kernels

CPU与GPU采用独立的存储空间时，GPU与CPU之间需要进行数据的搬运
程序迁移至GPU需要use-level calls，调用GPGPU的API（runtime），其中包含kernel-level驱动控制GPU设备。目前比较流行的runtime为CUDA和OpenCL

HSA fundation提出未来异构计算中统一存储方案（heterogeneous uniform memory access, hUMA）
[7]中NVIDIA也提出统一存储空间的方法UVA

gem5-gpu目的就是支持这种灵活、可扩展的编程模型和体系结构

3. The Giant's shoulders
3.1 gem5
gem5.org由学术界与工业界的许多实验室开发
gem5包含许多CPU，存储系统和指令集模型
two execution modes:
1) system call emulation：系统调用仿真，可以执行User-level binaries调用emulated system calls <- 不是特别懂
2) full-system: 建模所有设备来boot并运行操作系统，提供检查点（checkpoint），可以有目的的进行仿真
优势：
1. 提供融合新体系架构机制，可以使用集成在gem中的EXTRAS接口例化外部代码 <- 如何添加
2. 集成了详细的cache和memory模拟器Ruby，Ruby是基于domain specific language, SLICC（用来描述cache一致性协议）开发的环境，目前还没有GPU的模型
3.2 GPGPU-Sim
[2] backed by a strong publication record
为现有的NVIDIA显卡进行建模
GPGPU-Sim将应用程序编译为PTX（NVIDIA中间指令集）或者汇编本地GPU机器码
GPGPU-Sim为线程分配逻辑、highly-banked regster file、特殊功能单元和存储器系统的计算流水进行功能和时序模型
GPGPU-Sim包含GPU的存储器、DRAM、cache模型
constant/scratchedpad/low-latency in-core cache/local/parameter/instruction/texture

GPGPU-Sim可以将源代码连接到为对应的GPGPU运行库
GPGPU-Sim是一个功能优先模拟器，先执行所有的指令，然后反馈给时间模拟器

GPGPU-Sim在为异构系统建模的缺陷：
1. 没有主CPU的时钟模型
2. 没有主设备拷贝函数的时钟模型
3. 严格的cache模型
4. 没有主设备间的交互模型

4. gem5-gpu architecture
GPU由许多CU组成，每个CU均有取指/译码逻辑、a large register file，许多执行通道（execution lanes, 多为32/64）
当读取global memory时，每个通道将各自地址发送到聚结器（coalescer），将所有的memory accesses指向相同的cache块，GPU也可以有自己的cache架构

4.1 gem5<-->GPGPU-Sim Interface
我们的目标之一是在gem5与GPGPU-sim间提供简洁的接口，在gem5中添加一条伪指令，简化DMA engine和GPU功能的调用
gem5-gpu将GPGPU-Sim对global address space的访问通过gem5接口映射到Ruby的访存指令

4.2 Memory System Modeling
gem5-gpu使用Ruby对CU存储器访问进行功能和时序的建模
load-store流水线在gem5中建模，包括coalescing, virtual address translation, and cache arbitration logic

gem5-gpu可以灵活修改通道的个数，CU的个数，缓存的架构等，未来将支持其他GPU模型

目前，GPGPU-Sim发送通用存储器指令给gem5，包含对global和constant存储器的访问
我们采用GPGPU-Sim对scratchpad和parameter存储器的访问
之后，我们将对texture和local memory的访问进行实现

gem5-gpu支持CPU与GPU进行统一存储，也可以独立存储

4.3 Detailed Cache Coherence Models
gem5-gpu采用cache一致性建模语言SLICC，配置gem5-gpu时，可以使用所有的cache一致性协议。前提是为异构cache topology（不懂）

gem5-gpu添加了cache一致性协议：MOESI_hsc(heterogeneous system coherence with MOESI状态)
MOESI_hsc为CPU cache采用MOESI协议；对于GPU，添加L2 cache controller保证GPU与CPU L2 cache一致，GPU L1(write-through and valid and invalid states)在同步和kernal边界时将被清空

采用独立存储器时，需要显示地通过DMA进行数据搬运
gem5-gpu可以使用gem5提供的所有连接协议，包括mesh, torus, cross-bar （查）

4.4 Application Programming Interface
为了简化现有GPGPU的drivers和runtime的实现，gem5-gpu提供了简单的runtime和driver仿真模型，将统一的GPGPU application连接到gem5-gpu GPGPU runtime library中

当执行用户程序调用GPGPU runtime function时，执行gem5伪指令来仿真（不懂）

5. Performance Validation
针对global memory performance，我们采用了memory microbenchmarks和Rodinia benchmark的子集[4]，包括coalescing, cache, off-chip latency和bandwidth

对NVDIA GTX 580进行GPGPU-Sim和gem5-gpu的建模

虽然gem5-gpu的运行时间比GPGPU-Sim差些，但提供了时钟模型，计算了数据搬运延迟和kernel的运行时间，GPGPU-Sim没有计算搬运时间

GPGPU-Sim中的CU寄存器处理采用PTX中间模型，而不是object code

6. Future work
缺陷：
1. 目前仅限x86 ISA，未来将支持ARM ISA
2. 仅支持CUDA，NVIDIA的GPGPU内核，未来将支持OpenCL
4. 仅支持GPGPU-sim，未来将支持其他GPU模型

Multi2Sim A Simulation Framework for CPU-GPU computing
-> 2012
建模方式不仅包括计算单元，也包括计算单元之间的交互
本文针对x86 CPU和 AMD Evergreen GPU指令集模拟，进行AMD Radeon 5870 Gpu的建模
针对仿真正确性，以及架构模拟的精确性，并使用AMD OpenCL benchmark库进行验证
仿真能力评估方式：初期架构探索 + 性能范例

[12,13]提出了GPU仿真中的中间语言层（PTX）
但缺少针对考虑ISA级的功能仿真及时钟精确架构仿真

本文结合并行AMD Evergreen GPU集[3] 和超标量、多线程、多核x86处理器
将描述指令流水和存储架构

Multi2Sim提供Linux命令行工具，对OpenCL不进行任何修改就可以执行，和支持程序性能评估的指令，程序优化，编译优化，硬件架构设计

2. The multi2sim project
初期，针对超标量、多线程、多核x86 CPU架构
仿真主要包括：
功能仿真：
模拟x86处理器上，翻译二进制文件，动态复现ISA级程序的执行
可以执行单线程benchmark（SPEC2006 and Mediabench），多线程benchmark（SPLASH-2 and PARSEC 2.1），自定义程序
架构仿真：
detailed or timing simulator，在功能仿真的基础上trace x86的指令，并trace处理器硬件结构每个时钟的活动
支持乱序执行，保持cache一致性，互联网络和其他特性
现在，Multi2Sim集成了商用AMD Evergreen GPU系列的许多可配置模型，和交互模型interaction model

GPU emulator traces Evergreen的指令，detailed simulator traces执行时间和架构状态
OpenCL(Open Computing Language)调用GPU的仿真

2.1 The OpenCL Programming Model
使用single-program multiple-data(SPMD)方法
OpenCL的kernel叫做work-items，可以访问私有存储器池（own pool of private memory），work-item在work-groups中
1. work-group中的work-item支持高效同步机制
2. work-group中的work-item可以低延迟访问local memory
所有的work-groups组成为ND-Range(grid of work-item groups)，共享global memory
2.2 OpenCL Simulation
CPU simulator调用OpenCL API，OpenCL runtime（libm2s-opencl.so）执行后，GPU simulator开始运行

3. Architectural simulation of an AMD Evergreen GPU
这部分主要描述硬件组件如何实现OpenCL kernel，包括指令流水，存储器，互联方法（大部分GPU提供商设为私密文件，不予公开）
3.1 The Evergreen GPU Architecture
GPU 包含 a ultra-threaded dispatcher, an array of independent compute units, and a memory hierarchy

ultra-threaded dispatcher:
对ND-Range处理，将等待的work-group分配到闲置的compute unit，从global memory hierarchy中读写数据，两级cache

计算单元由三个execution engines(control flow-CF, arithmetic-logic-ALU, and texture-TEX，分别执行不同的kernel)，一个local memory，一个register file

ALU包含a set of stream cores，每个stream core用来执行一条算术指令
ALU指令由5路VLSW束组成，编译过程中产生，VLSW上的每条指令分别执行，stream core执行
Evergreen GPU定义wavefront （a group of work-items）以SIMD的形式执行
每个work-item有各自的Private data，这种模式通过共用的front-end（不懂）简化了wavefront指令预取部件
3.2 The Evergreen Instruction Set(ISA)
当GPU simulator接收到OpenCL的Kernel，开始仿真时，模拟器开始循环取指、译码、执行
Evergreen汇编使用基于clause格式，kernel以CF指令开始，影响主程序的控制流程，往global memory写数，向后期clause的转变（如ALU或TEX clause）
ALU clause负责指令执行和local memory的存取，TEX clause负责从global memory中读取数据

一个stream core一次只执行一个VLIW束，每个ALU label对应分配到指令的VLIW束（不太懂）
ALU的指令操作数可以通过PV(preveious vector)或PS(Previous Scalar)特殊寄存器，从上一条指令中获得

CPU可以初始化一块constant memory作为操作数来源（globally accessible）

从上面的描述中，我们可知其他高级中间语言的区别，如AMD的IL[4]和NVDIA的PTX[6]，如，在AMD Evergreen ISA中，仅有限个通用寄存器，所以生成的VLIW bundles优先，而且将机器码组合为clause也需要一定的规则。但总的来说，ISA许多属性在机器上直接执行，而存在中间代码时，不需要考虑。因此，ISA级的仿真可以有效地提升运算速度和准确性

3.2.1 Kernel Execution Model
OpenCL kernel is launched -> ND-Range configuration -> work-groups
work-groups可以被分配到单个compute unit，取决于4个限制：
i) 每个compute unit支持的最大work-group个数
ii) 每个compute unit支持的最大wavefront数
iii) 每个compute unit中寄存器数
iV) 每个compute unit中local memory大小
Multi2Sim可以权衡将多少work-group（maximize）分配到compute unit中，从而提升性能

每个work-group被分为多个wavefront，放入ready wavefront pool中，CF engine依据wavefront调度算法，从pool中选择wavefront，每个wavefront包含CF clause、ALU and TEX clause
wavefront调度算法是另外一个性能参数，Multi2Sim将其纳入

保证每次只有一个CF指令正在执行，避免分支预测和case预测。通过重叠不同wavefronts消除串行化的代价。Multi2Sim将决策重叠execution纳入
3.2.2 Work-Item Divergence
参考./GPU Branch Execution and Reduction Algorithms.pdf

work-item分支是单个wavefront中不同work-item执行时带来的副作用，为解决该问题，Evergreen ISA提供给每个wavefront一个active mask，active mask是个位图，标志哪个work-item正在工作，若inactive，相关的计算单元执行结果将被忽略，且不改变kernel状态

这种策略意在覆盖所有可能的执行路径，仅允许active（执行条件与预取指令流一致）的work-item，另外嵌套的分支需要active mask stack用来push/pop active masks。

Multi2Sim提供work-item divergence
3.3 The Instruction Pipelines
CF、ALU和TEX被组织为指令流水线（图5）
每条流水线中，需要确定调度策略（scheduling policies）、延迟、缓冲区大小

CF clause:
fetch stage: 每个时钟从wavefront pool中选取一个wavefront，每个CF instruction进行wavefront的切换
decode stage: 以Round-robin方式进行译码（负载均衡，权重轮询更优）
触发secondary clause（ALU或TEX）
保持execute state直至secondary clause结束

其他wavefront可以在中间执行
CF指令按顺序结束，结束后wavefront返回wavefront pool备选

Global memory writes 在CF engine中执行
ALU clause:
译码后的VLIW指令本分放到VLIW bundle buffer中
read stage: 读取VLIW bundle，并为wavefront中的work-item从register file和/或local memory中读取源操作数
execute stage: 从VLIW bundle中读取，在每周期分发到stream cores
若stream core中的寄存器资源不能满足wavefront的需求，wavefront被分为subwavefronts，每个subwavefront的work-item数与每个compute unit中的stram core数一致
write stage: 计算结果被写回目标地址（register file或local memory）
TEX clause:
执行从global memory取指令的操作
TEX指令字在预取、译码后存入TEX instruction buffer

read stage: wavefront中每个work-item的存储器地址从register file中读取，并向global memory发起读操作
write stage: 读回的数据写入register file
3.4 Memory Subsystem
GPU memory subsystem对于data storage and transfer有不同的组件
对于multi2sim，memory subsystem有较强的可配置能力，如cache层级，存储容量，block size，bank数目，ports

Register File: no contention，支持不同wavefront，TEX和ALU同时访问
Local Memory: 每个CU都有各自的local memory，当出现冲突时，进行串化，另外考虑到memory coalescing（合并内存）。可配参数有latency, number of banks, ports, and allocation chunk size
Global Memory: 所有的CU都可以访问，延时由硬件架构来减少，可配参数有cache levels和interconnects。每个CU有各自的L1，共享L2。L1的管理方法与CPU一致，硬件管理
Interconnection networks: 不同层级之间的连接网络，通过switch实现点对点连接
Cache access queues: 访问cache有缓冲区buffer来存储访问序列。一方面在流水线中Prevent stalls，另一方面解决memory access coalescing
4. Experimental evaluation
实例说明functional 和 architectural 仿真的正确性
仿真在Intel Xeon 4核处理器上进行仿真，性能评估由AMD OpenCL SDK完成

4.1 Validation
functional simulator:
instruction decoder的验证方法是对比反汇编与AMD编译器生成代码是否一致
对比benchmark在CPU上执行与仿真环境的输出结果
architectural simulator:
对比Multi2Sim与实际硬件（native）运行的结果
architectural model 是基于时钟的，native excution评估为Kernel的运行时间
ALU频率设置为850MHz，与硬件一致
硬件计算每1000条指令的平均时间，时间由AMD APP profiler获得，profiler统计不包含kernel的建立和IO时间

修改benchmark的问题大小，模拟效果与实际运行效果的时间长度趋势相同，横轴对应模拟时间，纵轴对应硬件执行时间，如果建模效果比较准确，

导致偏差的原因有：
Specialized Memory Path Design:
AMD Radeon 5870有两个路径来访问存储器，每个路径属性不同:
fast path仅支持基本的操作，如Load、Store 32位的数据类型；
complete path可以支持高级应用，如32位一下数据类型的store和原子操作
[17]这种架构在未来将不再使用，Multi2Sim未使用
Cache Interconnect:
L1与L2之间的互联细节未被公布，仅通过与L2之间的互联方法进行模拟
Cache Parameters:
不同层级间的延迟和连接关系不清楚
4.2 Simulation Speed
图9为仿真的slowdown，function simulation slowdown is 8700x(113)，architectural simulation time is 44000x(595s)

仿真一个100周期的指令快于一个10周期的指令

[18]GPGPUSim的用处，相对native execution，平均slowdown 为90000x(1350)

4.3 Benchmark Characterization
基于instruction classification（不同类型指令的执行时间）, VLIW bundle occupancy（5个VLIW lanes的使用率）, and control flow divergence对benchmarks进行描述

4.4 Architectural Exploration
性能评估由对比每个时钟的指令数（IPC - instructions per cycle）来完成

1. 增加cu的个数
会减少平分到每个cu的global memory访存带宽，增加L2 cache，会有5倍的访存速度
ALU/Fetch比例：如果大，为compute-intensive(URNG)，小为memory-intensive(Histogram)

2. 增加stream cores的个数
the number of stream cores -> the number of subwavefronts(that stream cores deal with for each VLIW bundle) -> performance
当stream cores数与workfront中work-item的个数一致时，串化的stream core导致的bottleneck就没有了
3. 增加L1 cache的大小
在缺少时间局部性和数据局部性时，性能受cache大小影响比较大
5. Related work
[12]Barra是针对NVIDIA G80 GPU上ISA-Level的模拟器，但是NVIDIA没有提供手册文档，依赖于其他学术研究。仅限于GPU功能级仿真，缺乏架构级的仿真

[10]GPGPUSim也是针对NVIDIA架构的模拟器，包含shader core(着色)

Multi2Sim对不同GPU ISA进行建模

[13]Ocelot，将CUDA PTX(parallel thread execution)作为输入，翻译为x86、NVIDIA GPU和AMD GPU

优势：
1. 商用GPU的ISA建模
2. GPU架构建模
3. CPU-GPU模拟框架[8]

6. Conclusions
将支持AMD Fusion Architecture
支持共享存储
OpenGL + OpenCL

SOCROCKET: A VIRTUAL PLATFORM FOR SOC DESIGN
-> 2013
[1] SystemC和事务级编程模型已经逐渐成为发展趋势
必须能够描述整个系统工作流程
必须提供足够的灵活性已兼容目前的技术

[16] SCOC3 和 NGMP是未来SoC设计的代表，基于之前的设计和第三方组件
公司内部设计需要考虑的设计影响因素有：设计域、接口、抽象级别、细化粒度

亟需促进软件开发的方法，分析组合Hw/Sw系统的性能，Hw、Sw密不可分
key: 方法

Virtual Prototyping 切中关键点，使得软件开发在硬件设计过程中就可以进行，而无需考虑硬件结构

[17] 为了实现所描述方法，要求有广泛涉猎的IP核，这些核符合SystemC/TLM模型，可以在相关EDA工具获得
IP核由European Space Agency[4]（应用目标）和其他供应商（Aeroflex Gaisler with GRLIB[2]）
研究高抽象级模型和和相关方法，Braunschweig Technische Universitat开始研发SoCRocket Virtual Platform
伴随VP，SoCRocket中包含部分IP核模型:
基于TrapGen LEON ISS(instructino set simulator)
模型多为SystemC的仿真模型，如caches、 mmu、AMBA、memory controller、interrupt controller、timer等，这些模型符合TLM2.0标准（Transaction Level Modeling standard - Open SystemC Initiative 2007）
loosely-timed, approximately-timed coding styles, runtime reconfiguration, the completeness of tools and models
所有的IP仿真有免费开源的RTL代码，使得SoCRocket与其他商用VP区分开来
而且，由于满足TLM标准，所以SoCRocket环境可以移植到其他VP环境中，如Cadence VP, Synopsys VP

2. System Design with SoCRocket
Vitual System Prototyping 的优点：
1. sw/hw并行开发
2. 减少sw/hw的时间消耗
3. 相比硬件实现，节约成本
4. 由于没有线与针脚，观察能力与可控能力比较强
2.1 SystemC and TLM
[12] SystemC is a system design language that has evolved in response to a need for a language that improves overall productivity for designers of electronic systems.
SystemC是一种系统设计语言，为集成电路设计师提升产出

[11] SystemC is a C++ based modeling platform supporting design abstractions at the register-transfer, behavioral, and system levels.
SystemC是一个基于C++的建模平台，支持register-transfer、行为级与系统级的抽象

有许多库，构建系统级的混合软硬件系统的可执行模型
允许多种级别抽象的模拟器
SystemC使得设计师更多关注功能实现，而忽略实际的硬件结构

仅使用SystemC进行建模，还不足以实现高效的仿真模型，还必须定义建模规则与不同模型之间的操作流程

[13]最早提出TLM，抽象通信和计算模型（communication and computation）

2.2 Models Library
目前，仅Aeroflex Gaisler GRLib被建模，但只要满足SoCRocket建模手册，就可以对库进行扩展
所有的模型接口参数都可以进行修改，以便对各种硬件配置进行研究探索

SoCRocket主要关注Accellera TLM2[18]中描述的Loosely Timed & Approximately Timed coding styles.
LT针对fast address-accurate simulation(SW development)
Communication 采用阻塞功能调用，尽可能与SystemC Kernal同步
AT针对体系结构探索
依据所需精确度，对Communication protocol进行建模
没有对AHB进行时钟精确(cycle-accurate)的AHB模型，因为AT建模的目的是加速RTL仿真，同时保证精确，简化设计

优势：
在设计伊始就进行架构设计或优化
有利于辨别风险和缺陷
贴近于实际硬件实现的软件开发和硬件仿真

2.3 设计流程：
1. software implementing the desired functionality(功能级软件开发，手动将任务分配到软件或硬件，任务量比较大)
SoCRocket可以将C/C++代码映射到SystemC总能部件或软件任务中
手动创建或者利用综合工具生成硬件模型，硬件环境有GRLIB建模
2. 配置硬件参数，如cache大小，总线位宽，处理器单元数
两项工作同时进行，迭代至可满足性能的系统
有工具与方法来收集、分析性能参数，检测、统计仿真结果，助于设计师对架构性能的评估
可以通过shell脚本自动进行DSE，自动进行配置修改，并获得仿真结果

2.4 VP Infrastructure
不同模型 + facilities to interconnect, manage the simulation(start/stop/pause/etc.) + ability to produce results and statistics

SoCRocket设计了GUI，名为Configuration Wizard（CW），用户可以例化各个模型，修改配置参数，可以输出SW配置信息和HW配置信息
CW分析系统的存储器空间，生成软件映射链接脚本，自动集成新系统于VP环境中的编译脚本
软件代码可以在裸板上进行模拟，也可以在RTEMS OS（Real Time Executive for Multiprocessor Systems）上运行[7]

2.4.1 Performance Monitoring
为了统计执行信息，各模拟器模型提供一系列性能计数器，默认配置下，性能计数器在仿真结束后运行，1.也可以trace计数器于log或waveform文件，2.并为特定的边界、事件插入指针（基于GreenSocs infrastructure[6]）

这些统计数据用于评估设计目标，通常包括吞吐量，延迟，低成本（面积、功耗）

在仿真过程中，性能counters使用analysis API，可以实时记录仿真数据，API可以列出、读写、显示、记录各参数
而且，可以为参数生成波形和调用函数接口，供自定义的分析工具

Simulated Time Analysis
模型可以记录各个活动和时间的执行时间（如每条汇编指令在处理器中的执行时间）
时间记录为SystemC内核中的核心功能
Power Analysis
SystemC 中并没有提供这样的功能功能
需要各个实现（ad-hoc implemented）
评估原理：功耗只依赖于各个组件自己的功能
因为功耗评估框架搭建基础是整个架构模拟器，考虑到组件之间的互联

1. static power
the leakage of the component
输入参数必须初始化标准的漏电电压值
2. dynamic internal power
3. dynamic switching power(linearly dependent on the clock frequency)
存储器，总线执行一条读写操作的耗电量
库中包含GRLIB组件在 90nm CMOS工艺下功耗参数

3. Experimental Results
LEON3-based System-on-Chip
对高光谱图片进行无失真压缩算法

3.1 SoCRocket library 目前主要关注执行速度和功耗
3.1.1 Model's Accuracy
执行各种benchmark，LT & AT -> 准确率70%以上（因为许多细节只能进行抽象）
与RTL有相同的特性，cache越大，执行时间越短，仿真时间越短，这一点十分重要

功耗评估还没完成

3.1.2 Performance Results
相比VHDL，加速比高达1000+

3.2 Usage Example
参考软件分两部分，一部分成为处理器中运行的软件，一部分成为硬件
3.2.1 Design Flow Application to CCSDS Lossless Compression Algorithm
[14]CCSDS Standard

你可能感兴趣的:(HSA,DSE,simulator)

Android 异构计算与 OpenCL/CUDA/OpenVX 的协同方式实战解析观熵国产 NPU ×Android 推理优化 android 人工智能
Android异构计算与OpenCL/CUDA/OpenVX的协同方式实战解析关键词Android异构计算、OpenCL、CUDA、OpenVX、GPU加速、NPU调度、HSA架构、神经网络推理、计算图编排、SoC协同处理、AI芯片编程摘要随着国产SoC平台持续迭代，Android系统中异构计算模式已从传统CPU+GPU并行计算，扩展到集成NPU、DSP、ISP等多核单元的复杂协同体系。在AI推理
ColQwen-Omni：RAG全模态检索来了，支持【文本|图像|视频|音频】四种模态！致Great 音视频
还记得ColPali、ColQwen和DSE吗？这些模型开创了视觉文档检索的新范式：无需费力地从文档中提取文本进行处理，只需将文档页面视为一系列图像（屏幕截图），然后训练视觉语言模型（VLM）直接将其内容表示为向量。ColPali的实践表明，这种策略通常比其他替代方法更快、更简单，并且能带来更好的检索性能。自发布一年以来，ColPali和ColQwen系列模型已被下载数百万次，被誉为“2024年顶
几个MODBUS模拟工具神一样的老师工业互联网嵌入式硬件
在网上找了几个MODBUS模拟测试工具，还没有来得及测试，先记录在这里。PeakHMISlaveSimulators，Neuron推荐的免费软件。使用方法可以参考：工业物联网数据桥接教程：Modbus桥接到MQTT-知乎(zhihu.com)。ModbusSlaveSimulation，开源软件，已经停止更新了。ModbusSlave和ModbusPoll，收费软件，用户很多。使用方法参考：【VS
conda环境的创建与离线环境迁移 GaussWitten 实习笔记 conda python linux ubuntu
目录简述conda虚拟环境的创建conda环境的打包压缩与离线迁移安装whl文件与解压缩简述最近在一家芯片厂前端实习，组里做npu，然后leader给了个任务要装一个npu的simulator用来跑网络测性能，问题是该simulator给出了长长的pip依赖包，然后由于保密原因还必须在离线服务器上装，上传包都需要审批（难崩）。由于之前装conda环境都是直接简单的pipinstall和condai
HSA22HSA29美光固态芯片D8BJVC8BJW 18922804861 科技服务器大数据数据库
HSA22HSA29美光固态芯片D8BJVC8BJW美光固态芯片D8BJVC8BJW系列：技术革新与行业应用深度解析一、技术解析：核心架构与创新突破美光D8BJVC8BJW系列固态芯片（如MT29F8T08EQLEHL5-QAES:E、MT29F512G08CUCABH3-12Q等）的技术竞争力源于其自研的3DNAND闪存技术。以堆叠式结构为例，通过垂直堆叠存储单元，显著提升了存储密度与空间利用率
【Kubernetes】CKA Simulator Kubernetes 1.31 陈陈CHENCHEN Kubernetes kubernetes 容器
最近为了准备CKA认证，整理了模拟题，期望能帮助到需要的小伙伴们！Question1|ContextsYouhaveaccesstomultipleclustersfromyourmainterminalthroughkubectlcontexts.Writeallthosecontextnamesinto/opt/course/1/contexts.Nextwriteacommandtodisp
不同内存区域的内存溢出行为的解决方案，以及开发过程中如何避免内存溢出，附模拟内存溢出代码（java） bpmh Java开发经验技巧 java
针对不同内存区域的Java内存溢出模拟与解决方案以下是针对不同内存区域的溢出模拟程序、解决方案及预防措施：一、堆内存溢出（HeapSpaceOOM）模拟程序：importjava.util.ArrayList;importjava.util.List;publicclassHeapOOMSimulator{publicstaticvoidmain(String[]args){ListmemoryH
MATLAB中希尔伯特-黄变换及其可视化实现有调App
本文还有配套的精品资源，点击获取简介：emd_visu_hht_EMD_emd_visu_是一个MATLAB代码库，专注于使用希尔伯特-黄变换（HHT）对非线性、非平稳信号进行分解和可视化。HHT通过经验模态分解（EMD）提取信号的本征模态函数（IMF），并通过希尔伯特谱分析（HSA）来实现对信号的深入分析。该代码库包含数据预处理、EMD算法、IMF提取、残余计算、HSA和可视化功能，适用于地震、
量子计算+C#：200行代码挑战传统加密，破解RSA的“不可能任务”？墨瑾轩量子计算 c#开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣从“经典世界”到“量子世界”的3步冒险第一步：量子世界的“魔法道具”——量子比特与叠加态核心思想：量子比特就像“魔法硬币”，可以同时是正面和反面！代码示例：量子叠加与测量usingMicrosoft.Quantum.Simulation.Simulators;
一个开源脚本，可自动安装在 AMD Radeon 7900XTX 上运行选定 AI 接口所需的所有内容 struggle2025 人工智能
一、软件介绍文末提供程序和源码下载一个开源脚本，可自动安装在AMDRadeon7900XTX上运行选定AI接口所需的所有内容。二、ROCm-AI-InstallerROCm-AI-安装程序一个开源脚本，可自动安装在AMDRadeon7900XTX上运行选定AI接口所需的所有内容。它也应该适用于7900XT卡。对于其他卡，请在脚本开头更改HSA_OVERRIDE_GFX_VERSION和GFX（未测
基于React和TypeScript的金融市场模拟器开发与模式分析 zhutoutoutousan react.js typescript 前端金融机器人人工智能自动化
基于React和TypeScript的金融市场模拟器开发与模式分析项目概述本项目开发了一个基于React和TypeScript的金融市场模拟器，通过模拟订单流和价格发现机制，重现了真实市场的动态特性。该模拟器不仅提供了实时价格图表、订单簿和交易功能，还通过随机交易者行为模拟，展示了市场自发形成的各种技术分析模式。网站:https://www.market-simulator.xyz/代码:http
Xcode15 iOS 17 Simulator 下载失败离线安装 qq_45451682 ios
根据官网指导下载iOS_17_Simulator_Runtime.dmg。主要是这一步我真的找了很久，真的是气炸了！！！！一定要点击more之后才能看见dmg！！
Xcode安装Simulator失败问题解决方法夕降巫咸 xcode macos ide
Xcode安装Simulator_Runtime失败，安装包离线安装保姆级教程Xcode更新之后有时候会提示要安装模拟器运行时环境，但是用Xcode更新会因为网络原因，我觉得基本上就是因为苹果服务器的连接不稳定导致的，更可气的是不支持断点续传，每次都重新来，所以还是用安装包离线安装的方式吧。以本次Xcode安装17.5simulator为例安装包下载地址Xcode插件下载地址进入网站之后用开发者账
xcode手动安装iOS Simulator Runtime 佛曰_不可说 ios xcode cocoa
在发布ios应用时，要求必须包含ios18，我使用的时xcode14无法自动下载ios18，记录下步骤：1.下载ios模拟器SignIn-Apple下载iOS18SimulatorRuntime2.安装到xcode1>sudoxcode-select-s/Applications/Xcode.app2>xcodebuild-runFirstLaunch3>xcrunsimctlruntimeadd
react-native在模拟器中访问本地服务踩坑 zwjapple react-native
localhost，127.0.0.1不能通信。可以在模拟器中测试与本地开发环境中的服务进行交互，但需要确保以下几点：网络配置：模拟器通常会有自己的网络设置，与主机（本地开发环境）的网络隔离。许多模拟器（例如AndroidEmulator或iOSSimulator）支持通过localhost或127.0.0.1访问主机上的服务，但有时需要使用主机的特定IP地址（例如10.0.2.2在Android
Unity XR无设备搭建平台脆皮大学生zn unity xr 游戏引擎
一、创建unity项目导入以下包，并且下载必要的Sample二、根据导入包在ProjectSetting中设置三、unity中创建一个XROrigin四、第一部分中的必要的Sample注意：1.其中XRDeviceSimulator最重要，它就是虚拟摇杆2.我们可以根据StartAssets中的Demo可以作为初学者的必要参考，完成一些简单的交互。并且其中的预制体可以直接拖入新场景中使用，例如：X
**NVC 开源项目指南** 田鲁焘Gilbert
NVC开源项目指南nvcVHDLcompilerandsimulator项目地址:https://gitcode.com/gh_mirrors/nv/nvc项目介绍NVC（具体名称在提供的信息中未明确，此处假设为一个虚构的项目名）是一个基于GitHub的开源技术项目，由用户nickg维护。该项目的详细说明在提供的引用内容中并未直接提及，因此实际功能和目的需要通过访问上述GitHub链接来获取确切信
Betaflight PID 相关源代码 SadalmelikJ betaflight 飞控 betaflight pid FPV 无人机
前言文章会省略一些不相关的代码，用//...表示，还有很多东西没有写，慢慢更新吧，如果有什么错误的地方欢迎留言指出main函数（main.c）//main.cintmain(intargc,char*argv[]){#ifdefSIMULATOR_BUILDtargetParseArgs(argc,argv);#elseUNUSED(argc);UNUSED(argv);#endifinit();
升级xcode16之后react-native-zip-archive不兼容，unsupported option ‘-G‘ cauyyl react native
问题升级xcode到16之后，xcodebuild报错：unsupportedoption'-G'fortarget'x86_64-apple-ios13.4-simulator'(intarget'RNZipArchive'fromproject'Pods')出现原因在ReactNative项目中，当你将Xcode升级到16后，可能会遇到RNZipArchive相关的编译错误，特别是与-G选项相
【Unity 流体模拟插件】FluXY - 2.5D Fluid Simulator 帮助开发者在游戏中创建逼真的水流、油流、液体动态等流体效果，适用于需要复杂流体行为的游戏或应用 Unity游戏资源学习屋 Unity插件
FluXY-2.5DFluidSimulator是一款为Unity提供的流体模拟插件，专门设计用于模拟2.5D环境中的液体流动效果。它能够帮助开发者在游戏中创建逼真的水流、油流、液体动态等流体效果，适用于需要复杂流体行为的游戏或应用。无论是游戏中的河流、海洋、雨水、液体交互还是类似液体的物理现象，FluXY都能够提供高质量的模拟效果。主要特点：2.5D流体模拟：FluXY的核心特点是其2.5D流体
Xcode 15 file-write-create wumu_Love xcode macos ide
//Sandbox:rsync.samba(2026)deny(1)file-write-create/Users/linsen/Library/Developer/Xcode/DerivedData/radarMap-cklaymjhhbqeoxbulakxmwcculzc/Build/Products/Debug-iphonesimulator/radarMap.app/Frameworks/
【CMU 15-213 CSAPP】详解cachelab——模拟缓存、编写缓存友好代码 andrew_1219 计算机基础缓存 c语言性能优化
前言本文是15-213CSAPP系列课程配套实验cachelab的题解，实验分为两个部分：一、编写缓存模拟器(cachesimulator)，模拟地址与缓存之间的映射关系二、编写缓存友好(cache-friendly)代码，从而优化矩阵转置碎碎念：cachelab可以用c语言写，终于不用在gdb一行行看汇编了。个人博客页：【CMU15-213CSAPP】详解cachelab——模拟缓存、编写缓存友
snipersim：高性能多核架构仿真工具曹艺程Luminous
snipersim：高性能多核架构仿真工具snipersimTheSniperMulti-CoreSimulator项目地址:https://gitcode.com/gh_mirrors/sn/snipersim项目介绍snipersim是一款由比利时根特大学性能实验室研究组开发的下一代并行、高速、精确的x86架构多核仿真器。该工具基于间隔核心模型（intervalcoremodel）以及Grap
Carla Simulator自动驾驶模拟器使用教程 zttsm 自动驾驶人工智能机器学习
前言：我想验证SLAM代码的效果，所以需要构建一个能提供自己和周围动车的位姿/轨迹和语义分割、bbx的真实值的复杂动态环境（最好能超过目前KITTI-Tracking序列的动态复杂度），所以要能设置CARLA世界中动车的密度、速度、与自己的相对距离、相对方向，和自己的速度；并能记录双目RGB和实例分割、轨迹、BBX。目录1.CARLA简介2.安装Carla客户端3.基础API的使用3.1clien
RISC-V ISA Simulator系列之fesvr＜5＞ CDerL riscv-isa-sim
深入解析FESVR（Front-EndServer）url:https://github.com/riscv/riscv-isa-sim.gitcommid:fcbdbe7946079650d0e656fa3d353e3f652d471f目录FESVR概述FESVR代码结构分析ELF加载机制在RISC-VISASimulator系列之fesvr＜1-4＞中我们已经完成了1.FESVR概述2.FES
RISC-V ISA Simulator系列之fesvr＜3＞ CDerL riscv-isa-sim
深入解析FESVR（Front-EndServer）url:https://github.com/riscv/riscv-isa-sim.gitcommid:fcbdbe7946079650d0e656fa3d353e3f652d471f目录FESVR概述FESVR代码结构分析ELF加载机制在RISC-VISASimulator系列之fesvr＜1-2＞中我们已经完成了1.FESVR概述2.FES
RISC-V ISA Simulator系列之fesvr＜1＞ CDerL riscv-isa-sim fesvr
深入解析FESVR（Front-EndServer）url:https://github.com/riscv/riscv-isa-sim.gitcommid:fcbdbe7946079650d0e656fa3d353e3f652d471f目录FESVR概述FESVR代码结构分析ELF加载机制系统调用处理HTIF（Host-TargetInterface）FESVR设备模拟调试与扩展1.FESVR概
HFSS 使用指南 —— 新手项目完整实现步骤 KL_lililli 嵌入式硬件
HFSS（HighFrequencyStructureSimulator）是一款专注于高频电磁场仿真的专业软件，广泛应用于天线设计、微波组件、电磁兼容性分析等领域。本文将详细介绍如何从零开始创建一个HFSS项目，并完成电磁场求解与结果分析，帮助初学者快速掌握HFSS的基本工作流程。1.项目概述与准备在开始使用HFSS前，需要明确项目目标，例如设计一个微带天线或滤波器。本文以“微带贴片天线仿真”为例
core-v-verif系列之cva6 cva6.py执行示例(1) CDerL cva6 core-v-verif
执行命令bashverif/regress/dv-riscv-arch-test.shbashverif/regress/dv-riscv-arch-test.sh备注，这里我们设置了环境变量exportRISCV=RISCV_TOOLSexportDV_SIMULATORS=veri-testharness,spikeexportNUM_JOBS=$(nproc)执行输出日志[install-v
利用HFSS软件对射频电路电磁兼容性的深入研究 DidYour 课程设计
摘要本文旨在借助HFSS（HighFrequencyStructureSimulator）软件深入研究射频电路的电磁兼容性（EMC）。通过对射频电路中电磁干扰产生机制的剖析，阐述如何运用HFSS软件建立精确的射频电路模型，进行电磁兼容性仿真分析，包括近场和远场分析、信号完整性分析等。结合实际案例，探讨不同因素对射频电路EMC性能的影响，提出基于HFSS仿真结果的优化设计策略，为提升射频电路电磁兼容
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f