VTune性能分析器简介

7.2.1 VTune性能分析器简介

Intel VTune性能分析器即Intel? VTune? Performance Analyzer可以帮助程序员定位并定性程序中与性能有关方面的内容。

Intel? VTune性能分析器也可以在程序运行的系统平台上自动收集性能数据,并将所获得的性能数据在各个不同的层次,大到系统层,小到程序源代码级,甚至可以到处理器指令集,进行不同粒度的交互式可视化,帮助查找可能的性能瓶颈,并提供可能的解决方案。

VTune既可以在本地,也可以远程收集性能数据,并在本地进行数据的处理、分析以及显示。

既支持图形界面,又有灵活的命令行模式(支持脚本语言批处理)

英特尔VTune的性能数据收集及优化分析无需对程序进行重新编译 ,支持包括Microsoft Visual Studio.NET、英特尔C/C++Fortran编译器、Compaq Visual FortranJAVABorland编译器(DelphiC++ Builder)以及IBM Visual Age

VTune性能分析器的主要功能包括:

l     低开销采样给系统性能评测提供依据

VTune性能分析器中的采样功能能够帮助开发者寻找程序中的热点区域——最耗时间的模块、函数、代码或汇编指令,并提供当前操作系统中运行的应用程序的进程、线程、模块、函数以及代码等的各种视图,并在性能参数表格内将具体参数值列出来。

l     提供源代码级的性能问题信息

VTune源代码视图和反汇编代码视图中确切地显示出哪些代码行最耗时,占用最多的CPU执行时间等等。

l     使用调用曲线图评测查找关键路径

调用曲线图通过分析程序运行时函数的入口点和出发点,生成一张调用曲线图并且确定调用顺序和以图形方式显示关键路径,它还可以显示瓶颈的上下文。通过调用曲线图,开发人员不仅可以了解到应用程序将时间花费在何处,还可以了解应用程序是如何达到此处的,并可以查看哪些函数花费的处理时间或被堵塞的时间最长。

l     使用计数器监视器确定系统问题

计数器监控器在运行时跟踪系统活动,确定是否会因为可用内存减少或文件输入输出性能的问题而导致应用程序速度变慢,使用计数器监视器可在运行时跟踪系统活动与资源消耗情况,从而有助于快速确定系统层面的性能问题。例如,它可以指示可用内存减少或同文件 I/O 相关的性能问题是否会降低应用程序的运行速度等。

l     使用英特尔? 调试助理查询专家知识库

英特尔? 调试助理可根据丰富的知识库分析性能问题,自动推荐代码改进的办法,进而可提高开发者的工作效率。

l     可以对基于Intel PXA250PXA255PXA27x处理器系统上的应用程序进行取样和分析。

7.2.2 VTune性能分析的使用

Intel VTune性能分析器从使用功能上,可分为:采样、调优助手、计数器监视器和调用曲线图四大模块,下面将针对Windows操作系统环境Intel VTune安装目录下的范例程序VTuneDemo.exe(例如:C:/Program Files/Intel/VTune/Examples/ VTuneDemo.exe)为具体的实例,讲解这几个主要功能模块的使用方法。

1、采样(Sampling

Sampling通过统计的方法来找到HotspotsSampling收集器周期性的中断处理器以获取可执行的程序信息,采样主要有两种方式:

① 基于时间的采样(TBS),即由操作系统定时服务和每n个处理器时钟点触发分析器按照周期性的时间间隔收集信息,例如操作系统定时器、NN>1)个处理器时钟等;

②基于事件的采样(EBS),即分析器按照特定处理器事件的触发收集信息,检测程序执行中处理器的内部事件(Performance Monitor Unit:PMU)发生次数(及样本),例如:L2级缓存遗失、分支误预测、浮点指令过时(retired)等等事件所触发。

下面我们介绍如何使用VTune对应用程序进行采样(Sampling)分析。

1)启动Intel VTune性能分析器,运行界面如图7.2.1所示。

你可能感兴趣的:(Microsoft,performance,Delphi,英特尔,fortran,Borland)