您的应用程序速度已经够快? 我并不这么认为。
“英特尔® VTune™ 性能分析器 Linux* 版”是完全基于 Linux 的解决方案,对于使软件在单核与多核系统上运行如飞,它是不可或缺的。它无需通过超级计算机系统在手持设备上进行重新编译或链接,就可以分析应用程序。对于大型应用程序(源代码1 超过 1 GB)以及多核心、多处理器和采用最新英特尔® 处理器的 NuMA 系统,它都非常强大、稳定。
使用方便
VTune 分析器提供基于图形用户界面 (GUI) 的 Eclipse* 开发环境‡,使得应用程序性能调整更加轻松。

许多开发人员都希望将应用程序性能发挥到极致。VTune 分析器让开发人员可以查看应用程序运行过程中发生的情况。它可以确定花费了过多处理器时间的区域。它还可以帮助确定应用程序中的关键路径,调整关键路径可以带来最大的益处。没有 VTune 分析器,性能调整便如同猜谜一般。
查找瓶颈从未如此轻松
完成一个简单的对话框,就可以获得一个列表,列出最耗时间的五个函数。

使用最活跃函数的列表,快速、轻松地查找性能瓶颈。单击函数名以显示源代码并查看哪些代码花费了所有的时间。
查看源代码的答案
源代码与反汇编代码视图可以显示花费大部分时间的确切代码行。


|
|
查看源代码(如图所示) |

|
|
查看混合源代码与汇编代码 |

|
|
查看汇编代码 |

|
|
转到下一个函数 |

|
|
转到所选事件的最活跃代码行 |

|
|
转到所选事件的下一个最活跃代码行 |

|
|
查看编译器调整建议 |
使用调用图评测查找关键路径
“调用图”确定调用序列,并以图形化方式显示关键路径。它还会显示瓶颈的上下文。要确保有效,常常不仅需要了解应用程序将时间花费在什么地方,还要了解应用程序是如何到达该地方的。

与其它产品不同,VTune 分析器同时提供采样与调用图分析。即便是计划主要进行调用图分析,首先运行采样也可以帮助确定所需的模块,以便将“调用图”的较大开销仅花费在需要分析的模块上。这对于大型项目可能是至关重要的。对于分析“充满循环”的代码,采样功能非常合适。对于“充满分支”的代码,使用“调用图”通常郊果更好。要很好地完成任务,两者不可偏废。
开销极低的采样评测
基于事件的采样查找瓶颈时带来的开销极低(通常不到 5%)。确定诸如缓存未命中、分支预测错误以及总线带宽之类的问题。由于采样属于系统层面的事情,因此,基于事件的采样可用于调整函数库、驱动程序以及应用程序。
过滤数据以查找答案
采样结果的表格视图与条形视图可以按许多种方式过滤数据,以查找所需要的数据。按线程查看(如图所示)以了解负载平衡问题。

