VTune性能分析器簡介

7.2.1 VTune性能分析器簡介

Intel VTune性能分析器即Intel? VTune? Performance Analyzer可以幫助程序員定位並定性程序中與性能有關方面的內容。

Intel? VTune性能分析器也可以在程序運行的系統平臺上自動收集性能數據,並將所獲得的性能數據在各個不同的層次,大到系統層,小到程序源代碼級,甚至可以到處理器指令集,進行不同粒度的交互式可視化,幫助查找可能的性能瓶頸,並提供可能的解決方案。

VTune既可以在本地,也可以遠程收集性能數據,並在本地進行數據的處理、分析以及顯示。

既支持圖形界面,又有靈活的命令行模式(支持腳本語言批處理)

英特爾VTune的性能數據收集及優化分析無需對程序進行重新編譯 ,支持包括Microsoft Visual Studio.NET、英特爾C/C++Fortran編譯器、Compaq Visual FortranJAVABorland編譯器(DelphiC++ Builder)以及IBM Visual Age

VTune性能分析器的主要功能包括:

l     低開銷採樣給系統性能評測提供依據

VTune性能分析器中的採樣功能能夠幫助開發者尋找程序中的熱點區域——最耗時間的模塊、函數、代碼或彙編指令,並提供當前操作系統中運行的應用程序的進程、線程、模塊、函數以及代碼等的各種視圖,並在性能參數表格內將具體參數值列出來。

l     提供源代碼級的性能問題信息

VTune源代碼視圖和反彙編代碼視圖中確切地顯示出哪些代碼行最耗時,佔用最多的CPU執行時間等等。

l     使用調用曲線圖評測查找關鍵路徑

調用曲線圖通過分析程序運行時函數的入口點和出發點,生成一張調用曲線圖並且確定調用順序和以圖形方式顯示關鍵路徑,它還可以顯示瓶頸的上下文。通過調用曲線圖,開發人員不僅可以瞭解到應用程序將時間花費在何處,還可以瞭解應用程序是如何達到此處的,並可以查看哪些函數花費的處理時間或被堵塞的時間最長。

l     使用計數器監視器確定系統問題

計數器監控器在運行時跟蹤系統活動,確定是否會因爲可用內存減少或文件輸入輸出性能的問題而導致應用程序速度變慢,使用計數器監視器可在運行時跟蹤系統活動與資源消耗情況,從而有助於快速確定系統層面的性能問題。例如,它可以指示可用內存減少或同文件 I/O 相關的性能問題是否會降低應用程序的運行速度等。

l     使用英特爾? 調試助理查詢專家知識庫

英特爾? 調試助理可根據豐富的知識庫分析性能問題,自動推薦代碼改進的辦法,進而可提高開發者的工作效率。

l     可以對基於Intel PXA250PXA255PXA27x處理器系統上的應用程序進行取樣和分析。

7.2.2 VTune性能分析的使用

Intel VTune性能分析器從使用功能上,可分爲:採樣、調優助手、計數器監視器和調用曲線圖四大模塊,下面將針對Windows操作系統環境Intel VTune安裝目錄下的範例程序VTuneDemo.exe(例如:C:/Program Files/Intel/VTune/Examples/ VTuneDemo.exe)爲具體的實例,講解這幾個主要功能模塊的使用方法。

1、採樣(Sampling

Sampling通過統計的方法來找到HotspotsSampling收集器週期性的中斷處理器以獲取可執行的程序信息,採樣主要有兩種方式:

① 基於時間的採樣(TBS),即由操作系統定時服務和每n個處理器時鐘點觸發分析器按照週期性的時間間隔收集信息,例如操作系統定時器、NN>1)個處理器時鐘等;

②基於事件的採樣(EBS),即分析器按照特定處理器事件的觸發收集信息,檢測程序執行中處理器的內部事件(Performance Monitor Unit:PMU)發生次數(及樣本),例如:L2級緩存遺失、分支誤預測、浮點指令過時(retired)等等事件所觸發。

下面我們介紹如何使用VTune對應用程序進行採樣(Sampling)分析。

1)啓動Intel VTune性能分析器,運行界面如圖7.2.1所示。

7.2.1 VTune性能分析器啓動界面

2)選擇“New Project”按鈕,建立新的工程,執行界面如圖7.2.2 所示。

7.2.2 VTune性能分析器功能選擇界面

3)選擇“Sampling Wizard”按鈕,選擇採樣嚮導後,出現如圖7.2.3所示採樣嚮導界面。

7.2.3 採樣嚮導界面

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章