使用fprof進行性能分析

Erlang tools lib中包含三個用於性能分析的工具:cprof,eporf和fprof。
cprof 提供函數調用計數,其對系統的性能影響最小
eprof 提供函數運行時間的百分比
fprof 通過將trace存儲到文件,提供函數調用計數及運行時間統計信息

這裏我們主要介紹fprof,首先其提供的信息最爲詳細,其次因爲將trace存儲到文件中,我們可以進行較長運行時間的性能分析

[b]fprof使用[/b]

1,fprof:start().
2,

fprof:apply
fprof:profile
fprof:analyse

OR

fprof:trace(start)
fprof:trace(stop)
fprof:profile
fprof:analyse

apply在函數開始的時候進行fprof:trace(start, ..),在函數結束的時候執行fprof:trace(stop).上面三個函數都有很多可選參數,默認情況下,使用下面文件保存各階段信息:fprof.trace, fprof.profile,fprof.analysis

[b]fprof Analysis format[/b]
產生了分析報告,最重要的就是如何閱讀了。

讓我們寫一個簡單的例子:
-module(bar).
-export([test/1]).

test(N) when is_integer(N) ->
L = lists:seq(1, N),
L2 = lists:map(fun(E) -> E * 2 end, L),
_L3 = lists:splitwith(fun(E) -> E rem 2 =:= 0 end, L2),
ok.


進行profiling


> c(bar).
> fprof:apply(bar, test, [1000]).
> fprof:profile().
> fprof:analyse({dest, "bar.analysis"}).
Processing data...
Creating output...
Done!
ok


analysis結果已經保存到bar.analysis中,此文件可以通過erl_scan and erl_parse, file:consult/1 or io:read/2進行讀取分析。

下面我們看看analysis內容:
[quote]
%% Analysis results:
{ analysis_options,
[{callers, true},
{sort, acc},
{totals, false},
{details, true}]}.

% CNT ACC OWN
[{ totals, 5019, 18.886, 18.884}]. %%%
[/quote]

CNT表示總的函數調用次數,ACC表示Trace起始經歷的時間,OWN是Trace中所有函數執行的時間和(不包含調用函數的執行時間),我們這個例子中OWN和ACC比較接近,因爲我們這裏在啓動trace後就立即開始了函數調用,沒有進行其他特殊的工作。這裏時間的單位爲ms。

[quote]
% CNT ACC OWN
[{ "<0.82.0>", 5019,undefined, 18.884}]. %%
[/quote]
這裏表示一個process的開始,在我們這個例子中我們調用fprof:apply/3開始進行trace,因此這個Pid其實就是我們調用apply所在的Process,我們沒有Spawn新的Process,所以這裏的CNT,OWN和totals相同。ACC的值爲undefined,這是因爲這個數值對於我們沒有什麼意義,我們可以通過totals計算出這個數值。
請注意此行結尾處的 “%%”表明一個process的開始

[quote]
{[{undefined, 0, 18.886, 0.002}],
{ {fprof,apply_start_stop,4}, 0, 18.886, 0.002}, %
[{{bar,test,1}, 1, 18.884, 0.004},
{suspend, 1, 0.000, 0.000}]}.

{[{{fprof,apply_start_stop,4}, 1, 18.884, 0.004}],
{ {bar,test,1}, 1, 18.884, 0.004}, %
[{{lists,map,2}, 1, 14.859, 12.352},
{{lists,splitwith,2}, 1, 3.012, 0.001},
{{lists,seq,2}, 1, 1.009, 0.001}]}.
[/quote]
analysis內容通過空行,間隔成不同的段落。

每個段落中尾部以"%"標記的行爲這個段落的標記行。比如上面的內容中{bar,test,1}所在行爲一個關鍵行,此行上面的List爲所有調用bar:test/1的函數列表(called list),此行下面的List爲bar:test/1調用的函數列表(calling list)。

所有的段落按照ACC遞減的順序排列,同時段落內部的called list和calling list也是按照這個規則排列。

CNT爲對應函數累計調用次數,ACC爲此函數消耗時間包含其調用的函數,OWN爲此函數自身消耗時間不包含called函數。即:
ACC(marked) = OWN(marked) + ACC(calling fun 1) + ACC(calling fun 2) ... ACC(calling fun N)
讓我們看看上面的內容中,{bar,test,1}其ACC爲:
18.884 = 0.004 + 14.859 + 3.012 + 1.009
同時{bar,test,1}作爲我們module的入口其ACC爲18.884等於所在process對應的OWN時間。

其實看到這裏,我們已經明白,我們這個module中{lists,map,2}最耗時,其佔用79% (14.859/18.880)時間,{lists,splitwith,2}佔用16% (3.012/18.880) 的時間,而{lists,seq,2} (1.009%18.880) 只佔用5%左右。

[quote]
{[{{bar,test,1}, 1, 14.859, 12.352},
{{lists,map,2}, 1000, 0.000, 1.502}],
{ {lists,map,2}, 1001, 14.859, 13.854}, %
[{{bar,'-test/1-fun-0-',1}, 1000, 1.002, 1.001},
{garbage_collect, 2, 0.002, 0.002},
{suspend, 1, 0.001, 0.000},
{{lists,map,2}, 1000, 0.000, 1.502}]}. [/quote]
接下來就是依次分析所有的被調用函數,這裏說明{lists,map,2}被兩個函數調用:
{bar,test,1}和{lists,map,2},也許你有疑問了,在bar:test/1中的確調用了lists:map/2依次,可是我的代碼中沒有用lists:map/2調用lists:map/2啊,看看stdlib/src/lists.erl代碼,你就會明白,lists:map/2是遞歸方式調用,所以bar module中調用了1次,而我們的List長度是1000,所以lists:map/2函數就被調用了 1 + 1000 = 1001次哦。然後marked行下面就是lists:map/2調用的函數列表。

bar.analysis接下的部分,是對每個函數的分析,如果某個函數爲BIF,沒有調用任何其他函數,那麼其對應的輸出內容爲:
[quote]
{[{{lists,reverse,1}, 1, 0.001, 0.001}],
{ {lists,reverse,2}, 1, 0.001, 0.001}, %
[ ]}.
[/quote]
恩,我們lists:reverse/2是BIF,毫無疑問。

在結果中出現了suspend,這是一個pseudo函數,用來說明我們的process此刻處於中止狀態,爲什麼會處於中止狀態?我們沒有調用erlang:yield/0,也沒有調用receive相關的函數,怎麼中止了呢?這裏是Erlang虛擬機調度的結果,suspend函數對應的ACC時間總是爲0,要不要把真正的suspend時間顯示出來,這是一個值得爭論的問題。
同樣的還有garbage_collect函數,其OWN和ACC相同,這裏我們把garbage_collect計入了運行時間。

附件是analysis結果,最好自己動手做一下 :)
發佈了10 篇原創文章 · 獲贊 0 · 訪問量 2861
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章