使用fprof進行性能分析

原創

2020-02-21 05:17

Erlang tools lib中包含三個用於性能分析的工具：cprof，eporf和fprof。
cprof 提供函數調用計數，其對系統的性能影響最小
eprof 提供函數運行時間的百分比
fprof 通過將trace存儲到文件，提供函數調用計數及運行時間統計信息

這裏我們主要介紹fprof，首先其提供的信息最爲詳細，其次因爲將trace存儲到文件中，我們可以進行較長運行時間的性能分析

[b]fprof使用[/b]

1,fprof:start().
2,


   fprof:apply
   fprof:profile
   fprof:analyse


   fprof:trace(start)
   fprof:trace(stop)
   fprof:profile
   fprof:analyse

apply在函數開始的時候進行fprof:trace(start, ..),在函數結束的時候執行fprof:trace(stop).上面三個函數都有很多可選參數，默認情況下，使用下面文件保存各階段信息:fprof.trace， fprof.profile，fprof.analysis

[b]fprof Analysis format[/b]
產生了分析報告，最重要的就是如何閱讀了。

讓我們寫一個簡單的例子：

-module(bar).
-export([test/1]).

test(N) when is_integer(N) ->    
    L = lists:seq(1, N),
    L2 = lists:map(fun(E) -> E * 2 end, L),
    _L3 = lists:splitwith(fun(E) -> E rem 2 =:= 0 end, L2),
    ok.

進行profiling


> c(bar).
> fprof:apply(bar, test, [1000]).
> fprof:profile().
> fprof:analyse({dest, "bar.analysis"}).
Processing data...
Creating output...
Done!
ok

analysis結果已經保存到bar.analysis中，此文件可以通過erl_scan and erl_parse, file:consult/1 or io:read/2進行讀取分析。

下面我們看看analysis內容：
[quote]
%% Analysis results:
{ analysis_options,
[{callers, true},
{sort, acc},
{totals, false},
{details, true}]}.

% CNT ACC OWN
[{ totals, 5019, 18.886, 18.884}]. %%%
[/quote]

CNT表示總的函數調用次數，ACC表示Trace起始經歷的時間，OWN是Trace中所有函數執行的時間和（不包含調用函數的執行時間），我們這個例子中OWN和ACC比較接近，因爲我們這裏在啓動trace後就立即開始了函數調用，沒有進行其他特殊的工作。這裏時間的單位爲ms。

[quote]
% CNT ACC OWN
[{ "<0.82.0>", 5019,undefined, 18.884}]. %%
[/quote]
這裏表示一個process的開始，在我們這個例子中我們調用fprof:apply/3開始進行trace，因此這個Pid其實就是我們調用apply所在的Process，我們沒有Spawn新的Process，所以這裏的CNT,OWN和totals相同。ACC的值爲undefined，這是因爲這個數值對於我們沒有什麼意義，我們可以通過totals計算出這個數值。
請注意此行結尾處的 “%%”表明一個process的開始

[quote]
{[{undefined, 0, 18.886, 0.002}],
{ {fprof,apply_start_stop,4}, 0, 18.886, 0.002}, %
[{{bar,test,1}, 1, 18.884, 0.004},
{suspend, 1, 0.000, 0.000}]}.

{[{{fprof,apply_start_stop,4}, 1, 18.884, 0.004}],
{ {bar,test,1}, 1, 18.884, 0.004}, %
[{{lists,map,2}, 1, 14.859, 12.352},
{{lists,splitwith,2}, 1, 3.012, 0.001},
{{lists,seq,2}, 1, 1.009, 0.001}]}.
[/quote]
analysis內容通過空行，間隔成不同的段落。

每個段落中尾部以"%"標記的行爲這個段落的標記行。比如上面的內容中{bar,test,1}所在行爲一個關鍵行，此行上面的List爲所有調用bar:test/1的函數列表(called list)，此行下面的List爲bar:test/1調用的函數列表(calling list)。

所有的段落按照ACC遞減的順序排列，同時段落內部的called list和calling list也是按照這個規則排列。

CNT爲對應函數累計調用次數，ACC爲此函數消耗時間包含其調用的函數，OWN爲此函數自身消耗時間不包含called函數。即：
ACC(marked) = OWN(marked) + ACC(calling fun 1) + ACC(calling fun 2) ... ACC(calling fun N)
讓我們看看上面的內容中，{bar,test,1}其ACC爲：
18.884 = 0.004 + 14.859 + 3.012 + 1.009
同時{bar,test,1}作爲我們module的入口其ACC爲18.884等於所在process對應的OWN時間。

其實看到這裏，我們已經明白，我們這個module中{lists,map,2}最耗時，其佔用79% (14.859/18.880)時間，{lists,splitwith,2}佔用16% (3.012/18.880) 的時間，而{lists,seq,2} (1.009%18.880) 只佔用5%左右。

[quote]
{[{{bar,test,1}, 1, 14.859, 12.352},
{{lists,map,2}, 1000, 0.000, 1.502}],
{ {lists,map,2}, 1001, 14.859, 13.854}, %
[{{bar,'-test/1-fun-0-',1}, 1000, 1.002, 1.001},
{garbage_collect, 2, 0.002, 0.002},
{suspend, 1, 0.001, 0.000},
{{lists,map,2}, 1000, 0.000, 1.502}]}. [/quote]
接下來就是依次分析所有的被調用函數，這裏說明{lists,map,2}被兩個函數調用：
{bar,test,1}和{lists,map,2}，也許你有疑問了，在bar:test/1中的確調用了lists:map/2依次，可是我的代碼中沒有用lists:map/2調用lists:map/2啊，看看stdlib/src/lists.erl代碼，你就會明白，lists:map/2是遞歸方式調用，所以bar module中調用了1次，而我們的List長度是1000，所以lists:map/2函數就被調用了 1 + 1000 = 1001次哦。然後marked行下面就是lists:map/2調用的函數列表。

bar.analysis接下的部分，是對每個函數的分析，如果某個函數爲BIF，沒有調用任何其他函數，那麼其對應的輸出內容爲：
[quote]
{[{{lists,reverse,1}, 1, 0.001, 0.001}],
{ {lists,reverse,2}, 1, 0.001, 0.001}, %
[ ]}.
[/quote]
恩，我們lists:reverse/2是BIF，毫無疑問。

在結果中出現了suspend，這是一個pseudo函數，用來說明我們的process此刻處於中止狀態，爲什麼會處於中止狀態？我們沒有調用erlang:yield/0，也沒有調用receive相關的函數，怎麼中止了呢？這裏是Erlang虛擬機調度的結果，suspend函數對應的ACC時間總是爲0，要不要把真正的suspend時間顯示出來，這是一個值得爭論的問題。
同樣的還有garbage_collect函數，其OWN和ACC相同，這裏我們把garbage_collect計入了運行時間。

附件是analysis結果，最好自己動手做一下 :)

iteye_18554

發佈了10 篇原創文章 · 獲贊 0 · 訪問量 2861

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

使用fprof進行性能分析

工作中用到的腳本合集

24-5-18 X

erlang otp 應用發佈指南(一) tiny-1.0非真正OTP

創建gen_server組解決單process瓶頸

使用Erlang實現一個迭代器iterator

Erlang節點short names 和long names

Boost message passing between erlang nodes

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結