累加和高效並行版本的AAuto串行實現

累加和也叫前綴和,舉個例子:

    原始數組:1 2 2 1 

    累加數組:1 3 5 6

按照累加和的這個原始定理,前一個和沒算出來後一個是沒法算的,想要並行看來行不通啦。實際上有辦法解開這種糾纏,可參考這篇文章。 我只是把它用AAuto代碼串行的實現了一下,你可以看到,可以同時做很多計算了,因爲這些計算都是獨立的了。上代碼:

io.open()
var n=4
var N=2**n
var A={}
//初始化數組
for i=1;N
    A[ i ]=1
//由森林變成樹
var s=1
for i=1;n{
    
for j=2*s;N;2*s
        A[j]+=A[j-s]
    s*=2
}
A[N+1]=A[N]
//再由樹變回森林
A[N]=0
s=N/2
for i=1;n{
    
for j=2*s;N;2*s{
        
var tmp=A[j-s]
        A[j-s]=A[j]
        A[j]+=tmp
    }
    s/=2
}
//輸出累加結果
for i=1;#A
    io.stdout.write(A[ i ],
' ')
io.print()
execute("pause")
io.close()


發佈了128 篇原創文章 · 獲贊 21 · 訪問量 38萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章