Python並行處理充分利用CPU實現加速

原創

一个菜鸟的奋斗

2020-06-26 08:58

最近在用Python處理公共的圖像數據庫，由於數據量比較大，一張張串行處理圖片時間太久了。因此，決定採用並行的方式來充分利用主機上的CPU來實現處理過程的加速，可以大大減少總的處理時間。

這裏採用的是concurrent.futures模塊，它可以利用multiprocessing實現真正的平行計算。

核心原理是：concurrent.futures會以子進程的形式，平行的運行多個python解釋器，從而令python程序可以利用多核CPU來提升執行速度。由於子進程與主解釋器相分離，所以他們的全局解釋器鎖也是相互獨立的。每個子進程都能夠完整的使用一個CPU內核。

具體實現起來也非常簡單，代碼如下。主機有多少CPU核心，就會啓動多少Python進程並行處理。

import concurrent.futures


def function(files):
    # To do what you want
    # files: file list that you want to process


if __name__ == '__main__':
    with concurrent.futures.ProcessPoolExecutor() as executor:
        executor.map(function, files)

改成並行處理後，我的12塊CPU滿負荷運行，處理速度明顯加快。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

阿里雲 MaxCompute 2020-10 月刊

【10月新功能發佈】 1、MaxCompute 支持 sort by 不帶 distribute by MaxCompute 支持 sort by 不帶 distribute by，提供數據重排的解決方案，提高SQL執行的過濾性能。適用客

2020-11-09 12:19:53

數據湖構建服務搭配Delta Lake玩轉CDC實時入湖

什麼是CDC Change Data Capture(CDC)用來跟蹤捕獲數據源的數據變化，並將這些變化同步到目標存儲(如數據湖或數據倉庫)，用於數據備份或後續分析，同步過程可以是分鐘/小時/天等粒度，也可以是實時同步。CDC方案分爲侵入式

雲棲號資訊小哥

2020-09-27 14:01:53

雲原生計算引擎挑戰與解決方案

雲原生背景介紹與思考圖一是基於ECS底座的EMR架構，這是一套非常完整的開源大數據生態，也是近10年來每個數字化企業必不可少的開源大數據解決方案。主要分爲以下幾層： ECS物理資源層，也就是Iaas層數據接入層，例如實時的Kafka，

雲棲號資訊小哥

2020-09-27 14:01:53

企業上雲最佳實踐客戶故事

阿里雲最佳實踐團隊爲企業用戶上雲提供最優化上雲指導，爲了給您提供更好的服務，現誠徵企業上雲最佳實踐的客戶故事。填寫徵集書還可抽取阿里雲公仔哦！阿里雲最佳實踐介紹阿里雲解決方案最佳實踐，是基於衆多客戶上雲的成功案例萃取而成的最優化企業上雲

最佳實踐小文

2020-09-22 09:58:59

微服務分佈式事務

阿里雲最佳實踐頻道：【點擊查看更多上雲最佳實踐】這裏有豐富的企業上雲最佳實踐，從典型場景入門，提供一系列項目實踐方案，降低企業上雲門檻的同時滿足您的需求！場景描述本文檔適用於在分佈式應用中，多個服務間存在分佈式事務的場景。通過阿里雲

最佳實踐小文

2020-09-22 09:58:59

iOS Abort問題系統性解決方案

一、背景崩潰(Crash)，即閃退，多指移動設備（如iOS、Android設備）在打開/使用應用程序的過程中，突然出現意外退出/中斷的情況。如果App線上版本頻繁發生崩潰，會極大地影響用戶體驗，甚至導致用戶流失，以及收益減少。因此，崩潰問

雲棲號資訊小編

2020-08-17 09:19:54

邊緣AI在智能家居人機界面(HMI)中的應用

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！消費者對於改進其便利性、安全性和用戶體驗的進步有着無法滿足的胃口。我們看到，人機界面(human-machine interface，HMI

雲棲號資訊小哥

2020-08-05 13:49:49

工信部爲“新基建”安全加把“鎖”

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！ 8月3日，工業和信息化部發布通知，要求開展2020年網絡安全技術應用試點示範工作。按照通知，2020年網絡安全技術應用試點示範選取的重點方向

雲棲號資訊小哥

2020-08-04 13:13:52

轉向邊緣計算？考慮一下

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！數據爲王，特別是在當前數據驅動業務的時代，數據思維和分析能力是決定未來成功的重要因素。隨着大量數據的挖掘和貨幣化，越來越多的公司開始認識到邊

雲棲號資訊小編

2020-08-04 13:13:52

FPGA 的歷史、現狀和未來

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！ FPGA（現場可編程門陣列，Field-Programmable Gate Arrays) 自誕生以來，就與 ASIC 社區糾纏不清。上世紀

雲棲號資訊小哥

2020-07-31 14:52:55

企業的數字化轉型如何面對網絡安全問題

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！網絡安全是公司進步和數字化轉型的較大障礙之一。自然，隨着新技術的出現，新的漏洞將使公司難以駕馭，尤其是在新的雲環境中。從法律上講，網絡安全設

雲棲號資訊小哥

2020-07-30 14:16:49

如何在疫情之後的數字化新世界中佔得先機?

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！在迅猛的疫情面前，也許我們應當感到慶幸，慶幸我們生活在一個互聯網高度發達的時代。於是，就算是在因疫情而造成的全員隔離時期，我們依然可以靠電商

雲棲號資訊小哥

2020-07-29 15:31:53

助力建築產業數字化跨越打造更具“韌性”的綠色樓宇

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！在抗擊疫情取得階段性勝利的同時，近期讓我們感到更加振奮的，是看到中國整體經濟得到了強勁的復甦，GDP在一季度同比下降6.8%的情況下，二季度

雲棲號資訊小哥

2020-07-29 15:31:53

6 年成爲 AIoT 獨角獸，這位 17 年連續創業者是如何做到的？

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！如今，物聯網和人工智能技術的飛速發展與相互滲透，萬物智聯的新賽道已清晰呈現。據Strategy Analytics最新報告《全球智能家居設備

雲棲號資訊小編

2020-07-29 12:52:52

從觸摸到聲音：語音技術如何改變物聯網格局

雲棲號資訊：【點擊查看更多行業資訊】在這裏您可以找到不同行業的第一手的上雲資訊，還在等什麼，快來！肆虐的冠狀病毒大流行給經濟和社會造成了沉重打擊。儘管這一全球性挑戰的長期後果尚待觀察，但我們在互動和經商方式上已經發生了根本性的變化。諸如社

雲棲號資訊小哥

2020-07-28 12:37:53

24小時熱門文章

最新文章

最新評論文章