python3學習筆記:多進程分佈式小例子

最近一直跟着廖大在學Python,關於分佈式進程的小例子挺有趣的,這裏做個記錄。

分佈式進程

Python的multiprocessing模塊不但支持多進程,其中managers子模塊還支持把多進程分佈到多臺機器上。一個服務進程可以作爲調度者,將任務分佈到其他多個進程中,依靠網絡通信。由於managers模塊封裝很好,不必瞭解網絡通信的細節,就可以很容易地編寫分佈式多進程程序。
master服務端原理:通過managers模塊把Queue通過網絡暴露出去,其他機器的進程就可以訪問Queue了
服務進程負責啓動Queue,把Queue註冊到網絡上,然後往Queue裏面寫入任務,代碼如下:

#task_master.py
#coding=utf-8

#多進程分佈式例子
#服務器端

from multiprocessing.managers import BaseManager
from multiprocessing import freeze_support  #server啓動報錯,提示需要引用此包
import random,time,queue

#發送任務的隊列
task_queue = queue.Queue()
#接收結果的隊列
result_queue = queue.Queue()

#從BaseManager繼承的QueueManager
class QueueManager(BaseManager):
    pass
#win7 64 貌似不支持callable下調用匿名函數lambda,這裏封裝一下
def return_task_queue():
    global task_queue
    return task_queue
def return_result_queue():
    global result_queue
    return result_queue

def test():
    #把兩個Queue註冊到網絡上,callable參數關聯了Queue對象
    #QueueManager.register('get_task_queue',callable=lambda:task_queue)
    #QueueManager.register('get_result_queue',callable=lambda:result_queue)
    QueueManager.register('get_task_queue',callable=return_task_queue)
    QueueManager.register('get_result_queue',callable=return_result_queue)
    #綁定端口5000,設置驗證碼‘abc’
    manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#這裏必須加上本地默認ip地址127.0.0.1
    #啓動Queue
    manager.start()
    #server = manager.get_server()
    #server.serve_forever()
    print('start server master')
    #獲得通過網絡訪問的Queue對象
    task = manager.get_task_queue()
    result = manager.get_result_queue()
    #放幾個任務進去
    for i in range(10):
        n = random.randint(0,10000)
        print('put task %d...' % n)
        task.put(n)
    #從result隊列讀取結果
    print('try get results...')
    for i in range(10):
        r = result.get(timeout=10)
        print('result:%s' % r)

    #關閉
    manager.shutdown()
    print('master exit')

if __name__ == '__main__':
    freeze_support()
    test()

運行截圖如下:
這裏寫圖片描述
在分佈式多進程環境下,添加任務到Queue不可以直接對原始的task_queue進行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue接口添加。

任務進程,代碼如下:

#task_worker.py
#coding=utf-8

#多進程分佈式例子
#非服務端:worker

import time,sys,queue
from multiprocessing.managers import BaseManager

#創建類似的QueueManager
class QueueManager(BaseManager):
    pass

#由於這個QueueManager只從網絡上獲取Queue,所以註冊時只提供名字即可
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')

#連接到服務器,也就是運行task_master.py的機器
server_addr = '127.0.0.1'
print('connect to server %s...'% server_addr)
#端口和驗證碼注意要保持完全一致
m = QueueManager(address=(server_addr,5000),authkey=b'abc')
#從網絡連接
m.connect()
#獲取Queue的對象
task = m.get_task_queue()
result = m.get_result_queue()
#從task隊列獲取任務,並把結果寫入result隊列
for i in range(10):
    try:
        n = task.get(timeout=1)
        print('run task %d * %d...'% (n,n))
        r = '%d * %d = %d' % (n,n,n*n)
        time.sleep(1)
        result.put(r)
    except queue.Empty:
        print('task queue is empty')
#處理結果
print('worker exit')

運行截圖如下:
這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章