最近一直跟着廖大在學Python,關於分佈式進程的小例子挺有趣的,這裏做個記錄。
分佈式進程
Python的multiprocessing模塊不但支持多進程,其中managers子模塊還支持把多進程分佈到多臺機器上。一個服務進程可以作爲調度者,將任務分佈到其他多個進程中,依靠網絡通信。由於managers模塊封裝很好,不必瞭解網絡通信的細節,就可以很容易地編寫分佈式多進程程序。
master服務端原理:通過managers模塊把Queue通過網絡暴露出去,其他機器的進程就可以訪問Queue了
服務進程負責啓動Queue,把Queue註冊到網絡上,然後往Queue裏面寫入任務,代碼如下:
#task_master.py
#coding=utf-8
#多進程分佈式例子
#服務器端
from multiprocessing.managers import BaseManager
from multiprocessing import freeze_support #server啓動報錯,提示需要引用此包
import random,time,queue
#發送任務的隊列
task_queue = queue.Queue()
#接收結果的隊列
result_queue = queue.Queue()
#從BaseManager繼承的QueueManager
class QueueManager(BaseManager):
pass
#win7 64 貌似不支持callable下調用匿名函數lambda,這裏封裝一下
def return_task_queue():
global task_queue
return task_queue
def return_result_queue():
global result_queue
return result_queue
def test():
#把兩個Queue註冊到網絡上,callable參數關聯了Queue對象
#QueueManager.register('get_task_queue',callable=lambda:task_queue)
#QueueManager.register('get_result_queue',callable=lambda:result_queue)
QueueManager.register('get_task_queue',callable=return_task_queue)
QueueManager.register('get_result_queue',callable=return_result_queue)
#綁定端口5000,設置驗證碼‘abc’
manager = QueueManager(address=('127.0.0.1',5000),authkey=b'abc')#這裏必須加上本地默認ip地址127.0.0.1
#啓動Queue
manager.start()
#server = manager.get_server()
#server.serve_forever()
print('start server master')
#獲得通過網絡訪問的Queue對象
task = manager.get_task_queue()
result = manager.get_result_queue()
#放幾個任務進去
for i in range(10):
n = random.randint(0,10000)
print('put task %d...' % n)
task.put(n)
#從result隊列讀取結果
print('try get results...')
for i in range(10):
r = result.get(timeout=10)
print('result:%s' % r)
#關閉
manager.shutdown()
print('master exit')
if __name__ == '__main__':
freeze_support()
test()
運行截圖如下:
在分佈式多進程環境下,添加任務到Queue不可以直接對原始的task_queue進行操作,那樣就繞過了QueueManager的封裝,必須通過manager.get_task_queue()獲得的Queue接口添加。
任務進程,代碼如下:
#task_worker.py
#coding=utf-8
#多進程分佈式例子
#非服務端:worker
import time,sys,queue
from multiprocessing.managers import BaseManager
#創建類似的QueueManager
class QueueManager(BaseManager):
pass
#由於這個QueueManager只從網絡上獲取Queue,所以註冊時只提供名字即可
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')
#連接到服務器,也就是運行task_master.py的機器
server_addr = '127.0.0.1'
print('connect to server %s...'% server_addr)
#端口和驗證碼注意要保持完全一致
m = QueueManager(address=(server_addr,5000),authkey=b'abc')
#從網絡連接
m.connect()
#獲取Queue的對象
task = m.get_task_queue()
result = m.get_result_queue()
#從task隊列獲取任務,並把結果寫入result隊列
for i in range(10):
try:
n = task.get(timeout=1)
print('run task %d * %d...'% (n,n))
r = '%d * %d = %d' % (n,n,n*n)
time.sleep(1)
result.put(r)
except queue.Empty:
print('task queue is empty')
#處理結果
print('worker exit')
運行截圖如下: