聊聊Python用rpc實現分佈式系統調用的那些事

聊聊Python用rpc實現分佈式系統調用的那些事

2014-07-22 10:42 rfyiamcool 51CTO 字號:T | T
一鍵收藏,隨時查看,分享好友!

對於rpc的應用,更加的傾向於基本資源的獲取和調用,畢竟單純的用socket或者是mq,你在程序裏面還要做一個解析過來的數據,然後根據過來的數據在做調用。

AD:2014WOT全球軟件技術峯會北京站 課程視頻發佈

通俗的講rpc是什麼?

rpc 一般俗稱,遠程過程調用,把本地的函數,放到遠端去調用。

通常我們調用一個方法,譬如: sumadd(10, 20),sumadd方法的具體實現要麼是用戶自己定義,要麼存在於該語言的庫函數中,也就說在sumadd方法的代碼實現在本地,它是一個本地調用!

“遠程調用”意思就是:被調用方法的具體實現不在程序運行本地,而是在別的某個地方(分佈到各個服務器),但是用起來像是在本地。

rpc遠程調用原理 :

比如 A調用B提供的remoteAdd方法:

首先A與B之間建立一個TCP連接;

然後A把需要調用的方法名(這裏是remoteAdd)以及方法參數(10, 20)序列化成字節流發送出去;

B接受A發送過來的字節流,然後反序列化得到目標方法名,方法參數,接着執行相應的方法調用(可能是localAdd)並把結果30返回;

A接受遠程調用結果,然後do()。

RPC框架也就是把上線說的具體的細節封裝起來,給用戶好用的API使用(提示:有些遠程調用選擇比較底層的socket協議,有些遠程調用選擇比較上層的HTTP協議);

一般rpc配合http協議的多點,也就是走http的多。 當然還是看應用,我曾經一共的rpc框架是基於zeromq的zerorpc。速度是挺快,server和client都有python的gevent支持,速度沒道理慢。(有興趣的,可以看看有關zerorpc的文章 http://rfyiamcool.blog.51cto.com/1030776/1254000 )最少要比python本身的xml-rpc要快。 rpc over http(基於http的rpc)有兩種協議,一種是xml-rpc ,還有一個是 json-rpc。

XML-RPC:XML Remote Procedure Call,即XML遠程方法調用,利用http+xml封裝進行RPC調用。基於http協議傳輸、XML作爲信息編碼格式。一個xml-rpc消息就是一個請求體爲xml的http-post請求,服務端執行後也以xml格式編碼返回。這個標準面前已經演變爲下面的SOAP協議。可以理解SOAP是XML-RPC的高級版本。

JSON-RPC:JSON Remote Procedure Call,即JSON遠程方法調用 。類似於XML-RPC,不同之處是使用JSON作爲信息交換格式

下面是一個例子,很簡單。我們是用python的rpc庫SimpleXMLRPCServer 做的測試,創建rpc server,然後註冊一些函數,供應別的客戶端去調用。

  1. from SimpleXMLRPCServer import SimpleXMLRPCServer   
  2. 原文:xiaorui.cc   
  3. def add(x,y):   
  4.     return x+y   
  5.     
  6. def subtract(x, y):   
  7.     return x-y   
  8.     
  9. def multiply(x, y):   
  10.     return x*y   
  11.     
  12. def divide(x, y):   
  13.     return x/y  
  14.     
  15. # A simple server with simple arithmetic functions   
  16. server = SimpleXMLRPCServer(("localhost"8000))   
  17. print "Listening on port 8000..." 
  18. server.register_multicall_functions()   
  19. server.register_function(add, 'add')   
  20. server.register_function(subtract, 'subtract')   
  21. server.register_function(multiply, 'multiply')   
  22. server.register_function(divide, 'divide')   
  23. server.serve_forever() 
  1. import xmlrpclib   
  2.     
  3. proxy = xmlrpclib.ServerProxy("http://localhost:8000/")   
  4. multicall = xmlrpclib.MultiCall(proxy)   
  5. multicall.add(7,3)   
  6. multicall.subtract(7,3)   
  7. multicall.multiply(7,3)   
  8. multicall.divide(7,3)   
  9. result = multicall()   
  10.     
  11. print "7+3=%d, 7-3=%d, 7*3=%d, 7/3=%d" % tuple(result) 

rpc本來是單任務的,如果任務相對頻繁,可以設置成多線程的默認,你不用在調用threading模塊什麼的,直接引用 。

  1. class AsyncXMLRPCServer(SocketServer.ThreadingMixIn,SimpleXMLRPCServer): pass 

然後rpc初始化的方法換成。

  1. server = AsyncXMLRPCServer((''1111), SimpleXMLRPCRequestHandler) 

這裏再說下,和xmlrpc相似的jsonrpc,貌似現在用xmlrpc的,要比jsonrpc的多點。 有時候到國外的it論壇看帖子,xmlrpc用的交多點。其實現在較大的公司,一般乾脆直接自己實現了rpc框架,像淘寶Dubbo(朋友有搞過,搞了半天,沒有對接成接口,說是有難度,不明覺厲!),百度的xxx(忘名字了)。

  1. import jsonrpc   
  2. server = jsonrpc.Server(jsonrpc.JsonRpc20(), jsonrpc.TransportTcpIp(addr=("127.0.0.1"31415), logfunc=jsonrpc.log_file("myrpc.log")))   
  3. #原文:xiaorui.cc   
  4. # 註冊一個函數方法   
  5. def echo(s):   
  6.     return s   
  7.     
  8. def search(number=None, last_name=None, first_name=None):   
  9.     sql_where = []   
  10.     sql_vars  = []   
  11.     if number is not None:   
  12.         sql_where.append("number=%s")   
  13.         sql_vars.append(number)   
  14.     if last_name is not None:   
  15.         sql_where.append("last_name=%s")   
  16.         sql_vars.append(last_name)   
  17.     if first_name is not None:   
  18.         sql_where.append("first_name=%s")   
  19.         sql_vars.append(first_name)   
  20.     sql_query = "SELECT id, last_name, first_name, number FROM mytable" 
  21.     if sql_where:   
  22.         sql_query += " WHERE" + " AND ".join(sql_where)   
  23.     cursor = ...   
  24.     cursor.execute(sql_query, *sql_vars)   
  25.     return cursor.fetchall()   
  26.     
  27. server.register_function( echo )   
  28. server.register_function( search )   
  29.     
  30. # start server   
  31. server.serve() 
  1. # 創建jsonrpc客戶端   
  2. import jsonrpc   
  3. server = jsonrpc.ServerProxy(jsonrpc.JsonRpc20(), jsonrpc.TransportTcpIp(addr=("127.0.0.1"31415)))   
  4.     
  5. #調用遠端的一個函數   
  6. result = server.echo("hello world")   
  7.     
  8. found = server.search(last_name='Python')  

我做過一些個壓力的測試,XMLRPCSERVER的開了async之後,每個連接特意堵塞5秒,他的併發在40個左右 。也就是每秒成功40個左右,剩下的還是在堵塞等待中。 其實他的瓶頸不是在於rpc的本身,是承載rpc的那個basehttpserver,太弱爆了。

wKiom1PIg-qhOXPZAAH7nZDKUJM508.jpg
 

接收請求,調用方法 !

wKioL1PIilzjVjTxAAX07GYu-No166.jpg
 

現在開源社區這麼發達,有不少人都根據rpc的協議,重寫了承載rpc的web服務。  比如用flask,tornado,配合uwsgi,你猜咋招了。。。。如果不堵塞連接,那還可以,如果堵塞連接,uwsgi的廢材特色就顯出來了,以前有文章說過,uwsgi是prework,他會預先啓動進程,官方都推薦要根據你的cpu核數或者超線程來開啓進程,如果開的太多,你會發現,uwsgi他是駕馭不了那麼多進程的。還是看我大tornado,用了@gen.engine之後。輕易飆到500的併發連接。 

(以上是我的喫飽又蛋疼測試,沒聽過誰會重複調用那麼多的堵塞方法,自評 sx行爲) 

不多說了,看flask實現xmlrpc服務端的代碼,看了下flask xmlrpc的源碼,實現的不難。

  1. from flask import Flask   
  2. from flaskext.xmlrpc import XMLRPCHandler, Fault   
  3.     
  4. app = Flask(__name__)   
  5.     
  6. handler = XMLRPCHandler('api')   
  7. handler.connect(app, '/api' 
  8.     
  9. @handler.register   
  10. def woca(name="world"):   
  11.     if not name:   
  12.         raise Fault("fuck...fuck""fuck shencan!")   
  13.     return "Hello, %s!" % name   
  14. 原文:xiaorui.cc   
  15. app.run() 

對於每個連接的超時,有多種的方法,如果你用的是flask,tornado做web server,那就寫個裝飾器single起來,只是性能不好。 或者是前面掛一個nginx,然後做個client_header_timeout,client_body_timeout,proxy_connect_timeout(你懂的。),如果用的python自帶的xml-rpc的話,需要引入socket。

  1. import socket   
  2. socket.setdefaulttimeout() 

再說下rpc安全的問題。

至於安全方面,有興趣就開個ssl,或者是在程序裏面判斷下client ip,反正配置都是統一下發的,你重載daemon的時候,也就知道該判斷什麼ip了。

我個人對於rpc的應用,更加的傾向於基本資源的獲取和調用,畢竟單純的用socket或者是mq,你在程序裏面還要做一個解析過來的數據,然後根據過來的數據在做調用。 (alert: 我想觸發 add() ,如果是rpc的話,我不用管,只是傳過去就行了,到那時mq和socket就需要eval調用函數了),一些複雜的應用還是喜歡用面向資源的rest,也推薦大家用這個,靠譜的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章