python以epoll方式實現HTTP服務器，瀏覽器通過HTTP與之通信6

實際開發中，由於各種原因，我們一般不會用前面演示幾種方式實現多併發的web服務器,而是使用一個種更加高效的方式：epoll方式。比如nginx服務器的實現就是基於epoll方式，同樣實現了非阻塞，“併發”。

1.什麼是epoll?

Epoll可是當前在Linux下開發大規模併發網絡程序的熱門人選，Epoll 在Linux2.6內核中正式引入，和select相似，其實都I/O多路複用技術而已，並沒有什麼神祕的。

python中通過select模塊中的epoll對象實現此功能。select.epoll的好處就在於單個process就可以同時處理多個網絡連接的IO。它的基本原理就是select，poll，epoll這個function會不斷的輪詢所負責的所有socket，當某個socket有數據到達了，就通知用戶進程。

2.I/O 多路複用的特點

通過一種機制使一個進程能同時等待多個文件描述符(linux中一切皆文件，包扣鼠標鍵盤，存儲操作通過文件描述符進行區分)，而這些文件描述符（套接字描述符）其中的任意一個進入讀就緒狀態，epoll()函數就可以返回。所以, IO多路複用，本質上不會有併發的功能，因爲任何時候還是隻有一個進程或線程進行工作，它之所以能提高效率是因爲select\epoll 把進來的socket放到他們的 '監視' 列表裏面，當任何socket有可讀可寫數據立馬處理，那如果select\epoll 手裏同時檢測着很多socket，一有動靜馬上返回給進程處理，總比一個一個socket過來,阻塞等待,處理高效率。

當然也可以多線程/多進程方式，一個連接過來開一個進程/線程處理，這樣消耗的內存和進程切換頁會耗掉更多的系統資源。所以我們可以結合IO多路複用和多進程/多線程來高性能併發，IO複用負責提高接受socket的通知效率，收到請求後，交給進程池/線程池來處理邏輯。

3.epoll模型

關於epoll模式與使用，只需要瞭解其原理即可，實際開發中很少直接讓你幹一個epoll模型服務器。

import socket
import select

# 創建套接字
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 設置可以重複使用綁定的信息
s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR,1)

# 綁定本機信息
s.bind(("",7788))

# 變爲被動
s.listen(10)

# 創建一個epoll對象
epoll = select.epoll()

# 測試，用來打印套接字對應的文件描述符
# print(s.fileno())
# print(select.EPOLLIN|select.EPOLLET)

# 註冊事件到epoll中
# epoll.register(fd[, eventmask])
# 注意，如果fd已經註冊過，則會發生異常
# 將創建的套接字添加到epoll的事件監聽中
epoll.register(s.fileno(), select.EPOLLIN|select.EPOLLET)

connections = {}
addresses = {}

# 循環等待客戶端的到來或者對方發送數據
while True:

    # epoll 進行 fd 掃描的地方 -- 未指定超時時間則爲阻塞等待
    epoll_list = epoll.poll()

    # 對事件進行判斷
    for fd, events in epoll_list:

        # print fd
        # print events

        # 如果是socket創建的套接字被激活
        if fd == s.fileno():
            new_socket, new_addr = s.accept()

            print('有新的客戶端到來%s' % str(new_addr))

            # 將 conn 和 addr 信息分別保存起來
            connections[new_socket.fileno()] = new_socket
            addresses[new_socket.fileno()] = new_addr

            # 向 epoll 中註冊 新socket 的 可讀 事件
            epoll.register(new_socket.fileno(), select.EPOLLIN|select.EPOLLET)

        # 如果是客戶端發送數據
        elif events == select.EPOLLIN:
            # 從激活 fd 上接收
            recvData = connections[fd].recv(1024).decode("utf-8")

            if recvData:
                print('recv:%s' % recvData)
            else:
                # 從 epoll 中移除該 連接 fd
                epoll.unregister(fd)

                # server 側主動關閉該 連接 fd
                connections[fd].close()
                print("%s---offline---" % str(addresses[fd]))
                del connections[fd]
                del addresses[fd]

尖叫提示：

EPOLLIN （可讀）
EPOLLOUT （可寫）
EPOLLET （ET模式）

epoll效果高原因：
1.特殊共享內存，應有程序和Kernel共享的
2.以事件通知的方式而不是輪尋的方式進行監聽。

epoll對文件描述符的操作有兩種模式：LT（level trigger）和ET（edge trigger）。LT模式是默認模式，LT模式與ET模式的區別如下：LT模式：當epoll檢測到描述符事件發生並將此事件通知應用程序，應用程序可以不立即處理該事件。下次調用epoll時，會再次響應應用程序並通知此事件。

ET模式：當epoll檢測到描述符事件發生並將此事件通知應用程序，應用程序必須立即處理該事件。如果不處理，下次調用epoll時，不會再次響應應用程序並通知此事件。

4.python以epoll方式實現前面HTTP服務器通信

import socket
import time
import sys
import re
import select


class WSGIServer(object):
    """定義一個WSGI服務器的類"""

    def __init__(self, port, documents_root):

        # 1. 創建套接字
        self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        # 2. 綁定本地信息
        self.server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
        self.server_socket.bind(("", port))
        # 3. 變爲監聽套接字
        self.server_socket.listen(128)

        self.documents_root = documents_root

        # 創建epoll對象
        self.epoll = select.epoll()
        # 將tcp服務器套接字加入到epoll中進行監聽
        self.epoll.register(self.server_socket.fileno(), select.EPOLLIN|select.EPOLLET)

        # 創建添加的fd對應的套接字
        self.fd_socket = dict()

    def run_forever(self):
        """運行服務器"""

        # 等待對方鏈接
        while True:
            # epoll 進行 fd 掃描的地方 -- 未指定超時時間則爲阻塞等待
            epoll_list = self.epoll.poll()

            # 對事件進行判斷
            for fd, event in epoll_list:
                # 如果是服務器套接字可以收數據，那麼意味着可以進行accept
                if fd == self.server_socket.fileno():
                    new_socket, new_addr = self.server_socket.accept()
                    # 向 epoll 中註冊 連接 socket 的 可讀 事件
                    self.epoll.register(new_socket.fileno(), select.EPOLLIN | select.EPOLLET)
                    # 記錄這個信息
                    self.fd_socket[new_socket.fileno()] = new_socket
                # 接收到數據
                elif event == select.EPOLLIN:
                    request = self.fd_socket[fd].recv(1024).decode("utf-8")
                    if request:
                        self.deal_with_request(request, self.fd_socket[fd])
                    else:
                        # 在epoll中註銷客戶端的信息
                        self.epoll.unregister(fd)
                        # 關閉客戶端的文件句柄
                        self.fd_socket[fd].close()
                        # 在字典中刪除與已關閉客戶端相關的信息
                        del self.fd_socket[fd]

    def deal_with_request(self, request, client_socket):
        """爲這個瀏覽器服務器"""

        if not request:
            return

        request_lines = request.splitlines()
        for i, line in enumerate(request_lines):
            print(i, line)

        # 提取請求的文件(index.html)
        # GET /a/b/c/d/e/index.html HTTP/1.1
        ret = re.match(r"([^/]*)([^ ]+)", request_lines[0])
        if ret:
            print("正則提取數據:", ret.group(1))
            print("正則提取數據:", ret.group(2))
            file_name = ret.group(2)
            if file_name == "/":
                file_name = "/index.html"


        # 讀取文件數據
        try:
            f = open(self.documents_root+file_name, "rb")
        except:
            response_body = "file not found, 請輸入正確的url"

            response_header = "HTTP/1.1 404 not found\r\n"
            response_header += "Content-Type: text/html; charset=utf-8\r\n"
            response_header += "Content-Length: %d\r\n" % len(response_body)
            response_header += "\r\n"

            # 將header返回給瀏覽器
            client_socket.send(response_header.encode('utf-8'))

            # 將body返回給瀏覽器
            client_socket.send(response_body.encode("utf-8"))
        else:
            content = f.read()
            f.close()

            response_body = content

            response_header = "HTTP/1.1 200 OK\r\n"
            response_header += "Content-Length: %d\r\n" % len(response_body)
            response_header += "\r\n"

            # 將數據返回給瀏覽器
            client_socket.send(response_header.encode("utf-8")+response_body)


# 設置服務器服務靜態資源時的路徑
DOCUMENTS_ROOT = "./html"


def main():
    """控制web服務器整體"""
    # python3 xxxx.py 7890
    if len(sys.argv) == 2:
        port = sys.argv[1]
        if port.isdigit():
            port = int(port)
    else:
        print("運行方式如: python3 xxx.py 7890")
        return

    print("http服務器使用的port:%s" % port)
    http_server = WSGIServer(port, DOCUMENTS_ROOT)
    http_server.run_forever()


if __name__ == "__main__":
    main()

尖叫提示：

當然上面案例改進了tcp通信以長鏈接的方式進行的。TCP在真正的讀寫操作之前，server與client之間必須建立一個連接，當讀寫操作完成後，雙方不再需要這個連接時它們可以釋放這個連接，連接的建立通過三次握手，釋放則需要四次揮手，所以說每個連接的建立都是需要資源消耗和時間消耗的。

所謂tcp長鏈接實際操作流程如下：

client 向 server 發起連接
server 接到請求，雙方建立連接
client 向 server 發送消息
server 迴應 client
一次讀寫完成，連接不關閉
後續讀寫操作...
長時間操作之後client發起關閉請求

這裏使用了在header中添加Content-Length屬性，告訴服務器某次請求是否完成，然後服務器在確認該次請求結束後，纔會響應新的請求，否則會一直卡在哪兒。

統一聲明：關於原創博客內容，可能會有部分內容參考自互聯網，如有原創鏈接會聲明引用；如找不到原創鏈接，在此聲明如有侵權請聯繫刪除哈。關於轉載博客，如有原創鏈接會聲明；如找不到原創鏈接，在此聲明如有侵權請聯繫刪除哈

參考文檔1：https://blog.csdn.net/sparkliang/article/details/4770655

python以epoll方式實現HTTP服務器，瀏覽器通過HTTP與之通信6

1.什麼是epoll?

2.I/O 多路複用的特點

3.epoll模型

4.python以epoll方式實現前面HTTP服務器通信

尖叫提示：

10分鐘搞定Mysql主從部署配置

如何使用 JS 判斷用戶是否處於活躍狀態

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

lightdb數據庫超時相關控制參數

lightdb秒級增加列和刪除列（not null帶默認值）

Java ThreadPoolShutdown

Hive內嵌集合函數：size,map_keys,map_values,array_contains,sort_array等詳解

Hive內嵌字符處理函數：regexp_extract,regexp_replace,split，replace，translate

Hive內嵌表生成函數UDTF:explode,posexplode,json_tuple,parse_url_tuple,stack

Hive內嵌字符處理函數：get_json_object，parse_url

真正讓你明白Hive調優系列3：笛卡爾乘積,小表join大表，Mapjoin等問題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結