Nginx 健康檢查

Nginx 的健康檢查這塊筆者在網上看了很多文章,基本都是零零散散的,講各種實現方式,沒有一篇能完整的講當下的 Nginx 實現健康檢查的幾種方式,應該選哪一種來使用,於是筆者想總結一篇。

一、目前 Nginx 支持兩種主流的健康檢查模式

主動檢查模式

Nginx 服務端會按照設定的間隔時間主動向後端的 upstream_server 發出檢查請求來驗證後端的各個 upstream_server 的狀態。 如果得到某個服務器失敗的返回超過一定次數,比如 3 次就會標記該服務器爲異常,就不會將請求轉發至該服務器。

一般情況下後端服務器需要爲這種健康檢查專門提供一個低消耗的接口。

被動檢查模式

Nginx 在代理請求過程中會自動的監測每個後端服務器對請求的響應狀態,如果某個後端服務器對請求的響應狀態在短時間內累計一定失敗次數時,Nginx 將會標記該服務器異常。就不會轉發流量給該服務器。 不過每間隔一段時間 Nginx 還是會轉發少量的一些請求給該後端服務器來探測它的返回狀態。 以便識別該服務器是否恢復。

後端服務器不需要專門提供健康檢查接口,不過這種方式會造成一些用戶請求的響應失敗,因爲 Nginx 需要用一些少量的請求去試探後端的服務是否恢復正常。

  • 注:如果是採用 Nginx 被動檢查模式,官方原生的 Nginx 就支持,不需要依賴第三方模塊或技術,所以下面的探討都是針對 Nginx 實現主動健康檢查的方法

二、目前使用 Nginx 實現健康檢查的幾種方式

1.使用開源模塊 nginx_upstream_check_module

源碼地址:https://github.com/yaoweibin/nginx_upstream_check_module

這是我目前找到的讓原生 Nginx 通過添加開源模塊,免費實現主動健康檢查的唯一方法。 下面我會詳細介紹這種方式的安裝和配置過程

2.使用商業版 Nginx Plus

https://www.nginx.com/products/nginx/

這種方法需要收費,可獲得技術支持

3.使用淘寶開源的 Tengine 代替 Nginx

http://tengine.taobao.org

這種方式也免費,可行。

三、這裏我們演示第一種方法的實現,使用開源模塊 nginx_upstream_check_module

首先去下載該模塊的源碼包,放到要編譯 Nginx 的服務器上;

操作系統環境:Centos6.8 ,這裏默認已經安裝好了編譯所需的開發環境

1.安裝編譯 Nginx 所需的軟件包
yum install pcre pcre-devel openssl openssl-devel -y
2.選擇 Nginx 版本,編譯安裝(編譯前記得給 Nginx 打對應補丁)
  • 這裏要認真看下,很關鍵:

這裏 Nginx 選擇:nginx-1.14.0.tar.gz ,nginx_upstream_check_module 源碼就下載最新的主線代碼包:nginx_upstream_check_module-master.zip 但是編譯前補丁要選對應 Nginx 版本的。 比如這裏 nginx-1.14.0 補丁要選擇 check_1.14.0+.patch ; 補丁文件就在 nginx_upstream_check_module 源碼包裏面。

#!/bin/bash

tar xf nginx-1.14.0.tar.gz 
unzip nginx_upstream_check_module-master.zip

cd nginx-1.14.0

# 打補丁,注意編譯前一定要有打補丁這步,不然添加的模塊編譯不生效
patch -p1 < /root/nginx_upstream_check_module-master/check_1.14.0+.patch

./configure --user=www --group=www --prefix=/alidata/server/nginx --with-http_stub_status_module --with-http_ssl_module --with-http_gzip_static_module --add-module=/root/nginx_upstream_check_module-master

make && make install
3.配置和應用
# nginx.conf

user  www www;
worker_processes  4;

worker_rlimit_nofile 65535;

events
{ 
  use epoll;
  worker_connections 65535;
}

http {

# 指定一個 upstream 負載均衡組,名稱爲 evalue
    upstream evalue {
    # 定義組內的節點服務,如果不加 weight 參數,默認就是 Round Robin ,加上了 weight 參數就是加權輪詢
            server 192.168.90.100:9999 weight=100;
            server 192.168.90.101:9999 weight=100;
    # interval=3000 檢查間隔 3 秒 , rise=3 連續成功3次認爲服務健康 , fall=5 連續失敗5次認爲服務不健康 , timeout=3000 健康檢查的超時時間爲 3 秒 , type=http  檢查類型 http
            check interval=3000 rise=3 fall=5 timeout=3000 type=http;
    # check_http_send 設定檢查的行爲:請求類型 url 請求協議 -> HEAD /api/v1/chivox/health HTTP/1.0         
            check_http_send "HEAD /api/v1/chivox/health HTTP/1.0\r\n\r\n";
    # 設定認爲返回正常的響應狀態       
            check_http_expect_alive http_2xx http_3xx;
            #check_http_send "GET /test3.html HTTP/2.0\r\n\r\n";
    }

}

server {
        listen     80;

        location / {
                proxy_pass http://evalue;
                keepalive_timeout 0;
        }

# 配置健康檢查的狀態監控頁
# check_status [html|csv|json]
# 也可以在請求監控頁的時候帶上參數以輸出不同的格式,/status?format=html | /status?format=csv | /status?format=json

        location /status {
                check_status html;
                access_log off;
        }

        location ~ /.svn/ {
        deny all;
        }
        access_log /alidata/log/nginx/access/evalue.log json;
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章