微服務的斷路器實現圖解Golang通用實現

斷路器背景

微服務連鎖故障場景

微服務的斷路器實現圖解Golang通用實現
在分佈式環境中,各個微服務相互調用,當某些情況下,比如後端中間件服務故障、第三方服務中斷導致某個服務無限期不可用,短時間無法恢復,則可能會導致連鎖故障,最終影響壓垮整個業務集羣

斷路器與重試

斷路器模式不同於重試模式,重試模式是使應用程序可以重試操作以期望它會成功,而斷路器模式是防止應用程序執行一個可能失敗的操作,減少執行可能失敗操作的CPU、內存、線程等資源的浪費,從而保證服務的整體可用

<!--more-->

斷路器設計解析

基於代理模式的斷路器

微服務的斷路器實現圖解Golang通用實現
斷路器相當於一個請求操作執行的代理,託管請求操作的執行

實現原理流程:

  1. 攔截服務執行的請求,通過當前狀態決定是否直接返回,如果否則執行後續操作
  2. 嘗試執行操作,並獲取返回結果
  3. 根據返回結果和當前統計信息,決定當前斷路器的狀態,修改狀態
  4. 返回執行結果

斷路器狀態機

微服務的斷路器實現圖解Golang通用實現
斷路器狀態機實現上有三種狀態:Closed(斷路器關閉)、Open(開放)、HalfOpen(半開放)

狀態 說明 備註
Closed 關閉 斷路器關閉正常執行操作
Open 打開 斷路器開放,所有請求直接返回錯誤,不執行任何請求
HalfOpen 半開放 允許有限數量的請求通過,如果執行成功,恢復到關閉狀態,如果仍然失敗,則恢復到開放,然後重新啓動超時定時器

#斷路器實現

實現原理圖解

微服務的斷路器實現圖解Golang通用實現
斷路器實現實現主要分爲三部分:狀態統計、狀態轉移、請求執行

狀態統計:統計已經執行的請求的成功失敗的數量,以確定是否需要進行狀態轉移
狀態轉移:根據當前統計信息和當前狀態來進行目標狀態的確定及轉移操作
請求執行:代理前端任務的執行,如果當前狀態不需要進行嘗試執行,就直接返回錯誤,避免資源浪費

Golang裏面已經有開源的實現,https://github.com/sony/gobreaker/blob/, 接下來救市剖析它的實現

狀態統計-計數器Counts

Counts就是一個計數器,記錄當前請求成功和失敗的數量

type Counts struct {
    Requests             uint32    // 請求數
    TotalSuccesses       uint32    // 成功
    TotalFailures        uint32    // 失敗
    ConsecutiveSuccesses uint32    // 連續成功
    ConsecutiveFailures  uint32 // 連續失敗
}

計數器完成對應請求狀態的次數,爲後續狀態轉移提供數據, Counts提供了onRequest、onSuccess、onFailure、clear幾個輔助接口用於實現對應請求狀態的操作,感興趣可以看下

狀態機- CircuitBreaker

type CircuitBreaker struct {
    name          string
        // maxRequests限制half-open狀態下最大的請求數,避免海量請求將在恢復過程中的服務再次失敗
    maxRequests   uint32
     // interval用於在closed狀態下,斷路器多久清除一次Counts信息,如果設置爲0則在closed狀態下不會清除Counts
    interval      time.Duration
        // timeout進入open狀態下,多長時間切換到half-open狀態,默認60s
    timeout       time.Duration
        // readyToTrip熔斷條件,當執行失敗後,會根據readyToTrip決定是否進入Open狀態
    readyToTrip   func(counts Counts) bool
        // onStateChange斷路器狀態變更回調函數
    onStateChange func(name string, from State, to State)

    mutex      sync.Mutex
        //. state 斷路器狀態
    state      State
        // generation 是一個遞增值,相當於當前斷路器狀態切換的次數, 爲了避免狀態切換後,未完成請求對新狀態的統計的影響,如果發現一個請求的generation同當前的generation不同,則不會進行統計計數
    generation uint64
        //  Counts 統計
    counts     Counts
        // expiry 超時過期用於open狀態到half-open狀態的切換,當超時後,會從open狀態切換到half-open狀態
    expiry     time.Time
}

核心流程

CircuitBreaker.Execute

請求執行,對外開放的請求執行接口

func (cb *CircuitBreaker) Execute(req func() (interface{}, error)) (interface{}, error) {
        // 執行請求鉤子,會根據當前狀態,來返回當前的generation和err(如果位於open和half-open則不爲nil), 通過err來進行判斷是否直接返回
    generation, err := cb.beforeRequest()
    if err != nil {
        return nil, err
    }

        // 捕獲panic,避免應用函數錯誤造成斷路器panic
    defer func() {
        e := recover()
        if e != nil {
            cb.afterRequest(generation, false)
            panic(e)
        }
    }()

    // 執行請求
    result, err := req()
        // 根據結果來進行對應狀態的統計, 同時傳遞generation
    cb.afterRequest(generation, err == nil)
    return result, err
}

CircuitBreaker.beforeRequest

func (cb *CircuitBreaker) beforeRequest() (uint64, error) {
    cb.mutex.Lock()
    defer cb.mutex.Unlock()

        // 獲取當前的狀態
    now := time.Now()
    state, generation := cb.currentState(now)

    // open和half-open狀態則直接返回
    if state == StateOpen {
        return generation, ErrOpenState
    } else if state == StateHalfOpen && cb.counts.Requests >= cb.maxRequests {
            // 避免海量請求對處於恢復服務的影響,這裏有一個限流的操作,避免請求數超過最大請求數
        return generation, ErrTooManyRequests
    }
        // 統計狀態
    cb.counts.onRequest()
    return generation, nil
}

CircuitBreaker.afterRequest

func (cb *CircuitBreaker) afterRequest(before uint64, success bool) {
    cb.mutex.Lock()
    defer cb.mutex.Unlock()

    // 重新獲取狀態
    now := time.Now()
    state, generation := cb.currentState(now)
        // 如果前後狀態不一致,則不計數
    if generation != before {
        return
    }

        // 根據狀態計數
    if success {
        cb.onSuccess(state, now)
    } else {
        cb.onFailure(state, now)
    }
}

CircuitBreaker.currentState

func (cb *CircuitBreaker) currentState(now time.Time) (State, uint64) {
    switch cb.state {
    case StateClosed:
                // 如果當前當前是closed狀態,並且有設置expiry,則遞增Generation到新一輪統計計數
        if !cb.expiry.IsZero() && cb.expiry.Before(now) {
            cb.toNewGeneration(now)
        }
    case StateOpen:
                // 如果是Open狀態,並且超時,則嘗試到半打開狀態
        if cb.expiry.Before(now) {
            cb.setState(StateHalfOpen, now)
        }
    }
    return cb.state, cb.generation
}

CircuitBreaker.toNewgeneration


func (cb *CircuitBreaker) toNewGeneration(now time.Time) {
        // 遞增generation, 清除狀態
    cb.generation++
    cb.counts.clear()

        // 設置超時時間
    var zero time.Time
    switch cb.state {
    case StateClosed:
        if cb.interval == 0 {
            cb.expiry = zero
        } else {
            cb.expiry = now.Add(cb.interval)
        }
    case StateOpen:
        cb.expiry = now.Add(cb.timeout)
    default: // StateHalfOpen
        cb.expiry = zero
    }
}

總結

斷路器黃金鍊路

微服務的斷路器實現圖解Golang通用實現

  • beforeRequest :完成當前請求是否可以執行請求,狀態超時切換,同時返回當前的genenration
  • req: 執行請求
  • afterRequest: 完成請求狀態統計,決定狀態切換

斷路器的優缺點

斷路器比較適合針對遠程服務或者第三方服務的調用,如果該操作極有可能會失敗,則斷路器可以儘可能的減小失敗對應用的影響,避免資源浪費

但缺點也顯而易見,斷路器本身相當於一層代理,在應用程序執行進行統計和控制,本身就有一定的資源消耗,同時內部基於synx.Mutex鎖來實現,高併發下肯定會有鎖爭用問題,可能需要根據業務來使用多個斷路器,來分散這種鎖爭用,同時應該避免在斷路器req函數內,去執行重試和過長時間的超時等待,因爲斷路器核心是快速失敗

更多文章可以訪問http://www.sreguide.com/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章