Netflix全球CDN運維之道

在最近的Strange Loop大會上,Netflix工程經理、OpenConnect工具團隊負責人Robert Fernandes就Netflix內部的OpenConnect內容交付網絡運營事宜發表了演講

這個演講對Netflix轉向使用內部CDN Open Connect以及這次轉變給運營團隊帶來的挑戰進行了總結。Open Connect團隊負責處理與向訂閱者交付內容相關的事宜,包括技術運營、庫存管理和合作伙伴管理。他們強烈感覺到需要自動化這些活動,但不同的團隊各自構建了獨立的應用程序,這給部署帶來了新的挑戰。Fernandes談到了他們計劃如何應對這些挑戰。

Netflix的大多數服務都運行在AWS上。Netflix在2007年開始提供流媒體服務,到2009年已經建立了一個叫作Netflix Content Control Plane (NCCP)的內部控制中心。NCCP將最終用戶引導到正確的邊緣(CDN位置),而實際的內容交付是由第三方提供商完成的,如Akamai、Level 3 Communications和Limelight Networks。該團隊於2011年遷移到內部CDN,並將其稱爲Open Connect,隨之而來的是基礎設施管理工作。

Netflix應用程序客戶端(移動、桌面等)在請求視頻時通常會接收到3個域名。OpenConnect嚮應用程序提供內容和靜態資源,比如JavaScript。CDN由定製服務器Open Connect Appliance (OCA)組成,它們都是緩存服務器。它們運行在裝有nginx的FreeBSD版本上。總共有兩種緩存服務器,一種是相對較慢的HDD,用於批量存儲目錄,一種是基於閃存的服務器,配備了固態硬盤,具備相對較高的吞吐量,主要用於服務熱點內容。Netflix的內容服務器使用了10000多個設備,部署在全球1000多個站點中。一些站點由ISP負責管理服務器,一些站點則由Netflix直接控制和管理硬件。

Open Connect團隊的職能被分爲開發、運營、網絡管理和非技術職能(如合作伙伴管理和交付)。各個團隊都從解決自己領域的問題開始,最後得到的是單體應用,Open Connect Tools團隊就是爲了緩解這種局面而成立的。它負責警報、監控、配置管理、部署自動化、庫存管理、日誌和指標,以及合作伙伴自助服務。負責控制平面的團隊更關注CDN的內容佈局、地理佈局、路由和安全性。演講並沒有深入探討應用程序或自動化技術細節。他們未來的計劃是使用進一步“分層方法”處理微服務,並提出可以在團隊之間共享的公共解決方案。

原文鏈接

Managing Global CDN Operations at Netflix

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章