徹底弄懂HTTP緩存機制及原理（轉）

前言

Http 緩存機制作爲 web 性能優化的重要手段，對於從事 Web 開發的同學們來說，應該是知識體系庫中的一個基礎環節，同時對於有志成爲前端架構師的同學來說是必備的知識技能。
但是對於很多前端同學來說，僅僅只是知道瀏覽器會對請求的靜態文件進行緩存，但是爲什麼被緩存，緩存是怎樣生效的，卻並不是很清楚。
在此，我會嘗試用簡單明瞭的文字，像大家系統的介紹HTTP緩存機制，期望對各位正確的理解前端緩存有所幫助。

在介紹HTTP緩存之前，作爲知識鋪墊，先簡單介紹一下HTTP報文

HTTP報文就是瀏覽器和服務器間通信時發送及響應的數據塊。
瀏覽器向服務器請求數據，發送請求(request)報文；服務器向瀏覽器返回數據，返回響應(response)報文。
報文信息主要分爲兩部分
1.包含屬性的首部(header)--------------------------附加信息（cookie，緩存信息等）與緩存相關的規則信息，均包含在header中
2.包含數據的主體部分(body)-----------------------HTTP請求真正想要傳輸的部分

緩存規則解析

爲方便大家理解，我們認爲瀏覽器存在一個緩存數據庫,用於存儲緩存信息。
在客戶端第一次請求數據時，此時緩存數據庫中沒有對應的緩存數據，需要請求服務器，服務器返回後，將數據存儲至緩存數據庫中。

HTTP緩存有多種規則，根據是否需要重新向服務器發起請求來分類，我將其分爲兩大類(強制緩存，對比緩存)
在詳細介紹這兩種規則之前，先通過時序圖的方式，讓大家對這兩種規則有個簡單瞭解。

已存在緩存數據時，僅基於強制緩存，請求數據的流程如下

已存在緩存數據時，僅基於對比緩存，請求數據的流程如下

對緩存機制不太瞭解的同學可能會問，基於對比緩存的流程下，不管是否使用緩存，都需要向服務器發送請求，那麼還用緩存幹什麼？
這個問題，我們暫且放下，後文在詳細介紹每種緩存規則的時候，會帶給大家答案。

我們可以看到兩類緩存規則的不同，強制緩存如果生效，不需要再和服務器發生交互，而對比緩存不管是否生效，都需要與服務端發生交互。
兩類緩存規則可以同時存在，強制緩存優先級高於對比緩存，也就是說，當執行強制緩存的規則時，如果緩存生效，直接使用緩存，不再執行對比緩存規則。

強制緩存

從上文我們得知，強制緩存，在緩存數據未失效的情況下，可以直接使用緩存數據，那麼瀏覽器是如何判斷緩存數據是否失效呢？
我們知道，在沒有緩存數據的時候，瀏覽器向服務器請求數據時，服務器會將數據和緩存規則一併返回，緩存規則信息包含在響應header中。

對於強制緩存來說，響應header中會有兩個字段來標明失效規則（Expires/Cache-Control）
使用chrome的開發者工具，可以很明顯的看到對於強制緩存生效時，網絡請求的情況

Expires
　　Expires的值爲服務端返回的到期時間，即下一次請求時，請求時間小於服務端返回的到期時間，直接使用緩存數據。
不過Expires 是HTTP 1.0的東西，現在默認瀏覽器均默認使用HTTP 1.1，所以它的作用基本忽略。
另一個問題是，到期時間是由服務端生成的，但是客戶端時間可能跟服務端時間有誤差，這就會導致緩存命中的誤差。
所以HTTP 1.1 的版本，使用Cache-Control替代。

Cache-Control
Cache-Control 是最重要的規則。常見的取值有private、public、no-cache、max-age，no-store，默認爲private。

private:             客戶端可以緩存
public:              客戶端和代理服務器都可緩存（前端的同學，可以認爲public和private是一樣的）
max-age=xxx:   緩存的內容將在 xxx 秒後失效
no-cache:          需要使用對比緩存來驗證緩存數據（後面介紹）
no-store:           所有內容都不會緩存，強制緩存，對比緩存都不會觸發（對於前端開發來說，緩存越多越好，so...基本上和它說886）

圖中Cache-Control僅指定了max-age，所以默認爲private，緩存時間爲31536000秒（365天）
也就是說，在365天內再次請求這條數據，都會直接獲取緩存數據庫中的數據，直接使用。

對比緩存

對比緩存，顧名思義，需要進行比較判斷是否可以使用緩存。
瀏覽器第一次請求數據時，服務器會將緩存標識與數據一起返回給客戶端，客戶端將二者備份至緩存數據庫中。
再次請求數據時，客戶端將備份的緩存標識發送給服務器，服務器根據緩存標識進行判斷，判斷成功後，返回304狀態碼，通知客戶端比較成功，可以使用緩存數據。

第一次訪問：

再次訪問：

通過兩圖的對比，我們可以很清楚的發現，在對比緩存生效時，狀態碼爲304，並且報文大小和請求時間大大減少。
原因是，服務端在進行標識比較後，只返回header部分，通過狀態碼通知客戶端使用緩存，不再需要將報文主體部分返回給客戶端。

對於對比緩存來說，緩存標識的傳遞是我們着重需要理解的，它在請求header和響應header間進行傳遞，
一共分爲兩種標識傳遞，接下來，我們分開介紹。

Last-Modified / If-Modified-Since
Last-Modified：
服務器在響應請求時，告訴瀏覽器資源的最後修改時間。

If-Modified-Since：
再次請求服務器時，通過此字段通知服務器上次請求時，服務器返回的資源最後修改時間。
服務器收到請求後發現有頭If-Modified-Since 則與被請求資源的最後修改時間進行比對。
若資源的最後修改時間大於If-Modified-Since，說明資源又被改動過，則響應整片資源內容，返回狀態碼200；
若資源的最後修改時間小於或等於If-Modified-Since，說明資源無新修改，則響應HTTP 304，告知瀏覽器繼續使用所保存的cache。

Etag / If-None-Match（優先級高於Last-Modified / If-Modified-Since）
Etag：
服務器響應請求時，告訴瀏覽器當前資源在服務器的唯一標識（生成規則由服務器決定）。

If-None-Match：
再次請求服務器時，通過此字段通知服務器客戶段緩存數據的唯一標識。
服務器收到請求後發現有頭If-None-Match 則與被請求資源的唯一標識進行比對，
不同，說明資源又被改動過，則響應整片資源內容，返回狀態碼200；
相同，說明資源無新修改，則響應HTTP 304，告知瀏覽器繼續使用所保存的cache。

總結

對於強制緩存，服務器通知瀏覽器一個緩存時間，在緩存時間內，下次請求，直接用緩存，不在時間內，執行比較緩存策略。
對於比較緩存，將緩存信息中的Etag和Last-Modified通過請求發送給服務器，由服務器校驗，返回304狀態碼時，瀏覽器直接使用緩存。

瀏覽器第一次請求：

瀏覽器再次請求時：

哪些請求不能被緩存？

HTTP信息頭中包含Cache-Control:no-cache，pragma:no-cache，或Cache-Control:max-age=0等告訴瀏覽器不用緩存的請求
需要根據Cookie，認證信息等決定輸入內容的動態請求是不能被緩存的
經過HTTPS安全加密的請求（有人也經過測試發現，ie其實在頭部加入Cache-Control：max-age信息，firefox在頭部加入Cache-Control:Public之後，能夠對HTTPS的資源進行緩存，參考《HTTPS的七個誤解》
)
POST請求無法被緩存
HTTP響應頭中不包含Last-Modified/Etag，也不包含Cache-Control/Expires的請求無法被緩存

說了這麼多，有哪些應用呢

同一個資源保證URL的穩定性
URL 是瀏覽器緩存機制的基礎，所以如果一個資源需要在多個地方被引用，儘量保證 URL 是固定的。同時，比較推薦使用公共類庫，比如 Google Ajax Library 等，有利於最大限度使用緩存
給css、js、圖片等資源增加HTTP緩存頭，並強制入口html不被緩存
對於不經常修改的靜態資源，比如 Css，js，圖片等，可以設置一個較長的過期的時間，或者至少加上 Last-Modified/Etag，而對於 html 頁面這種入口文件，不建議設置緩存。這樣既能保證在靜態資源不變了情況下，可以不重發請求或直接通過 304 避免重複下載，又能保證在資源有更新的，只要通過給資源增加時間戳或者更換路徑，就能讓用戶訪問最新的資源
減少對Cookie的依賴
過多的使用 Cookie 會大大增加 HTTP 請求的負擔，每次 GET 或 POST 請求，都會把 Cookie 都帶上，增加網絡傳輸流量，導致增長交互時間；同時 Cache 是很難被緩存的，應該儘量少使用，或者這在動態頁面上使用。
減少對HTTPS加密協議的使用
通過 HTTPS 請求的資源，默認是不會被緩存的，必須通過特殊的配置，才能讓資源得到緩存。建議只對涉及敏感信息的請求使用 HTTPS 傳輸，其他類似 Css，Js，圖片這些靜態資源，儘量避免使用。
多用Get方式請求動態Cgi
雖然 POST 的請求方式比 Get 更安全，可以避免類似密碼這種敏感信息在網絡傳輸，被代理或其他人截獲，但是 Get 請求方式更快，效率更高，而且能被緩存，建議對於那些不涉及敏感信息提交的請求儘量使用 Get 方式請求
動態CGI也是可以被緩存
如果動態腳本或 CGI 輸入的內容在一定的時間範圍內是固定的，或者根據 GET 參數相同，輸入的內容相同，我們也認爲請求是可以被緩存的，有以下幾種方式，可以達到這個效果：

讓動態腳本定期將內容改變時導出成靜態文件，Web 直接訪問帶有 Last-Modified/Etag 的靜態文件
開發者可以通過代碼給動態腳本的響應頭中添加 Cache-Control: max-age，告訴瀏覽器在過期前可以直接使用副本
通過代碼給動態腳本的響應頭添加 Last-Modified/Etag 信息，瀏覽器再次請求的時候，可以通過解析 If-Modified-Since/If-None-Match 得知瀏覽器是否存在緩存，由代碼邏輯控制是否返回 304

說了這麼多，如何給站點增加緩存機制

HTTP 請求/響應頭中緩存報頭對有效利用站點緩存，作爲一個 Web 前端開發者，我要做什麼呢？答案是：啥都不用做。不過要去推動 Web 運營人員、Web 後端開發人員分別給服務器和動態腳本 CGI 增加合適的緩存報頭。
相關配置服務端添加

徹底弄懂HTTP緩存機制及原理（轉）

前言

在介紹HTTP緩存之前，作爲知識鋪墊，先簡單介紹一下HTTP報文

緩存規則解析

強制緩存

對比緩存

總結

哪些請求不能被緩存？

說了這麼多，有哪些應用呢

說了這麼多，如何給站點增加緩存機制

2020年上半年數據庫系統工程師考試

vue移動端rem適配--附帶引入第三方庫解決方案

JS數組中的方法以及對應的Polyfill

var、let、const詳細區別

JS 運行機制-EventLoop（事件循環）

Js實現阻止瀏覽器返回的功能

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結