A/B測試：實現方法

上文介紹了 A/B 測試的基本概念，接下來我們繼續探討如何實現 A/B 測試。

我們先來看一個圖：

　　（注：感謝Algo提供本圖。）

上圖展示了 A/B 測試的實現原理。從左到右，四條較粗的豎線代表了 A/B 測試中的四個關鍵角色：客戶端（Client）、服務器（Server）、數據層（Data）、數據倉庫（Data Warehouse）。從上到下代表了三種訪問形式：無 A/B 測試的普通訪問流程（Non AB test）、基於後端的 A/B 測試訪問流程（Back-end AB test）、基於前端的 A/B 測試訪問流程（Front-end AB test）。

一般情況下，用戶在一次瀏覽中，會從客戶端（Client）發起一個請求，這個請求被傳到了服務器（Server），服務器的後臺程序根據計算，得出要給用戶返回什麼內容（Data），同時向數據倉庫（Data Warehouse）添加一條打點信息，記錄本次訪問的相關信息。這個過程也就是圖上橫向的流程。數據倉庫收集到足夠的數據之後，就可以開始進行分析（Analytics）了，這也即是圖中右上角的部分。

A/B 測試需要將多個不同的版本展現給不同的用戶，即需要一個“分流”的環節。從上圖中我們可以看到，分流可以在客戶端做，也可以在服務器端做。傳統的 A/B 測試一般是在服務端分流的，即基於後端的 A/B 測試（Back-end AB test），當用戶的請求到達服務器時，服務器根據一定的規則，給不同的用戶返回不同的版本，同時記錄數據的工作也在服務端完成。

基於後端的 A/B 測試技術實現上稍微簡單一些，不過缺點是需要技術部工程資源介入，另外收集到的數據通常是比較宏觀的PV（Page View）信息，雖然可以進行比較複雜的宏觀行爲分析，但要想知道用戶在某個版本的頁面上的具體行爲往往就無能爲力了。

基於前端的 A/B 測試則可以解決上面的問題。它的特點是，利用前端 JavaScript 方法，在客戶端進行分流，同時，可以用 JavaScript 記錄下用戶的鼠標行爲（甚至鍵盤行爲，如果需要的話），直接發送到對應的打點服務器記錄。這樣的好處是不需要技術部（如果你們和我們一樣，前端工程師與後端工程師分屬不同部門的話）參與，並且可以比較精確地記錄下用戶在頁面上的每一個行爲，甚至包括後端方法難以記錄到的無效點擊！

下面，我將重點介紹一下我們在基於前端的 A/B 測試上的一些實踐。

一、分流

首先遇到的問題是如何分流的問題。對於大部分需求來說，我們希望各個版本的訪問人數平均分配。解決辦法有很多種，比較簡單的一種即是前面提到過的，根據某一個 Cookie ID 來劃分用戶，前提是你的網站上每一位訪客在第一次訪問時就要有一個不重複的 Cookie ID，比如“123.180.140.*.1267882109577.3”。然後，可以根據這個 Cookie ID 的最後一位（在本例中是“3”）來劃分人羣，比如單數的顯示 A 版本，偶數的顯示 B 版本。

因爲 Cookie ID 一般設定後不會輕易改變，基於 Cookie ID 的好處是我們能很好地對訪客保持一致性，某個用戶如果第一次看到的是 A 版本，那他刷新後看到的還是 A 版本，不會一會兒看到 A 版本一會兒看到 B 版本。但不足之處就是如果用戶瀏覽器不支持 Cookie 的話，分流就不能正常進行了。不過，現代瀏覽器默認情況下都是支持 Cookie 的，如果真有用戶的瀏覽器不支持 Cookie ，那也應該是極少數特殊情況，對結果的影響非常微小，對於這些特殊情況，我們一般可以安全地忽略掉。

還有一點需要注意的是，A/B 測試的頁面必須有較高的 UV （Unique Visitor，獨立訪客數），因爲分流帶有一定的隨機性，如果頁面 UV 太小，分到每一個版本的人數就更少，結果很有可能被一些偶然因素影響。而 UV 較大時，根據大數定理，我們得到的結果會接近於真實數據。就像想知道一個地方的成年人的平均身高，當然是取的樣本越大結論越可信。

二、展示

決定向當前訪問者顯示哪個版本後，怎麼用前端的方法加載對應的版本呢？這需要分情況處理。

一般情況下，如果兩個版本只有一個較小的區域不一樣，我們可以同時將兩個區域的 HTML 都加載到當前頁面中，先用 CSS 把它們隱藏起來（也可以默認顯示一個版本），等 JS 判斷出該顯示哪個版本後，再控制對應版本的 CSS 顯示。

有時候，測試區域比較大，代碼比較多，或者需要後臺較多的計算資源，如果一開始就把兩個版本的 HTML 全加載到當前頁面中，就會需要比較大的開銷（比如帶寬、後臺計算量）。這種情況下，我們可以先把測試區留空，之後再用 Ajax 的方式延遲加載。

還有的時候，測試區域非常大，幾乎佔了整個頁面，或者完全就是不同的頁面，這時，用 Ajax 方式加載也不適合了，可以將不同的版本做成不同的頁面，然後再用 JS 跳轉。不過這樣的方式並不是很好，因爲前端 JS 跳轉需要一定的時間，這個過程很有可能被用戶感受到，並且留下不好的體驗。對這個問題，似乎沒有很好的解決辦法，至少在前端層面很難完美解決，所以並不是非常推薦這種跳轉方式，如果真的需要跳轉，最好是在服務器端由後端代碼來操作。

三、數據採集

正確展示對應的版本後，就要開始採集需要的數據了。有一個可選的數據，是當前版本有多少 PV （Page Views，訪問量），如果需要記錄這個數據的話，在正確版本加載完成之時就要發送一個打點信息。不過很多需求中，具體版本的 PV 的精確數值可能不是很重要，而且要收集這個信息需要多一次打點操作，所以一般情況下這個數據是可選的。

必須的數據是測試區域內用戶的點擊信息。當用戶在測試區域點擊了鼠標左鍵（無論這個點擊是點擊在鏈接、文字、圖片還是空白處），我們就需要發送一條對應的打點信息到打點服務器。一般來說，這個打點信息至少需要包含以下數據：

當前 A/B 測試以及版本標識
點擊事件的位置
點擊時間戳（客戶端時間）
當前點中的URL（如果點在非超鏈接區域，此項爲空）
用戶標識（比如 Cookie ID）
用戶瀏覽器信息

爲了儘可能精確地還原用戶的點擊位置，我們的頁面對前端有比較高的要求，要求頁面在不同的瀏覽器下有基本一致的表現，至少在IE6、7、8以及 Fiefox 下，頁面橫向的元素要精確一致，縱向上很難做到完全一致，但也要儘可能保持統一。另外，這樣的測試也不太適合自適應寬度的頁面，比較適合定寬的頁面，爲了避免不同分辨率下頁面左右空白不同導致鼠標點擊位置的不同，點擊位置取的應該是相對於測試區域左上角的位置。除此之外，最好再記錄一下測試區域相對於頁面內容左上角的位置，在後面還原點擊分佈圖以及繪製熱區圖時會用到這個數據。

這一階段的流程大致如下圖所示：

數據打點該如何發送以及如何存儲呢？這要取決於你的打點服務器如何存儲信息。

四、數據存儲

我們使用了一臺專用的服務器收集打點信息，爲了能支持儘可多儘可能密集的打點請求，這臺服務器的 apache 服務網站目錄下只有兩個靜態文件，分別是 abtest.html 和 abtest.gif ，兩者都是非常小的空白文件（空白圖片）。訪客端進行打點時，只需要以 GET 的方式帶上相關的參數請求兩個文件中的任意一個即可。比如：

http://abtest.xxx.com/abtest.gif?abid=1-a&clickBlockX=244&clickBlockY=372&clickBlockW=392&clickBlockH=76&clickTime=1263264082137&clickRX=233&clickRY=47&clickURL=&clickBeaconID=123.180.140.*.1267882109577.3&browserType=FireFox

這個請求可以通過 Ajax 的方式發送，也可以通過 JS 在頁面上創建 new Image() 對象的方式完成。

對打點服務器來說，這只是一條普通的 HTTP 請求，它會在日誌裏留下一條普通的日誌記錄，形如：

123.180.140.* – – [13/Jan/2010:15:21:15 +0800] “GET /abtest.gif?a=123&b=456&c=789 HTTP/1.1″ 304 – “-” “Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/532.6 (KHTML, like Gecko) Chrome/4.0.266.0 Safari/532.6″

可以看到了，除了 JS 發送給我們的信息外，Apache 還幫我們記錄了一些信息，比如訪客 IP 、服務器時間、用戶瀏覽器信息。

對於數據記錄和存儲來說，到這一步就足夠了。Apache 靜態文件 + 日誌的方式足夠高效，基本不用擔心性能的問題。剩下的，就是另外一個問題，如何從 Apache 日誌中讀取打點信息並加以分析，這已經和前端無關了，並且是一個比較複雜的問題，將在後續日誌中介紹。

發表於2010-7-29由oldj

A/B測試：實現方法

我的友情鏈接

Java 中常用緩存Cache機制的實現

A/B測試：基本概念

A/B測試：實現方法

面向對象編程語言 Python

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結