正則表達式對網站分析來說尤爲重要,尤其是Google Analytics中設置過濾器、高級細分以及自定義報告的時候,我們會經常用到正則表達式。
正則表達式,是包含字符、數字和通配符的字符串。我們使用正則表達式就是爲了查找符合某些規則的字符串,正則表達式就是描述這些規則的工具。如下圖所示:高級細分中正則表達式的位置
正則表達式到底是什麼東西?舉個例子,如果你想查找某個目錄下的所有word文檔時,你會在搜索框中輸入:*.doc,這樣你就能搜索到所有的word文檔。注意,這個表達式中的*的含義是指任意的字符串,意思就是說*代表任意的內容,你會搜索到GA.doc、代碼.doc等word文檔。這個就叫做通配符,和通配符類似,正則表達式也是用來進行文本匹配的工具,不過它能更精確的描述你的需求。
學習正則表達式,就需要先記住正則表達式的語法。下面列舉幾個常用的語法規則。
元字符 | 描述 | 用法 |
. | 匹配除“\n”外的任何單個字符 | 例如:. 表示尋找任意一個字符 |
* | 匹配前面的子表達式零次或多次 | 例如:ga*能匹配g、gaa、gaaa |
+ | 匹配前面的子表達式一次或多次 | 例如:ga+能匹配ga、gaa、gaaa |
? | 匹配前面的子表達式零次或一次 | 例如:g(a)?能匹配g、ga |
$ | 匹配輸入字符串的結束位置 | 例如:ga$能匹配最後爲a的字符串 |
^ | 匹配輸入字符串的開始位置 | 例如:^ga能匹配開始爲g的字符串 |
學習理論知識之後,下面一起來看看在Google Analytics中如何應用正則表達式。
例一:自定義報告中的正則表達式
自定義報告中使用的正則表達式是:.*abc.com,主要的作用是篩選出能匹配abc.com的字符串
例二:高級細分中的正則表達式
高級細分中採用的正則表達式是:^數,主要的作用是匹配以“數”開頭的網頁標題的內容,點擊“測試細分”得到的結果是333次訪問。
正則表達式主要是爲了方便篩選自己所需要的內容,所使用的表達式基本上是基於以上基本的語法進行變換。