詳解原始網站日誌

原創

2020-02-25 00:02

原始日誌文件只是一個純文字形式的文件，只要用文字編輯軟件如WordPad或Notepad打開就可以了。

下面是我從上個月這個blog本身的日誌文件中隨機選取的一行，我們來看一下它包括哪些信息：

221.201.77.63 - - [02/Jul/2006:15:30:41 +0800] “GET /seoblog/2006/04/17/user-friendly-website/ HTTP/1.1″ 200 19031 “http://www.baidu.com/s?
wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3″ “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)”

用戶IP地址

221.201.77.63

這是訪問人所使用的IP 地址，能夠告訴你來訪的人來自什麼地理位置。如果你查一下這個IP地址所屬位置，可以看到這位訪客來自中國北京。

日期/時間

02/Jul/2006:15:30:41

這是某一個文件被訪問的時間，和IP地址結合起來，你就可以跟蹤某一個特定的用戶，從一個網頁到另一個網頁的訪問順序。

時區

+0800

這個數字是相對格林威治時間的時區差多少。

服務器動作

GET /seoblog/2006/04/17/user-friendly-website/ HTTP/1.1

服務器要做的動作要麼是GET，要麼是POSP。除了一些CGI腳本外，通常都應該是GET，也就是從服務器上獲取某個網頁或圖片文件。

例子裏的這行意思就是按HTTP/1.1協議(protocol)獲取文件/seoblog/2006/04/17/user-friendly-website/

返回狀態碼

200

下一行是服務器反應是否成功。200就是說成功獲取了文件，如果是返回了404，就是文件沒有找到。401是需要密碼，403禁止查看，500服務器錯誤，當然還有其他很多代碼。

文件大小

19031

這一行指的是所獲取的文件大小，在我們的來自例子裏是19031byte。

訪客來源

http://www.baidu.com/s?wd=PRADA%B9%D9%B7%BD%CD%F8%D5%BE&cl=3

這一段是告訴我們訪客是從哪裏來到這一個網頁。有可能是同一個網站的其他頁，有可能是來自搜索引擎的搜索頁。

例子裏的是來自百度，搜索關鍵詞是”PRADA官方網站”。

這段信息是非常重要的。

瀏覽器類型

Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Alexa Toolbar)

這最後一段所表示的是瀏覽器和用戶電腦的一些信息。

比如上面這一段所表示的是用戶所使用的電腦是與Netscape兼容的Mozilla瀏覽器，Windows NT操作系統，瀏覽器是IE6.0，裝有Alexa Toolbar。

在這一段如果用戶使用的是其他類型電腦或瀏覽器，你還可能看到這些代碼:

msnbot/1.0 (+http://search.msn.com/msnbot.htm)
Baiduspider+(+http://www.baidu.com/search/spider.htm)
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Maxthon; Alexa Toolbar)
http://www.gougou.com RSS Online Reader
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

意義不用解釋，一看就知道了。

跟蹤用戶軌跡

這是很多網站運行者需要研究的地方。

從日誌文件中剔除對圖片的訪問，剔除中間插進來的其他訪客的信息，只把來自某一個IP地址的用戶在一段時間內所看的網頁列出來，我們就能看到這個用戶在你的網站上都做了哪些行動，看了哪些網頁。

用戶行爲信息給網站運行者提供很大的幫助。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

詳解原始網站日誌

C#開源的兩款功能強大的錄屏神器

認知提升的方法

螞蟻面試：Springcloud核心組件的底層原理，你知道多少？

.gov.cn網站集錦

要熟知的100位世界富豪

愛情搞笑短信

窮人創業的三個投資祕方

詳解原始網站日誌

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結