爲什麼搜索越做越大越多,定向推薦等越來越準?
爲什麼你在北京搜索商鋪飲食等,結果中都是和北京相關的內容?
爲什麼搜索的第一頁永遠比後面的好?
爲什麼搜索新鮮內容時結果會這麼快的更新爲你想看的內容?
。。。。。爲什麼?。。。。。。。
其實這些答案都有一個來源: 用戶訪問日誌的分析
我們先來看來訪問日誌一般包含哪些內容:
客戶端的ip, 查詢的關鍵詞與對應的url地址,用戶訪問結果中的哪一條位置 , 用的什麼瀏覽器.....
(1) 我搜索時地域是怎麼知道的呢?
答案肯定是提前就將分佈存儲好,只要用戶訪問時的ip知道那麼地址自然就知道了(大部分按ip來分來是比較準的)
例如我本地測試 :
tail -2 head.log | ./location.php
qzone.qq.com 安徽省滁州市
138ddd 廣東省肇慶市
輸入head.log即是用戶的訪問日誌片斷,內容就是我上面提到的包含的內容
完全可以把用戶搜索的詞和位置得到 ,如果您想測試的話,可以網上找下使用qqwry.dat文件的例子即可實現;
$iplocation = new IpLocation("qqwry.dat");
$separator = $iplocation->separate(1000);
(2)得到ip地址後的處理過程
待續