網頁數據的抓取

    這幾天試着寫了點程序,用於對特定網站的網頁數據抓取。

    有些網站可能不夠規範,xml的解析工具有問題,所以就自己寫了一個。好處是根據需要的進行處理,應該速度快,缺點是需要經常完善。

    後續完善:1、如何生成關鍵字。2、不同網站抓取數據的排重問題。

    有經驗的人歡迎交流。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章