[java爬蟲]序章-我與爬蟲的故事

最開始我接觸爬蟲是在去年年末的時候,因爲發現了一個非公開網站的小瑕疵,只需要改變地址欄的url中的id值就可以查看其他人私有的文章,原則來說一個嚴謹的網站不會犯這樣的錯誤,當時也是學了java語言,我去問我的講師,也從講師那裏得知了爬蟲這項技術,並且講師也鼓勵我放手去做,之後業餘時間在網上瘋狂的查找相關技術去學習,不斷的去練習.

從獲取全部源碼到可以篩選想要的信息.

從單一的獲取文字信息到下載圖片信息.

從IO保存到本地到用數據庫保存.

從簡單的靜態網站到較爲複雜的動態網站.

中間不斷的完善編碼形式.

瞭解網站內部運行模式.

用爬蟲做更多的事.

好了,故事內容就講到這裏,之後陸續我會將我寫的東西拿出來與大家分享.

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章