最開始我接觸爬蟲是在去年年末的時候,因爲發現了一個非公開網站的小瑕疵,只需要改變地址欄的url中的id值就可以查看其他人私有的文章,原則來說一個嚴謹的網站不會犯這樣的錯誤,當時也是學了java語言,我去問我的講師,也從講師那裏得知了爬蟲這項技術,並且講師也鼓勵我放手去做,之後業餘時間在網上瘋狂的查找相關技術去學習,不斷的去練習.
從獲取全部源碼到可以篩選想要的信息.
從單一的獲取文字信息到下載圖片信息.
從IO保存到本地到用數據庫保存.
從簡單的靜態網站到較爲複雜的動態網站.
中間不斷的完善編碼形式.
瞭解網站內部運行模式.
用爬蟲做更多的事.
好了,故事內容就講到這裏,之後陸續我會將我寫的東西拿出來與大家分享.