requests庫總結及網絡基礎知識

截圖來源於MOOC嵩天老師爬蟲教程

requests基本框架

在這裏插入圖片描述
1.if name == __main__語句:
https://blog.csdn.net/Q2605894893/article/details/82345814
https://blog.csdn.net/qq_27017791/article/details/80212016
2.try except語句:只要有一句錯誤,就會執行except語句
3.模塊化編程原則:函數化,方便調用,簡潔,明晰功能:對比
在這裏插入圖片描述

基本方法,對象,屬性,異常

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
1.Response對象包含服務器返回的所有信息——並將這些信息整合賦予自己的屬性(encoding, text等) 也包含request的所有信息。
2.對大型資源:head方法用很少的寬帶資源獲取頭部的主要信息和概要信息
3.對小型資源:get直接獲取所有資源


HTTP網絡基礎

  1. HTTP是基於web端的數據通信的傳送協議:傳遞數據和資源,資源包括HTML,文件,圖片,視頻等等。HTTP 協議架構在 TCP 協議之上,它規範了傳輸數據的內容和格式,特點:請求響應模式,無狀態
  2. HTTP協議採用URL作爲定位網絡資源的路徑(類比本地文件的路徑目錄)
    URL格式:http://域名(www.,com,edu…前後綴)【PATH—具體路徑,從/後開始】
    例如:http://www.baidu.com(域名)/bit_clearoff//carticle(path網絡資源具體路徑)
    3. HTML: HTML(Hyper Text Mark-up Language )超文本標記語言,是用來修改,建造網頁的語言:基於web的語言。包含head,body兩大部分
    HTML是網頁內容的載體。內容就是網頁製作者放在頁面上想要讓用戶瀏覽的信息,可以包含文字、圖片、視頻等。

學習web前端開發基礎技術需要掌握:HTML、CSS、JavaScript語言。下面我們就來了解下這三門技術都是用來實現什麼的:
3. HTML是網頁內容的載體。內容就是網頁製作者放在頁面上想要讓用戶瀏覽的信息,可以包含文字、圖片、視頻等。
4. CSS樣式是表現(外觀控制)。就像網頁的外衣。比如,標題字體、顏色變化,或爲標題加入背景圖片、邊框等。所有這些用來改變內容外觀的東西稱之爲表現。
5. JavaScript是用來實現網頁上的特效效果。如:鼠標滑過彈出下拉菜單。或鼠標滑過表格的背景顏色改變。還有焦點新聞(新聞圖片)的輪換。可以這麼理解,有動畫的,有交互的一般都是用JavaScript來實現的。


http通過URL對資源進行定位,通過6個常用方法對資源進行管理,每次操作都是獨立無狀態的。在http中,網絡通道和服務器都是黑盒子,只能看到URL鏈接和對URL的操作。
爬蟲爬取的用text顯示的即html語言文本。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章