Python 爬蟲基礎

HTTP簡介:
200/OK  請求成功
201/ 請求已被發現
202 /服務器已接收請求,但尚未處理
400/ 請求無法被服務器理解
401 /當前請求需要用戶驗證
403 /服務器已理解請求,但拒絕執行
404 、NotFound

元素選擇器:直接選擇文檔元素,比如head,p
類選擇器:元素的class屬性:比如:<h1 class="import">
類名就是import
.import 選擇所有這個類屬性的值

ID選擇器:元素id的屬性,比如<h1 id="intro">
id是全局唯一的,一個文檔只能出現一次,不能使用單詞列表,與類選擇器一樣,區分大小寫.

屬性選擇器:
選擇某個屬性的元素,
*[title] 選擇所有包含title屬性的元素
a[href] 選擇所有帶有href屬性的喵元素

後代選擇器:選擇某元素後代的元素(層級不受限制),選擇h1元素的em元素

子元素選擇器:範圍限制在子元素,選擇h1元素的子元素strong

/ 從根節點選取
// 從匹配



 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章