Python__總結

學了幾個星期的python,也有了一些體會,更多的是它與C之間的關係。
與C不同,python的變量使用之前無需聲明。代碼塊的分隔也僅是靠縮進格式,而不是用花括號。語句結尾可以不使用分號,而是用物理行來作爲邏輯行,即一行一語句。
python中大量使用冒號:來表明代碼塊,如if,while,for和自定義函數後都要加冒號和縮進來劃分代碼塊。其中,while都允許使用else語句當循環條件不滿足時運行。另外for與其他語言有本質不同:以自變量依次取一個給定集合內的值帶入循環體執行,而非判定條件。
自定義函數大致相同,但是由於變量無需聲明,在提高自由度的同時也令可讀性大幅降低。默認情況下,函數內的變量作用域僅在該函數內。即函數內外的同名變量是不同的。當需要一致時要使用global x來聲明全局變量。就這點而言,比C更嚴格許多。
在給形參賦默認值時,被賦值的變量需要放在未賦變量之後定義。例如 def max(a=5,b)這種是不可以的。
在使用模塊(相當於C中的頭文件)的函數,鍵時,需利用點運算符以區分本模塊內使用的標識符。如(sys.argv)或者在聲明調用的時候寫出需要的標識符名。
dir函數可以列出模塊內的所有標識符,import用來聲明調用模塊,del用來刪除。
序列:類似數組的概念,在索引操作符(a[0])的基礎上擁有切片操作符(a[1:3])
列表:有序項目的集合,可增刪改
元組:不可變的列表

除此之外,Python最重要的應該就是它的爬蟲功能了。

爬蟲:就是模擬瀏覽器發送網絡請求,接受請求響應,一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。

原則上只要是瀏覽器(客戶端)能做的事情爬蟲都可以做。
在此之前我們需要知道python有一個requests模塊可以模擬瀏覽器發送請求獲取響應,重重之中
在PyCharm終端輸入pip install requests,看一下是否安裝這個模塊,沒有的話它會自動下載安裝
爬取網站的步驟
一.分析
請求url
請求方式
請求頭
請求參數
在這裏插入圖片描述請求頭在這裏插入圖片描述
請求參數:即搜索的內容
二.模擬瀏覽器發送請求獲取響應

#導入模塊
import requests  

#2.發送請求獲取響應
response = requests.get(
  #設置請求地址   url="www.baidu.com",
  #設置請求頭     headers = {"User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
}
)
#處理響應
with open("01-百度頁面獲取.html",'w',encodeing='utf-8') as f:
       f.write(response.text)

這是一個基本的框架,其中還有很多的內容,對於一個初學者來說並不簡單,尤其是在實際操作過程中會遇到各種各樣的問題,現在瞭解到的只是表面功夫。怎麼說呢,還是得多練習。

–加油吧-*-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章