近期學校要求登陸一個網站學習,要計算在線時長,長時間不對這個頁面進行操作的話就會停止計時。就想着能不能寫個程序模擬登陸並進行一些操作。
模擬登陸的話有很多方法,因爲有驗證碼比較麻煩,所以我是自己先登陸一下,抓取cookie給程序用。
首先F12,再登陸一下網站,選擇Network,看到下圖
可以看到在Request Headers中有cookie字段,把它複製下來。
下面開始寫爬蟲
from fake_useragent import UserAgent
import requests
ua = UserAgent(path= r'C:\Users\****\AppData\Local\Temp\fake_useragent.json')
school_s = requests.session()
headers_school= {'User-Agent': ua.chrome,'Cookie':'ASP.NET_SessionId=gz5eg2r2n0ec0ycqhr51****'}
r = school_s.get('http://ystu.****.edu.cn/default.aspx',headers= headers_school)
r.encoding = r.apparent_encoding
print(r.text)
輸出
可以看到,程序已經登陸成功了。學校的網站一般都比較容易爬些,有些安全性高的網站就沒這麼容易了