python批量檢測鏈接是否可正常打開

通過一些爬蟲腳本爬取圖站圖片,但是發現有些圖片是沒法打開的,可能返回404的code碼

所以設計一個腳本,對所有的圖片地址進行檢查,返回200的保存到另外一個文本內,然後再去下載

 

腳本邏輯很簡單,直接貼代碼,從‘’待檢查地址.txt‘中循環取地址,requests請求地址,’返回碼等於200,循環取出的地址寫到“生成地址.txt”中,

import os
import requests

soure = open('待檢查地址.txt', 'r')
value = soure.readlines()
soure.close()

def stepb(value):
    for url in value:
        url=url[:-1]#去掉換行符,然後url後面會帶個空格,訪問不了鏈接
        r=requests.get(url=url)
        code = r.status_code
        if str(code) == '200':
            print(url+"可正常打開")
            with open('生成地址.txt', 'a') as w:
                w.write(url+'\n')
                w.close()
    print("檢查完成")

stepb(value)

 

下圖1522是本次案例的腳本

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章