原创 python常見反爬蟲類型

目錄注:筆記大部分來源書本,僅供學習交流:【Python3反爬蟲原理與繞過實戰—韋世東】1、信息校驗型反爬蟲(1)User-Agent、Host、Referer等反爬蟲(2)Cookie反爬蟲(3)簽名驗證反爬蟲(4)WebSoc

原创 Linux簡單命令學習

目錄Linux的基本使用1、命令按鍵解釋(1)熱鍵(2)查詢幫助(3)常用命令2、簡單的文本編輯器nano3、linux的文件屬性(1)第一欄:文件的類型與權限,共10個字符(2)第二欄:有多少文件名鏈接到此節點(inode)(3

原创 用Proxifier只代理PC端部分軟件

mitmproxy監測,proxifier代理部分軟件 1、添加代理信息 (1)打開cmd窗口使用ipconfig命令:查詢ipv4地址 (2)打開Proxifier>配置文件>代理服務器:添加ipv4地址、端口、類型 2

原创 Python_Requests_報錯解決

1、報錯:SSLError (Caused by SSLError(SSLError(“bad handshake: Error([(‘SSL routines’, ‘tls_process_server_certificate

原创 Python解決下載pdf問題bug

代碼如下: 1、BUG問題:requests返回的二進制結果resp.content=b’ '爲空,無法下載pdf 2、產生原因: response.close()方法會調用HttpWorkerRequest.CloseConn

原创 python3將unicode編碼字符串輸出漢字

python3 把str的unicode轉中文 1、一般直接輸出是以下這樣的: >>> print('\u722c\u866b') >>> 爬蟲 2、但是如果是以下這樣就不能正常的輸入漢字, >>> print('uni

原创 Git使用

目錄一、Github項目代碼託管平臺、維護遠程庫1、團隊內部操作:同公司代碼操作2、跨團隊操作:不是同公司的代碼操作二、本地庫基本工作流程三、本地庫基本信息設置1、本地庫初始化2、基本配置設置四、本地庫Git操作命令1、添加文件2

原创 Python3.8新特性

Python新變化官方文檔 Python3.8主要新功能 Python3.8主要新特性 1、PEP 572, 賦值表達式:= 2、PEP 570, 僅位置參數 / 3、f-strings 說明符 = 4、可反轉字典reverse

原创 Python_FontTools使用

Font_Tools的使用 pip install fontTools FontCreator工具下載 在線FontEditor工具 1、fontTools使用總結 woff字體文件點擊下載 from fontTools.

原创 網站爬取思路總結

1、建議 1、簡單的一些靜態網站可以直接看Chrome裏面的Network請求分析獲得數據。 2、還有一些動態的網站ajax請求,可以藉助一些工具進行分析,或者用selenium模擬瀏覽器行爲也行。 2、爬取步驟及思路 1、

原创 Python爬蟲_unable to decode value

一、問題描述 Form Data表單裏面出現參數值爲:unable to decode value ,導致python爬蟲時返回頁面源代碼丟失內容 網站源碼編碼爲GBK 二、解決方法 提交的form表單參數值編碼轉換 :

原创 Python貓眼電影字體反爬

貓眼電影字體反爬 一、原理介紹 將所有uni的x、y座標收集,並利用KNN算法預測uni對應的真實值。 參考這篇文章:原理介紹 二、依賴包 下載whl文件安裝:地址 依賴包: fontTools、numpy、scipy、sk

原创 AISweigart_第8章_讀寫文件(os模塊)

第8章_讀寫文件 1、os.path.join()返回一個文件路徑的字符串 在windows上是倒斜槓\,在Linux上是正斜槓/ import os print(os.path.join('user', 'bin', 'sp

原创 python_click.option()使用

click官方文檔 click官方文檔 click的option詳細使用 推薦文章 click.command():將該方法變成一個命令行工具 click.option():通過指定命令行選項的名稱,從命令行讀取參數值,再將其傳

原创 python_空氣質量爬取

原文鏈接:https://cuiqingcai.com/5024.html#comments JavaScript加密邏輯分析與Python模擬執行實現數據爬取 網址: https:/