原创 解決使用tesserocr.image_to_text(image)和(tesserocr.file_to_text('image.png')等錯誤問題

用例子驗證如何使用:我們找到一個驗證碼圖片:image.jpg,下載到本地磁盤,用代碼進行驗證: 1 import tesserocr 2 from PIL import Image 3 image=Image.open(‘ima

原创 Spring Boot打造個人博客系統(總體分析)

一、功能概述: 1.1 核心功能 1.2 用戶管理: 1.3 安全設置: 1.4 博客管理: 1.5 評論管理: 1.6 點贊管理: 1.7 分類管理: 1.8 標籤管理: 1.9 首頁搜索: 二、核心技術:

原创 Python網絡爬蟲——週報2

一、本週情況: 1.1 書籍學習 第二部分: 高級數據採集 數據清洗 自然語言處理 穿越網頁表單與登錄窗口進行採集 採集javascript 圖像識別與文字處理 避開採集陷阱 用爬蟲測試網站 遠程採集 二、筆記: 本

原创 解決Python3.6安裝使用tesserocr文件時報錯“error: Microsoft Visual C++ 14.0 is required.“

使用pip install tesseroc安裝時,報錯L: 解決辦法: 我們在PowerShell下使用pip3 install tesserocr pillow 命令安裝 tesserocr時通常會報錯:“error: Mic

原创 理解Session和Cookie機制

什麼時候不能用Cookie,什麼時候不能用Session? 一、會話 會話(Session)跟蹤是Web程序中常用的技術,用來跟蹤用戶的整個會話。 常用的會話跟蹤技術是 Cookie 與 Session 。 Cookie: 通過在

原创 Python網絡爬蟲——週報1

一、本週情況: 1.1 書籍學習 第一部分:創建爬蟲 初見網絡爬蟲 複雜的HTML解析 開始採集 使用API 存儲數據 讀取文檔 二、課程筆記: 本部分練習代碼在我的github倉庫:https://github

原创 Git教程

相關鏈接內容: Git 知識點 Git速成 Git進階 Git Book 廖雪峯Git 初識GitHub 加入 GitHub 向 GitHub 提交代碼 團隊合作利器 Branch GitHu