Python 截圖html頁面將html頁面轉爲圖片

原創

2020-05-12 00:13

我的方法：
利用爬蟲下載 html

from urllib import request
from lxml import etree
from bll.rate_manager_bll import rate_manager_bll
from datetime import datetime
from bll.order_bll import order_bll
from common import ali_oss
import imgkit
from common_tools.constant.common_constant import *
from dal.attachment_dal import attachment_dal
def capture_BCHK_real_rate():
    """

    """
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                      '(KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36',
    }
    url = 'https://www.baidu.com'
    response = request.Request(url=url, headers=headers)
    html_info = request.urlopen(response).read().decode('utf-8')

如果網址存在css 和js 該怎麼辦呢盤他

       # 替換地址
    html_info_new = f"""{html_info}""".replace('src="', 'src="https://www.xxx.com').replace('href="', 'href="https://www.xxx.com')

output_path我爲False 具體自己搜索一下mgkit.from_string的用法

	data_str = imgkit.from_string(html_info_new, output_path=False)

其中遇到的坑

imgkit 安裝 imgkit
ubuntu系統，更新sudo apt-get update

安裝：sudo apt-get install xvfb

sudo apt-get install wkhtmltopdf

sudo pip install pdfkit

sudo pip install imgkit

還遇到字體的問題

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【Python爬蟲】基本原理和框架

開發者工具介紹參考：https://blog.csdn.net/m0_37724356/article/details/79884006 右擊網頁-檢查，或者F12，打開網頁開發者工具 get方式將請求的參數包含在url裏面

2020-07-08 10:40:50

【Python 爬蟲】使用友盟API獲取數據

一、需求每天需要從友盟網站獲取若干應用如下信息二、實現-分解 1）獲取api祕鑰 #獲取api祕鑰 def authorize(user, pasw): url = 'http://api.umeng.com/aut

2020-07-08 10:40:48

【Python 爬蟲】使用新榜API獲取數據

一、需求每日獲取新榜網站收藏的微信公衆號對應的【點贊數、排名、頭條閱讀數】二、實現-分解 1）獲取新榜api 打開並登錄新榜網站-數據服務-數據API 點擊試用即可，到達控制檯，你的賬號就獲得API密鑰，以及2000unit額

2020-07-08 10:40:48

Python爬蟲精簡步驟 HTML基礎（上）

開門見山，HTML的學習可分爲三個層次。讀懂，修改，編寫。讀懂：只有讀懂了HTML，才能看得懂網頁結構，纔有可能運用Python的其他模塊去解析數據和提取數據。想寫爬蟲程序一定要先學好HTML基礎。修改：在讀懂HTML文檔的

2020-07-07 11:50:32

一個簡單的校園網登錄程序 || 爬蟲+tkinter

僅用於登錄中國礦業大學校園網可以自動記錄用戶名和密碼,省去二次填寫的麻煩效果代碼 import tkinter as tk import requests import re import tkinte

2020-07-07 06:57:17

Python爬取快代理

前天，本人在爬取某網站時，第一次遇到IP被封的情況，等了幾個小時之後，還是不行。最後，迫於無奈，還是請出了大招，使用代理IP。今天，閒來無事，本人爬取了快代理網站上 5 萬多條免費高匿名代理IP。首先，我們進入網站免費代理頁面，

2020-07-05 21:50:04

Python爬取有道翻譯

轉載自https://blog.csdn.net/nunchakushuang/article/details/75294947一、正常的爬蟲流程：如果你要爬取他的翻譯接口，這個流程還是不能少的。首先我們打開有道翻譯的鏈接：http://

2020-07-05 19:45:53

liunx基礎命令使用

虛擬網卡的絕對路徑/etc/sysconfig/network-scripts/ifcfg-eth0 設置IP後重啓網路服務命令 service network restart 改Ip時主要改這幾個地方 DEVICE=e

2020-07-08 06:33:44

更改虛擬機Ip地址

安裝爬蟲時必須需要在一個網段，所有想到更改虛擬機IP。不夠詳細後面再補 SecureCRT 連接 Centos7.0 （橋接模式），且能連接公網。 1、查看本地網絡信息 ip：172.20.10.7 2、在VMware下配置Cento

2020-07-08 05:50:05

CentOS7重啓後網絡需手動開啓，設置啓動自啓

網卡沒有設置爲激活狀態，所以需要自己手動連接纔行。進入設置網卡的文件 vim /etc/sysconfig/network-scripts/ifcfg-ens33（ifcfg-ens33這個文件因不同虛擬機而不同，有些虛擬機的文件名是i

2020-07-08 01:45:42

記一次服務器配置https過程

之前配置HTTPS協議都是直接網上找例子照搬，最近配置公司服務器時發現分佈式服務配置存在很多問題，於是寫一下配置過程，記錄一下分佈式系統中大部分會使用到nginx+tomcat實現服務部署及負載均衡，尤其時springboot流

程序小达人

2020-07-06 21:19:45

【一次成功】Ubuntu安裝MySQL並設置root用戶遠程可以訪問

1.安裝mysql服務器 sudo apt-get install mysql-server 2.設置字符集爲UTF-8 sudo vi /etc/mysql/mysql.conf.d/mysqld.cnf 在[mysqld]下新增

2020-07-06 21:11:22

【一次成功】Ubuntu設置允許Root用戶遠程SSH連接並登錄

1.檢查並安裝openssh-server 如果已安裝可以升級 sudo apt-get update openssh-server sudo apt install openssh-server 2.設置root用戶密碼： sud

2020-07-06 21:11:22

老筆記本安裝Ubuntu18.4後合蓋自動關閉Wifi問題解決

1.終端中輸入如下命令： sudo vim /etc/systemd/logind.conf 2.編輯其中的HandleLidSwitch，去掉前面的#，修改suspend爲ignore 3.直接重啓驗證（一定要重啓電腦）

2020-07-06 21:11:22

解決Ubuntu下Mysql中表存在卻查詢不到的問題

1.找到MySQL的安裝目錄（不同系統及安裝方式可能會有差異）錯誤異常關鍵信息爲：本人的Ubuntu18.4安裝目爲：/etc/mysql/mysql.conf.d/mysqld.cnf 2.修改mysqld.cnf 3.重啓My

2020-07-06 21:11:22

24小時熱門文章

最新文章

最新評論文章