from lxml import etree報錯

原創

時光不寫博客

2019-07-29 18:25

寫一個小型的爬蟲懶得用scrapy(主要是scrapy不太好裝...)，直接使用了requests請求，但是要解析數據，那麼問題來了

問題1：

使用的是python3.7的環境，解析數據要用xpath，系統是mac
```
pip install lxml
```
一分鐘後。。。下載成功
開始寫代碼，
```
from lxml import etree
```
掛了...，lxml中竟然沒有etree模塊
換個方法
```
from lxml import html
et = html.etree
```
依然掛了...

解決：

開始找解決辦法
百度中。。。，找了一堆的方法，全部失敗
google中。。。，又找了一堆的方法，全部失敗
即將放棄，準備切換python版本，開始水羣。。。，羣裏大佬給了個阿里源的地址，恍然大悟！！！
```
pip install -i https://mirrors.aliyun.com/pypi/simple/ lxml 
-----------

from lxml import html
et = html.etree
print(et.HTML(response.content))
```
終於突破了這個問題

問題2：

解析過後發現有些需要整個代碼塊轉爲字符串

import xml.etree.ElementTree as ET
print(ET.tostring(dom代碼塊, encoding='utf8'))

數據是有了，但是不太對，中文出來的是十六進制的數據，沒法繼續了啊
百度/Google，我又來了。。。

解決：

print(str(ET.tostring(dom代碼塊, encoding='utf8'), 'utf-8'))

參考鏈接：時光不寫博客

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

從入門到精通：掌握Scrapy框架的關鍵技巧

在當今信息爆炸的時代，獲取並利用網絡數據成爲了許多行業的核心競爭力之一。而作爲一名數據分析師、網絡研究者或者是信息工作者，要想獲取網絡上的大量數據，離不開網絡爬蟲工具的幫助。而Scrapy框架作爲Python語言中最爲強大的網絡爬蟲框架之

2024-05-25 00:09:06

記錄一次cnvd事件型證書漏洞挖掘

事件起因是因爲要搞畢設了，在爲這個苦惱，突然負責畢設的老師說得到cnvd下發的證書結合你的漏洞挖掘的過程是可以當成畢設的，當時又學習了一段時間的web滲透方面的知識，於是踏上了廢寢忘食的cnvd證書漏洞挖掘的日子。前言：聽羣友們說，一般可

2024-05-28 11:16:19

【終極指南】使用Python可視化分析文本情感傾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

今天！通義靈碼在北京、成都、杭州三城開講啦

通義靈碼自從入職阿里雲以來備受行業關注。5 月 24 日，阿里雲工程師奔赴北京、成都、杭州三城，向企業和開發者介紹並演示通義靈碼，通義靈碼依然是大家話題的C位，並收穫了衆多粉絲。 @杭州阿里雲金融創新峯會今天，2024 阿里雲金融創新峯

2024-05-27 21:13:46

解讀注意力機制原理，教你使用Python實現深度學習模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

安裝筆記本應用商店的pycharm，再安排pandas等模塊，說是沒有打包工具?

大家好，我是Python進階者。一、前言前幾天在Python最強王者交流羣【斌】問了一個Python庫安裝的問題。求教大佬：華爲筆記本，麒麟系統，安裝筆記本應用商店的pycharm，再安排pandas等模塊，說是沒有打包工具，再安裝

2024-05-25 10:02:28

面向AI的開發：從大模型（LLM）、檢索增強生成（RAG）到智能體（Agent）的應用

引言隨着人工智能技術的飛速發展，大型語言模型（LLM）、檢索增強生成（RAG）和智能體（Agent）已經成爲推動該領域進步的關鍵技術，這些技術不僅改變了我們與機器的交互方式，而且爲各種應用和服務的開發提供了前所未有的可能性。正確理解這三者

2024-05-24 23:57:39

界面組件Kendo UI for Angular教程 - 構建強大的PDF閱讀器（二）

如今當用戶需要處理PDF文件時，通常不得不下載應用程序或者瀏覽器插件，控制用戶如何與PDF交互並不是一件容易的事。如果我們提供PDF作爲內容，用戶可以下載它並使用瀏覽器或PDF本身提供的控件進行交互。然而，一些企業可能希望控制用戶使用PDF

2024-05-28 12:19:07

音頻鏈接抓取技術在Lua中的實現

前言隨着數字音樂的普及，越來越多的用戶選擇在線音樂平臺來享受音樂。網易雲音樂作爲國內領先的音樂服務平臺，不僅提供了豐富的音樂資源，還擁有獨特的社交屬性，吸引了大量的用戶。在衆多的音樂服務中，音頻鏈接的抓取技術成爲了一個重要的需求。無論

2024-05-28 00:07:25

鴻蒙原生應用再新丁！新華社入局鴻蒙

鴻蒙原生應用再新丁！新華社入局鴻蒙來自 #HarmonyOS# 微博5月27日消息 #鴻蒙千帆起#新華社客戶端完成鴻蒙原生應用核心版本開發，將實現不同使用場景下更加智能、精準、及時的要聞推送，以及主流價值的全場景覆蓋和高效傳播！與此同

2024-05-27 23:42:19

領域驅動設計DDD在B端營銷系統的實踐

本文針對B端營銷系統設計中的複雜性，從戰略設計，戰術設計到代碼架構，詳細介紹了DDD在各個階段的實踐，期望爲大家提供一些可供參考和借鑑的思路。 1 背景通過營銷活動實現客戶/用戶拉新、留存和促活是業界普遍採用的方法。爲實現商戶增長和

2024-05-27 21:18:06

使用JavaScript日曆小部件和DHTMLX Gantt的應用場景（三）

DHTMLX Suite UI 組件庫允許您更快地構建跨平臺、跨瀏覽器 Web 和移動應用程序。它包括一組豐富的即用式 HTML5 組件，這些組件可以輕鬆組合到單個應用程序界面中。 DHTMLX Gantt是用於跨瀏覽器和跨平臺應用程序的功

2024-05-27 12:19:39

看不懂正則表達式？試試可視化工具吧！

1. 前言正則表達式是一種用來匹配字符串的強有力工具。設計思想是用一種描述性的語言來給字符串定義一個規則，凡是符合規則的字符串我們就認爲它“匹配”了，否則該字符串就是不合法的。日常開發中常常會使用正則表達式，例如：對數據格式進行校

2024-05-24 23:57:40

鴻蒙原生應用再新丁！學習強國入局鴻蒙

鴻蒙原生應用再新丁！學習強國入局鴻蒙來自 #HarmonyOS# 微博5月23日消息中央宣傳部宣傳輿情研究中心宣佈，將基於HarmonyOS NEXT鴻蒙星河版啓動“學習強國”App鴻蒙原生應用開發！“學習強國”App將爲鴻蒙生態帶

2024-05-24 23:43:49

一鍵自動化博客發佈工具,用過的人都說好(公衆號篇)

之前收到很多朋友的要求，說是需要一個公衆號的自動發佈工具。現在，它來了。前提條件前提條件當然是先下載 blog-auto-publishing-tools這個博客自動發佈工具,地址如下：https://github.com/ddean

2024-05-24 21:38:52

24小時熱門文章

最新文章

最新評論文章