python處理“”開頭加數字的html字符方法

在本篇文章裏小編給大家整理了關於python如何處理“”開頭加數字的html字符的相關知識點總結,有興趣的朋友們學習下。

python如何處理“”開頭加數字的html字符,比如:風水這類數據。

用python抓取數據時,有時會遇到想要數據是以“”開頭加數字的字符,比如圖中所示的這些:

風水大術士

這些字符需要再次轉換才能變回中文內容。這些字符需要再次轉換才能變回中文內容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

定義變量,再定義轉換代碼。

代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。 

測試運行,這串字符串正常輸出了中文。

Python3.7+版本

在最新python版本中,不能用上面的導入方法。可以用"import html"或者“from html import unescape”。這裏使用"import html"做測試。

導入html後,直接用".unescape()"來處理字符串。

運行後,正常轉換成了中文字符。

感謝大家的閱讀和對神馬文庫的支持。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章