在本篇文章裏小編給大家整理了關於python如何處理“”開頭加數字的html字符的相關知識點總結,有興趣的朋友們學習下。
python如何處理“”開頭加數字的html字符,比如:風水這類數據。
用python抓取數據時,有時會遇到想要數據是以“”開頭加數字的字符,比如圖中所示的這些:
風水大術士
這些字符需要再次轉換才能變回中文內容。這些字符需要再次轉換才能變回中文內容。
Python2.7版本
在python2.7版本中,使用import HTMLParser
定義變量,再定義轉換代碼。
代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。
測試運行,這串字符串正常輸出了中文。
Python3.7+版本
在最新python版本中,不能用上面的導入方法。可以用"import html"或者“from html import unescape”。這裏使用"import html"做測試。
導入html後,直接用".unescape()"來處理字符串。
運行後,正常轉換成了中文字符。
感謝大家的閱讀和對神馬文庫的支持。