python正則獲取html中的數字、漢字、字母

比如<em class="gitee-highlight-keyword">thinkphp</em><em class="gitee-highlight-keyword">5.1</em>開發博客系統</div>'
這個html想要獲取“thinkphp5.1開發博客系統”,可以用正則表達式:
re.sub(u"\<.*?\>", “”,需要的html代碼)獲取
這段代碼的意思是,把<>中的部分都用“”替換了,這樣就只剩下thinkphp,5.1,開發博客系統了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章