比如<em class="gitee-highlight-keyword">thinkphp</em><em class="gitee-highlight-keyword">5.1</em>開發博客系統</div>'
這個html想要獲取“thinkphp5.1開發博客系統”,可以用正則表達式:
re.sub(u"\<.*?\>", “”,需要的html代碼)獲取
這段代碼的意思是,把<>中的部分都用“”替換了,這樣就只剩下thinkphp,5.1,開發博客系統了
python正則獲取html中的數字、漢字、字母
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
亂序拼圖驗證的識別並還原 puzzle-captcha(開源)
S.F.
2021-12-01 00:53:28
【轉載】Python處理csv文件
zqh
2020-07-18 14:25:30
Error:field larger than field limit(131072)解決方法
hammring
2020-07-08 12:39:29
啓動Jupyter時, 遇到 sudo: jupyterhub: command not found 問題的解決方案
钢琴线与小刀
2020-07-08 12:39:19
Python小記 —— 文件讀寫操作裏read()方法的深究
柘月十七
2020-07-08 12:33:27
python使用pip指令安裝並引用第三方模塊及注意事項
柘月十七
2020-07-08 12:33:27
python小記 —— sys.argv
柘月十七
2020-07-08 12:33:16
Django Signals 信號
冯斯特罗
2020-07-08 12:31:35
sorted 在python2和3中的區別
冯斯特罗
2020-07-08 12:31:35
python3 排序 sort sorted
冯斯特罗
2020-07-08 12:31:35
python3 super 用法2
class MetaCls(type): def __new__(cls, *args, **kwargs): print("in MetaCls") # return super(Meta
冯斯特罗
2020-07-08 12:31:35
meta class 和 類裝飾器的執行順序
冯斯特罗
2020-07-08 12:31:35
弱引用 weakref
冯斯特罗
2020-07-08 12:31:35
python神級數據結構namedtuple
冯斯特罗
2020-07-08 12:31:35