正則表達式(RE)是一種小型的高度專業化的語言,它在各種語言裏都有接口。在python中, 通過re模塊實現。本文分成三個部分介紹python正則表達式。一:正則表達式的語法;二:python裏怎麼實現正則表達式;三:正則的實際運用
1
2
python的正則語言主要是在re模塊實現,下面簡單的介紹re模塊的語法:
3
在目前的工作中,主要是在兩個地方用到正則,一個是爬蟲;另一個是分揀。
如果你想學習Python可以來這個羣,首先是四七二,中間是三零九,最後是二六一,裏面有大量的學習資料可以下載。
- 爬蟲:
如果要截取麪包屑:圖中標紅的地方
在python裏調用re模塊,輸入以下代碼:
輸出:print crumb
酒類>中外名酒>白酒>五糧液(WULIANGYE)>五糧液股份公司興隆富貴天下-祝君興旺發達52°1…
2. 分揀參數:
商品標題:Samsung/三星 MB-MC128D TF(microSD)卡 128GB UHS-1 讀取速度80MB/S寫入速度20MB/S
目的:分揀出手機型號
代碼:
結果:其實就是識別數字+字母的組合,並且過濾掉全數字的和全字母的,長度大於1的字符串。結果輸出有5個,可以再加一些過濾的規則,過濾掉不要的字符串。
MB-MC128D
128GB
UHS-1
80MB
20MB