巧解正則表達式環視

正則表達式匹配主要有兩種,匹配字符和匹配位置。環視我個人理解應該更像是匹配位置的。具體下文說到。下面先看一下環視的正則表達式書寫格式。

類型正則表達式匹配成功條件
肯定逆序環視(?<=expresion)子表達式能夠匹配左側文本
否定逆序環視(?<!expresion)子表達式不能匹配左側文本
肯定順序環視(?=expresion)子表達式能夠匹配右側文本
否定順序環視(?!expresion)字表達式不能匹配右側文本

 

 

 

 

本表摘自《精通正則表達式》p66

 

你要是覺得我會按照上面的表格來理解你就錯了,看完上面的表格我是一臉懵逼的,用的時候更加會一臉懵逼,然後把書本中p66頁前面的幾頁再翻了幾遍,發現一段很重要的話,順序環視會檢查子表達式能否匹配,但它只尋找能夠匹配的位置,而不會真正“佔用”這些字符。好了,大家趕緊畫重點,考試要考,它只尋找能夠匹配的位置,也就是說環視只是匹配位置,而不是匹配文本,匹配位置最常見的就是^和$,指匹配文本的開頭和結尾,然後把上面的表格再轉換一下就是

 

類型正則表達式匹配成功條件
肯定逆序環視(?<=expresion)匹配子表達式右側的位置
否定逆序環視(?<!expresion)匹配非子表達式右側的位置
肯定順序環視(?=expresion)匹配子表達式左側的位置
否定順序環視(?!expresion)匹配非子表達式左側的位置

 

 

 

 

 

 單單看這個表還是有點一臉懵逼,那就來舉幾個栗子。玩正則表達式推薦你們一個利器,簡直能稱爲神器,RegexBuddy,是《精通正則表達式》中介紹的。下面的例子我都是用他來完成。

1、(?=\d)

可以理解爲匹配數字左邊的位置,然後把匹配到的位置替換爲逗號,結果如圖,圖中左上角爲正則表達式和替換字符串,右下角爲匹配的文本和替換的結果

看圖中右下角高亮的逗號,就是之前的匹配的位置。

2、(?!\b)

匹配非數字左邊的位置,然後把這些匹配的位置替換爲逗號,結果如圖

 對比1和2的兩個圖你就會發現(?=\b)和(?!\b)是互補的關係,兩個表達式匹配的位置合起來就是該匹配的文本的所有位置。

3、書中例子完善

《精通正則表達式》書中環視用了一個例子來貫通。該例子也比較常用,就是對於比較大的數值,我們一般在其中間加入逗號,這樣才能更容易看懂,如112347915如果寫成112,347,915就會比較清晰一點。

下面我將一步步說明如何把“今年的營業額爲112347915.5465萬元”替換爲“今年的營業額爲112,347,915.5465萬元”

a、要替換的位置在數字的左邊

正則表達式:(?=\d)

替換結果:今年的營業額爲,1,1,2,3,4,7,9,1,5.,5,4,6,5萬元

b、要替換的位置右邊至少有三個數字,也就是位置是在三個數字左邊

正則表達式:(?=\d\d\d)

替換結果:今年的營業額爲,1,1,2,3,4,7,915.,5,465萬元

c、要匹配的位置左邊應該有數字,也就是該位置應該是在數字的右邊

正則表達式:(?<=\d)(?=\d\d\d)

替換結果:今年的營業額爲1,1,2,3,4,7,915.5,465萬元

d、匹配位置的時候需要沒隔三個數字進行匹配,這時候就要用到量詞"+"了

正則表達式:(?<=\d)(?=(\d\d\d)+(?!\d))

替換結果:今年的營業額爲112,347,915.5,465萬元

其中(?=(\d\d\d)+(?!\d))的意思就是指匹配一個位置,該位置是在(\d\d\d)+(?!\d)的左邊,也就是該位置是在一個非數字的左邊的每三個數字的左邊(囧,有點繞口)。

e、最後排除掉小數點後面的位置,也就是匹配的位置不能是在小數點之後的連續數字中。

正則表達式:(?<=\d)(?<!\.\d+)(?=(\d\d\d)+(?!\d))

替換結果:今年的營業額爲112,347,915.5465萬元


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章