入門正則表達式

入門正則表達式

         正則表達式(百科),一直在學習,一直在忘記,一直在不經意間用到它,想想自己,或許真的很笨,時至今日,仍只會些皮毛的匹配,始終沒有得到要領。可是工作在繼續,每當自己孤軍作戰至深夜,似乎總也看不到正確的正則表達式在無邊的黑夜裏向我招手。頭疼至極,不得已向BBS上的A大,水版等高手求救。很快,那幾個精煉的字符便一掃自己的鬱悶,有時晃然明白,有些個圈內的朋友是多麼地好!可以讓自己少走很多彎路。

         可是朋友終究只會救自己於一時,不能一世,如何在他們的HELP之下讓自己也會“漁”?總結一些方法,希望有路過的朋友多多指教。

方法1. 用到時,不能第一時間寫出來,速查簡明的教程,如:正則表達式30分鐘入門教程  優勢很明顯,這種實戰型教程不像有些教科書那樣晦澀難懂,它更像一本字典,如今我將這個教程打印出來,放在案邊,能解決我大部分問題,並且在我有時間時,將用過的複習一下並反覆地看教程,我相信多好,終究會慢慢看更多的東西出來。

方法2. 每次上BBS上看這類的貼子,遇到不懂的,或者感覺有理解難度的,先收藏之,過後,反覆學習和調試他人的方法。如:

   實例1:去除以下配置文件中的重複行(該配置文件可能有幾十萬行):

  1. 配置文件XXX.ini內容如下:  
  2. [config]  
  3. key=一心一意  
  4. key=三心二意  
  5. key=十全十美  
  6. key=百年好合  
  7. key=千金萬馬  
  8. key=萬馬奔騰  
  9. key=狗急跳牆  
  10. key=紙上談兵  
  11. key=虎虎生威  
  12. key=高瞻遠矚  
  13. key=一心一意 

水版給的答案是:

  1. $sText = FileRead('XXX.ini')  
  2. $sRer = StringRegExpReplace($sText, '(key=.+)(?=[^\1]+\1)''')  
  3. $sRer = StringRegExpReplace($sRer, '^\v+|\r?\n(?=\r?\n)|\r?\n$''') ;去掉之前遺留下來的空行!  
  4. MsgBox(0, '', $sRer) 

實例2:從一個字符串中提取出IP地址:

A大的:

  1. Local $Str = '\\192.168.8.30\log\yanshi' 
  2. Local $Test = StringRegExpReplace($str, '.*\\((?:\d+\.){3}\d+)\\.*''$1')  
  3. MsgBox(0, '替換結果', $Test)  
  4.  
  5. 匹配模式也可以:  
  6. Local $Str = '\\192.168.8.30\log\yanshi' 
  7. Local $Test = StringRegExp($str, '(?:\d+\.){3}\d+', 1)  
  8. If Not @Error Then MsgBox(0, '', $Test[0]) 

 匹配最後一行:

  1. stringregexp($str,'.+$',3) 

取所在地:

  1. Global $sText  
  2. $Source = _INetGetSource('http://www.ip138.com/ips.asp?ip=' & InputBox("IP""請輸入IP地址"))  
  3. $aRe = StringRegExp($Source, '(?<=<li>)[^<]+', 3)  
  4. For $i = 0 To UBound($aRe) - 1  
  5.         $sText &= $aRe[$i] & @CRLF  
  6. Next 
  7. MsgBox(0, '', $sText) 

附一些網上廣爲流傳轉載的【不怎麼嚴謹,若用於工作中請謹慎測試一下】:

  1. 匹配HTML標記的正則表達式:<(\S*?)[^>]*>.*?</\1>|<.*? />  
  2. 評註:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於複雜的嵌套標記依舊無能爲力  
  3.  
  4. 匹配首尾空白字符的正則表達式:^\s*|\s*$  
  5. 評註:可以用來刪除行首行尾的空白字符(包括空格、製表符、換頁符等等),非常有用的表達式  
  6.  
  7. 匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*  
  8. 評註:表單驗證時很實用  
  9.  
  10. 匹配網址URL的正則表達式:[a-zA-z]+://[^\s]*  
  11. 評註:網上流傳的版本功能很有限,上面這個基本可以滿足需求  
  12.  
  13. 匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$  
  14. 評註:表單驗證時很實用  
  15.  
  16. 匹配國內電話號碼:\d{3}-\d{8}|\d{4}-\d{7}  
  17. 評註:匹配形式如 0511-4405222 或 021-87888822  
  18.  
  19. 匹配騰訊QQ號:[1-9][0-9]{4,}  
  20. 評註:騰訊QQ號從10000開始  
  21.  
  22. 匹配中國郵政編碼:[1-9]\d{5}(?!\d)  
  23. 評註:中國郵政編碼爲6位數字  
  24.  
  25. 匹配身份證:
  26. ^\d{14}\w|\d{17}\w$
    或者:
    ^\d{14}\d{3}?\w$
     
  27. 評註:中國的身份證爲15位或18位  
  28.  
  29. 匹配ip地址: $bdz="^\d{1,3}$"
                            $aReturn = StringRegExp($csz,$bdz, 3)
                            If Not IsArray($aReturn) Then
                                    MsgBox(64,"警告",$dailiip & " 中的 " & $csz & " 不是有效IP地址範圍!")
                                       $IPchajieq= 1                                                       
                            Else
                                    If $csz > 255 Then                                       
                                            MsgBox(64,"警告",$dailiip & " 中的 " & $csz & " IP數值超出!")
                                            $IPchajieq= 1                                              
                                    EndIf
          EndIf
  30. 評註:提取ip地址時有用  
  31.  
  32. 匹配特定數字:  
  33. ^[1-9]\d*$    //匹配正整數  
  34. ^-[1-9]\d*$   //匹配負整數  
  35. ^-?[1-9]\d*$   //匹配整數  
  36. ^[1-9]\d*|0$  //匹配非負整數(正整數 + 0)  
  37. ^-[1-9]\d*|0$   //匹配非正整數(負整數 + 0)  
  38. ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$   //匹配正浮點數  
  39. ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$  //匹配負浮點數  
  40. ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$  //匹配浮點數  
  41. ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$   //匹配非負浮點數(正浮點數 + 0)  
  42. ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$  //匹配非正浮點數(負浮點數 + 0)  
  43. 評註:處理大量數據時有用,具體應用時注意修正  
  44.  
  45. 匹配特定字符串:  
  46. ^[A-Za-z]+$  //匹配由26個英文字母組成的字符串  
  47. ^[A-Z]+$  //匹配由26個英文字母的大寫組成的字符串  
  48. ^[a-z]+$  //匹配由26個英文字母的小寫組成的字符串  
  49. ^[A-Za-z0-9]+$  //匹配由數字和26個英文字母組成的字符串  
  50. ^\w+$  //匹配由數字、26個英文字母或者下劃線組成的字符串  
  51. 評註:最基本也是最常用的一些表達式 

 

方法三:多參與一些老大們在BBS上的學習測試,多寫,盡力去嘗試。無數的實戰一定能煉成神功。呵呵

方法四:用一些功能豐富便利的調試工具,比如上邊入門教程中提到的,我自己用的是A版自己開發的,發上來跟大家分享,見附件。

我會堅持學習它,希望自己能夠駕馭,輕鬆用於工作中。若路過的您有更好的方法,請您多多指教我這個菜鳥。

感謝!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章