轉載地址:http://www.cnblogs.com/wenanry/archive/2010/09/06/1819552.html
正則表達式中有很多上述的具有特別意義的字符。首先是下列字符。
- [ ]
- 範圍描述符。[a-z]表示從a到z之間的任意一個。
- \w
- 英文字母和數字。即[0-9 A-Z a-z]。
- \W
- 非英文字母和數字
- \s
- 空字符,即[\t\n\r\f]。
- \S
- 非空字符。
- \d
- 數字,即[0-9]。
- \D
- 非數字。
- \b
- 詞邊界字符(在範圍描述符外部時)
- \B
- 非詞邊界字符
- \b
- 退格符(0x08)(在範圍描述符內部時)
- *
- 前面元素出現0次以上
- +
- 前面元素出現1次以上
- {m,n}
- 前面元素最少出現m次,最多出現n次
- ?
- 前面元素出現0次或1次
- |
- 選擇
- ( )
- 羣組
- 其他字符
- 該字符本身
常用正則式
匹配中文字符的正則表達式: [\u4e00-\u9fa5]
匹配雙字節字符(包括漢字在內):[^\x00-\xff]
匹配空行的正則表達式:\n[\s| ]*\r
匹配HTML標記的正則表達式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正則表達式:(^\s*)|(\s*$)
匹配IP地址的正則表達式:/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //
匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配網址URL的正則表達式:http://(/[\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
sql語句:^(select|drop|delete|create|update|insert).*$
1、非負整數:^\d+$
2、正整數:^[0-9]*[1-9][0-9]*$
3、非正整數:^((-\d+)|(0+))$
4、負整數:^-[0-9]*[1-9][0-9]*$
5、整數:^-?\d+$
6、非負浮點數:^\d+(\.\d+)?$
7、正浮點數:^((0-9)+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
8、非正浮點數:^((-\d+\.\d+)?)|(0+(\.0+)?))$
9、負浮點數:^(-((正浮點數正則式)))$
10、英文字符串:^[A-Za-z]+$
11、英文大寫串:^[A-Z]+$
12、英文小寫串:^[a-z]+$
13、英文字符數字串:^[A-Za-z0-9]+$
14、英數字加下劃線串:^\w+$
15、E-mail地址:^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$
16、URL:^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$
或:^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$
17、郵政編碼:^[1-9]\d{5}$
18、中文:^[\u0391-\uFFE5]+$
19、電話號碼:^((\(\d{2,3}\))|(\d{3}\-))?(\(0\d{2,3}\)|0\d{2,3}-)?[1-9]\d{6,7}(\-\d{1,4})?$
20、手機號碼:^((\(\d{2,3}\))|(\d{3}\-))?13\d{9}$
21、雙字節字符(包括漢字在內):^\x00-\xff
22、匹配首尾空格:(^\s*)|(\s*$)(像vbscript那樣的trim函數)
23、匹配HTML標記:<(.*)>.*<\/\1>|<(.*) \/>
24、匹配空行:\n[\s| ]*\r
25、提取信息中的網絡鏈接:(h|H)(r|R)(e|E)(f|F) *= *('|")?(\w|\\|\/|\.)+('|"| *|>)?
26、提取信息中的郵件地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
27、提取信息中的圖片鏈接:(s|S)(r|R)(c|C) *= *('|")?(\w|\\|\/|\.)+('|"| *|>)?
28、提取信息中的IP地址:(\d+)\.(\d+)\.(\d+)\.(\d+)
29、提取信息中的中國手機號碼:(86)*0*13\d{9}
30、提取信息中的中國固定電話號碼:(\(\d{3,4}\)|\d{3,4}-|\s)?\d{8}
31、提取信息中的中國電話號碼(包括移動和固定電話):(\(\d{3,4}\)|\d{3,4}-|\s)?\d{7,14}
32、提取信息中的中國郵政編碼:[1-9]{1}(\d+){5}
33、提取信息中的浮點數(即小數):(-?\d*)\.?\d+
34、提取信息中的任何數字 :(-?\d*)(\.\d+)?
35、IP:(\d+)\.(\d+)\.(\d+)\.(\d+)
36、電話區號:/^0\d{2,3}$/
37、騰訊QQ號:^[1-9]*[1-9][0-9]*$
38、帳號(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
39、中文、英文、數字及下劃線:^[\u4e00-\u9fa5_a-zA-Z0-9]+$