1,非打印字符
========================================================================================================
字符 描述
\cx 匹配由x指明的控制字符。例如,\cM匹配一個Control-M或回車符。x的值必須爲A-Z或a-z之一。否則將c視爲一個原義的'c'字符
\f 匹配一個換頁符
\n 匹配一個換行符
\r 匹配一個回車符
\s 匹配任何空白字符
\S 匹配任何非空白字符
\t 匹配一個製表符
\v 匹配一個垂直製表符
2,特殊字符
========================================================================================================
特殊字符 描述
$ 匹配輸入字符串的結尾位置。如果設置了RegExp對象的Multiline屬性,則 $ 也匹配 '\n' 或 '\r'。
() 標記一個子表達式的開始和結束位置。子表達式可以獲取供以後使用。
* 匹配前面的子表達式0次或多次。
+ 匹配前面的子表達式1次或多次。
. 匹配除換行符\n之外的任何單字符。要匹配 . , 請輸入 \. Java.lang.String.split("[.]")可以匹配 . )
[] 結合起來表示某特定類型的字符,如[abc]表示可以是abc中任意一個
? 匹配前面的子表達式0次或1次,或指明一個非貪婪限定符。
\ 將下一個字符標記爲或特殊字符,或原義字符,或向後引用,或八進制轉義符。
^ 表示模式必須出現在目標串的開始,除非在方括號表達式中使用,此時它表示不接受該字符集合。
{} 結合起來表示匹配的次數。例如ab{2}可匹配abb。ab{2,}表示至少2次,ab{2,4}表示至少2次,最多4次。
| 指明兩項之間的一個選擇。
3,預定義詞
========================================================================================================
字符 描述
\d 表示一個數字,同[0-9]
\D 表示一個非數字字符[^0-9]
\s 表示一個白字符,同[\t\n\x0b\f\r]
\S 表示一個非白字符,同[^\t\n\x0b\f\r]
\w 一個字符,可以是字母,數字或下劃線,同[a-zA-Z_0-9]
\W 一個字符,不能是字母,數字或下劃線,同[^a-zA-Z_0-9]
4,定位符
========================================================================================================
字符 描述
^ 匹配輸入字符串開始的位置。如果設置了RegExp對象的Multiline屬性,^ 還會與 \n 或 \r 之後的位置匹配
$ 匹配輸入字符串結尾的位置。如果設置了RegExp對象的Multiline屬性,$ 還會與 \n 或 \r 之後的位置匹配
\b 匹配一個字邊界,即字與空格間的位置
\B 非字邊界匹配
[注意:限定符不能和定位點一起使用。由於在緊靠換行或者字邊界的前面或後面不能有一個以上位置,因此不允許諸如 ^* 之類的表達式]
[注意:若要匹配一行文本開始處的文本,請在正則表達式的開始使用 ^ 字符。不要將 ^ 的這種用法與中括號表達式內的用法混淆]
[注意:若要匹配一行文本結束處的文本,請在正則表達式的結束處使用 $ 字符]
1.正則表達式基本語法
兩個特殊的符號’^’和’$’。他們的作用是分別指出一個字符串的開始和結束。例子如下:
"^The":表示所有以"The"開始的字符串("There","The cat"等);
"of despair$":表示所以以"of despair"結尾的字符串;
"^abc$":表示開始和結尾都是"abc"的字符串——呵呵,只有"abc"自己了;
"notice":表示任何包含"notice"的字符串。
其它還有’*’,’+’和’?’這三個符號,表示一個或一序列字符重複出現的次數。它們分別表示“沒有或
更多”,“一次或更多”還有“沒有或一次”。下面是幾個例子:
"ab*":表示一個字符串有一個a後面跟着零個或若干個b。("a", "ab", "abbb",……);
"ab+":表示一個字符串有一個a後面跟着至少一個b或者更多;
"ab?":表示一個字符串有一個a後面跟着零個或者一個b;
"a?b+$":表示在字符串的末尾有零個或一個a跟着一個或幾個b。
你也可以使用範圍,用大括號括起,用以表示重複次數的範圍。
"ab{2}":表示一個字符串有一個a跟着2個b("abb");
"ab{2,}":表示一個字符串有一個a跟着至少2個b;
"ab{3,5}":表示一個字符串有一個a跟着3到5個b。
請注意,你必須指定範圍的下限(如:”{0,2}”而不是”{,2}”)。還有,你可能注意到了,’*’,’+’和
‘?’相當於”{0,}”,”{1,}”和”{0,1}”。
還有一個’|’,表示“或”操作:
"hi|hello":表示一個字符串裏有"hi"或者"hello";
"(b|cd)ef":表示"bef"或"cdef";
"(a|b)*c":表示一串"a""b"混合的字符串後面跟一個"c";
‘.’可以替代任何字符:
"a.[0-9]":表示一個字符串有一個"a"後面跟着一個任意字符和一個數字;
"^.{3}$":表示有任意三個字符的字符串(長度爲3個字符);
方括號表示某些字符允許在一個字符串中的某一特定位置出現:
"[ab]":表示一個字符串有一個"a"或"b"(相當於"a¦b");
"[a-d]":表示一個字符串包含小寫的'a'到'd'中的一個(相當於"a¦b¦c¦d"或者"[abcd]");
"^[a-zA-Z]":表示一個以字母開頭的字符串;
"[0-9]%":表示一個百分號前有一位的數字;
",[a-zA-Z0-9]$":表示一個字符串以一個逗號後面跟着一個字母或數字結束。
你也可以在方括號裏用’^’表示不希望出現的字符,’^’應在方括號裏的第一位。(如:”%[^a-zA-Z]%”表
示兩個百分號中不應該出現字母)。
爲了逐字表達,你必須在”^.$()¦*+?{\”這些字符前加上轉移字符’\’。
請注意在方括號中,不需要轉義字符。
3.正則表達式的應用實例通俗說明
//校驗是否全由數字組成
^[0-9]{1,20}$
^ 表示打頭的字符要匹配緊跟^後面的規則
[ ] 中的內容是可選字符集
[0-9] 表示要求字符範圍在0-9之間
{1,20}表示數字字符串長度合法爲1到20,即爲[0-9]中的字符出現次數的範圍是1到20次。
//校驗登錄名:只能輸入5-20個以字母開頭、可帶數字、“_”、“.”的字串
^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$
^[a-zA-Z]{1} 表示第一個字符要求是字母。
([a-zA-Z0-9]|[.]){4,19} 表示從第二位開始(因爲它緊跟在上個表達式後面)的一個長度爲4到9位的字符串,它要求是由大小寫字母、數字或者特殊字符集[.]組成。
//校驗用戶姓名:只能輸入1-30個以字母開頭的字串
^[a-zA-Z]{1,30}$
//校驗密碼:只能輸入6-20個字母、數字、下劃線
^(\w){6,20}$
\w:用於匹配字母,數字或下劃線字符
//校驗普通電話、傳真號碼:可以“+”或數字開頭,可含有“-” 和 “ ”
^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$
\d:用於匹配從0到9的數字;
“?”元字符規定其前導對象必須在目標對象中連續出現零次或一次
可以匹配的字符串如:+123 -999 999 ; +123-999 999 ;123 999 999 ;+123 999999等
//校驗URL
^http[s]{0,1}:\/\/.+
(表示url串的長度爲length(“https://”) + n )
\/ :表示字符“/”。
. 表示所有字符的集
- 等同於{1,},就是1到正無窮吧。
//校驗純中文字符
^[\u4E00-\u9FA5]+$
[\u4E00-\u9FA5] :估計是中文字符集的範圍吧
4.正則表達式應用
^\d+(.\d+)*$ 數字
^[0-9][1-9][0-9]$ 正整數
^(-?\d+)(.\d+)?$ 浮點數
[\u4e00-\u9fa5] 中文字符
[^\x00-\xff] 雙字節字符包括中文
^[A-Za-z0-9]+$ 由數字和26個英文字母組成的字符串
\n[\s|]*\r 空行
^\w-*@[\w-]+(.[\w-]+)+$ EMail地址
\d{3}-\d{8}|\d{4}-\d{7} 國內電話號碼
\d{15}|\d{18} 身份證號