正則表達式

1,非打印字符

========================================================================================================
字符 描述

\cx             匹配由x指明的控制字符。例如,\cM匹配一個Control-M或回車符。x的值必須爲A-Z或a-z之一。否則將c視爲一個原義的'c'字符

\f              匹配一個換頁符

\n              匹配一個換行符

\r              匹配一個回車符

\s              匹配任何空白字符

\S              匹配任何非空白字符

\t              匹配一個製表符

\v              匹配一個垂直製表符

2,特殊字符

========================================================================================================
特殊字符 描述

$			匹配輸入字符串的結尾位置。如果設置了RegExp對象的Multiline屬性,則 $ 也匹配 '\n' 或 '\r'。

()          標記一個子表達式的開始和結束位置。子表達式可以獲取供以後使用。

*           匹配前面的子表達式0次或多次。

+           匹配前面的子表達式1次或多次。

.           匹配除換行符\n之外的任何單字符。要匹配 . ,    請輸入 \.  Java.lang.String.split("[.]")可以匹配 . )

[]          結合起來表示某特定類型的字符,如[abc]表示可以是abc中任意一個

?           匹配前面的子表達式0次或1次,或指明一個非貪婪限定符。

\           將下一個字符標記爲或特殊字符,或原義字符,或向後引用,或八進制轉義符。

^           表示模式必須出現在目標串的開始,除非在方括號表達式中使用,此時它表示不接受該字符集合。

{}          結合起來表示匹配的次數。例如ab{2}可匹配abb。ab{2,}表示至少2次,ab{2,4}表示至少2次,最多4次。

|           指明兩項之間的一個選擇。

3,預定義詞

========================================================================================================

字符          描述

\d          表示一個數字,同[0-9]

\D          表示一個非數字字符[^0-9]

\s          表示一個白字符,同[\t\n\x0b\f\r]

\S          表示一個非白字符,同[^\t\n\x0b\f\r]

\w          一個字符,可以是字母,數字或下劃線,同[a-zA-Z_0-9]

\W          一個字符,不能是字母,數字或下劃線,同[^a-zA-Z_0-9]

4,定位符

========================================================================================================

字符              描述
^               匹配輸入字符串開始的位置。如果設置了RegExp對象的Multiline屬性,^ 還會與 \n 或 \r 之後的位置匹配

$				匹配輸入字符串結尾的位置。如果設置了RegExp對象的Multiline屬性,$ 還會與 \n 或 \r 之後的位置匹配

\b              匹配一個字邊界,即字與空格間的位置

\B              非字邊界匹配



[注意:限定符不能和定位點一起使用。由於在緊靠換行或者字邊界的前面或後面不能有一個以上位置,因此不允許諸如 ^* 之類的表達式]

[注意:若要匹配一行文本開始處的文本,請在正則表達式的開始使用 ^ 字符。不要將 ^ 的這種用法與中括號表達式內的用法混淆]

[注意:若要匹配一行文本結束處的文本,請在正則表達式的結束處使用 $ 字符]

1.正則表達式基本語法

兩個特殊的符號’^’和’$’。他們的作用是分別指出一個字符串的開始和結束。例子如下:

"^The":表示所有以"The"開始的字符串("There","The cat"等);

"of despair$":表示所以以"of despair"結尾的字符串;

"^abc$":表示開始和結尾都是"abc"的字符串——呵呵,只有"abc"自己了;

"notice":表示任何包含"notice"的字符串。

其它還有’*’,’+’和’?’這三個符號,表示一個或一序列字符重複出現的次數。它們分別表示“沒有或
更多”,“一次或更多”還有“沒有或一次”。下面是幾個例子:

"ab*":表示一個字符串有一個a後面跟着零個或若干個b。("a", "ab", "abbb",……);

"ab+":表示一個字符串有一個a後面跟着至少一個b或者更多;

"ab?":表示一個字符串有一個a後面跟着零個或者一個b;

"a?b+$":表示在字符串的末尾有零個或一個a跟着一個或幾個b。

你也可以使用範圍,用大括號括起,用以表示重複次數的範圍。

"ab{2}":表示一個字符串有一個a跟着2個b("abb");

"ab{2,}":表示一個字符串有一個a跟着至少2個b;

"ab{3,5}":表示一個字符串有一個a跟着3到5個b。

請注意,你必須指定範圍的下限(如:”{0,2}”而不是”{,2}”)。還有,你可能注意到了,’*’,’+’和
‘?’相當於”{0,}”,”{1,}”和”{0,1}”。
還有一個’|’,表示“或”操作:

"hi|hello":表示一個字符串裏有"hi"或者"hello";

"(b|cd)ef":表示"bef"或"cdef";

"(a|b)*c":表示一串"a""b"混合的字符串後面跟一個"c";

‘.’可以替代任何字符:

"a.[0-9]":表示一個字符串有一個"a"後面跟着一個任意字符和一個數字;
"^.{3}$":表示有任意三個字符的字符串(長度爲3個字符);

方括號表示某些字符允許在一個字符串中的某一特定位置出現:

"[ab]":表示一個字符串有一個"a"或"b"(相當於"a¦b");

"[a-d]":表示一個字符串包含小寫的'a'到'd'中的一個(相當於"a¦b¦c¦d"或者"[abcd]");

"^[a-zA-Z]":表示一個以字母開頭的字符串;

"[0-9]%":表示一個百分號前有一位的數字;

",[a-zA-Z0-9]$":表示一個字符串以一個逗號後面跟着一個字母或數字結束。

你也可以在方括號裏用’^’表示不希望出現的字符,’^’應在方括號裏的第一位。(如:”%[^a-zA-Z]%”表
示兩個百分號中不應該出現字母)。

爲了逐字表達,你必須在”^.$()¦*+?{\”這些字符前加上轉移字符’\’。
請注意在方括號中,不需要轉義字符。

3.正則表達式的應用實例通俗說明


//校驗是否全由數字組成

^[0-9]{1,20}$

^ 表示打頭的字符要匹配緊跟^後面的規則

前面的規則

[ ] 中的內容是可選字符集

[0-9] 表示要求字符範圍在0-9之間

{1,20}表示數字字符串長度合法爲1到20,即爲[0-9]中的字符出現次數的範圍是1到20次。


//校驗登錄名:只能輸入5-20個以字母開頭、可帶數字、“_”、“.”的字串

^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$

^[a-zA-Z]{1} 表示第一個字符要求是字母。

([a-zA-Z0-9]|[.]){4,19} 表示從第二位開始(因爲它緊跟在上個表達式後面)的一個長度爲4到9位的字符串,它要求是由大小寫字母、數字或者特殊字符集[.]組成。


//校驗用戶姓名:只能輸入1-30個以字母開頭的字串

^[a-zA-Z]{1,30}$


//校驗密碼:只能輸入6-20個字母、數字、下劃線

^(\w){6,20}$

\w:用於匹配字母,數字或下劃線字符


//校驗普通電話、傳真號碼:可以“+”或數字開頭,可含有“-” 和 “ ”

^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$

\d:用於匹配從0到9的數字;

“?”元字符規定其前導對象必須在目標對象中連續出現零次或一次

可以匹配的字符串如:+123 -999 999 ; +123-999 999 ;123 999 999 ;+123 999999等


//校驗URL

^http[s]{0,1}:\/\/.+//http[s]0,1:\/\/.1,n
(表示url串的長度爲length(“https://”) + n )

\/ :表示字符“/”。

. 表示所有字符的集

  • 等同於{1,},就是1到正無窮吧。

//校驗純中文字符

^[\u4E00-\u9FA5]+$

[\u4E00-\u9FA5] :估計是中文字符集的範圍吧

4.正則表達式應用

^\d+(.\d+)*$ 數字

^[0-9][1-9][0-9]$ 正整數

^(-?\d+)(.\d+)?$ 浮點數

[\u4e00-\u9fa5] 中文字符

[^\x00-\xff] 雙字節字符包括中文

^[A-Za-z0-9]+$ 由數字和26個英文字母組成的字符串

\n[\s|]*\r 空行

^\w-*@[\w-]+(.[\w-]+)+$ EMail地址

\d{3}-\d{8}|\d{4}-\d{7} 國內電話號碼

\d{15}|\d{18} 身份證號

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章