JS——正則詳解

文章內容摘自阮一峯大大—RegExp對象，總結一下方便自己記憶：

1.正則匹配規則

字面量字符串

/dog/ 匹配 ‘dog’
元字符:

點字符（.） 匹配除回車（\r）、換行(\n) 、行分隔符（\u2028）和段分隔符（\u2029）以外的所有字符。
位置字符（^ / $） ^/$ 表示字符串開始/結束的位置
選擇符（|） 表示或關係，即cat|dog表示匹配cat或dog。選擇符會包括它前後的多個字符，比如/ab|cd/指的是匹配ab或者cd，而不是指匹配b或者c。如果想修改這個行爲，可以使用圓括號，即/a(b|c)d/
轉義字符

正則表達式中那些有特殊含義的字符，如果要匹配它們本身，就需要在它們前面要加上反斜槓。比如要匹配加號，就要寫成+。
正則模式中，需要用斜槓轉義的，一共有12個字符：^、.、[、$、(、)、|、*、+、?、{和\。需要特別注意的是，如果使用RegExp方法生成正則對象，轉義需要使用兩個斜槓，因爲字符串內部會先轉義一次。

特殊字符

\cX 表示Ctrl-[X]，其中的X是A-Z之中任一個英文字母，用來匹配控制字符。
[\b] 匹配退格鍵(U+0008)，不要與\b混淆。
\n 匹配換行鍵。
\r 匹配回車鍵。
\t 匹配製表符tab（U+0009）。
\v 匹配垂直製表符（U+000B）。
\f 匹配換頁符（U+000C）。
\0 匹配null字符（U+0000）。
\xhh 匹配一個以兩位十六進制數（\x00-\xFF）表示的字符。
\uhhhh 匹配一個以四位十六進制數（\u0000-\uFFFF）表示的unicode字符。

字符類

字符類（class）表示有一系列字符可供選擇，只要匹配其中一個就可以了。所有可供選擇的字符都放在方括號內，比如[xyz] 表示x、y、z之中任選一個匹配。
（1）.脫字符（^）
如果方括號內的第一個字符是[^]，則表示除了字符類之中的字符，其他字符都可以匹配。比如，[^xyz]表示除了x、y、z之外都可以匹配。
如果方括號內沒有其他字符，即只有[^]，就表示匹配一切字符，其中包括換行符，而點號（.）是不包括換行符的
（2）.連字符（-）
某些情況下，對於連續序列的字符，連字符（-）用來提供簡寫形式，表示字符的連續範圍。比如，[abc]可以寫成[a-c]，[0123456789]可以寫成[0-9]，同理[A-Z]表示26個大寫字母。注意：[1-31]，不代表1到31，只代表1到3。

預定義模式

\d 匹配0-9之間的任一數字，相當於[0-9]。
\D 匹配所有0-9以外的字符，相當於[^0-9]。
\w 匹配任意的字母、數字和下劃線，相當於[A-Za-z0-9_]。
\W 除所有字母、數字和下劃線以外的字符，相當於[^A-Za-z0-9_]。
\s 匹配空格（包括製表符、空格符、斷行符等），相等於[\t\r\n\v\f]。
\S 匹配非空格的字符，相當於[^\t\r\n\v\f]。
\b 匹配詞的邊界。
\B 匹配非詞邊界，即在詞的內部。

重複類

模式的精確匹配次數，使用大括號（{}）表示。{n}表示恰好重複n次，{n,}表示至少重複n次，{n,m}表示重複不少於n次，不多於m次。

量詞類

? 問號表示某個模式出現0次或1次，等同於{0, 1}。
* 星號表示某個模式出現0次或多次，等同於{0,}。
+ 加號表示某個模式出現1次或多次，等同於{1,}。

貪婪模式

默認情況下是最大可能匹配，即匹配直到下一個字符不滿足匹配規則爲止。這被稱爲貪婪模式。
如果想將貪婪模式改爲非貪婪模式，可以在量詞符後面加一個問號。

//貪婪模式
var s = 'aaa';
s.match(/a+/) // ["aaa"]
//非貪婪模式
var s = 'aaa';
s.match(/a+?/) // ["a"]

*?：表示某個模式出現0次或多次，匹配時採用非貪婪模式。
+?：表示某個模式出現1次或多次，匹配時採用非貪婪模式。

修飾符

修飾符（modifier）表示模式的附加規則，放在正則模式的最尾部。
修飾符可以單個使用，也可以多個一起使用。

g修飾符
默認情況下，第一次匹配成功後，正則對象就停止向下匹配了。g修飾符表示全局匹配（global），加上它以後，正則對象將匹配全部符合條件的結果，主要用於搜索和替換。

i修飾符
默認情況下，正則對象區分字母的大小寫，加上i修飾符以後表示忽略大小寫（ignorecase）。

m修飾符
m修飾符表示多行模式（multiline），會修改^和$的行爲。默認情況下（即不加m修飾符時），^和$匹配字符串的開始處和結尾處，加上m修飾符以後，^和$還會匹配行首和行尾，即^和$會識別換行符（\n）。

組匹配

正則表達式的括號表示分組匹配，括號中的模式可以用來匹配分組的內容。

var m = 'abcabc'.match(/(.)b(.)/);
m
// ['abc', 'a', 'c']

上面代碼中，正則表達式/(.)b(.)/一共使用兩個括號，第一個括號捕獲a，第二個括號捕獲c。
注意:使用組匹配時，不宜同時使用g修飾符，否則match方法不會捕獲分組的內容。

var m = 'abcabc'.match(/(.)b(.)/g);
m
// ['abc', 'abc']

在正則表達式內部，可以用\n引用括號匹配的內容，n是從1開始的自然數，表示對應順序的括號。

/(.)b(.)\1b\2/.test("abcabc") // true
/y(..)(.)\2\1/.test('yabccab') // true

上面的第一行代碼中，\1表示前一個括號匹配的內容（即“a”），\2表示第二個括號匹配的內容（即“b”）。

/y((..)\2)\1/.test('yabababab') // true   
括號還可以嵌套，此時\1指向外層括號，\2指向內層括號。

非捕獲組：
(?:x)稱爲非捕獲組（Non-capturing group），表示不返回該組匹配的內容，即匹配的結果中不計入這個括號。

var m = 'abc'.match(/(?:.)b(.)/);
m // ["abc", "c"]

上面代碼中的模式，一共使用了兩個括號。其中第一個括號是非捕獲組，所以最後返回的結果中沒有第一個括號，只有第二個括號匹配的內容。
先行斷言：
x(?=y)稱爲先行斷言（Positive look-ahead），x只有在y前面才匹配，y不會被計入返回結果。比如，要匹配後面跟着百分號的數字，可以寫成/\d+(?=%)/。

var m = 'abc'.match(/b(?=c)/);
m // ["b"]

先行否定斷言：
x(?!y)稱爲先行否定斷言（Negative look-ahead），x只有不在y前面才匹配，y不會被計入返回結果。比如，要匹配後面跟的不是百分號的數字，就要寫成/\d+(?!%)/。

/\d+(?!\.)/.exec('3.14')
// ["14"]

2.正則表達式

新建正則表達式有兩種方法。
一種是使用字面量，以斜槓表示開始和結束。
另一種是使用 RegExp 構造函數。

var regex = /xyz/;
var regex = new RegExp('xyz');

上面兩種寫法是等價的，都新建了一個內容爲xyz的正則表達式對象。它們的主要區別是，第一種方法在編譯時新建正則表達式，第二種方法在運行時新建正則表達式。

正則對象生成以後，有兩種使用方式：
正則對象的方法：將字符串作爲參數，比如regex.test(string)。
字符串對象的方法：將正則對象作爲參數，比如string.match(regex)。

正則對象的屬性

屬性分兩類
一類是修飾符相關，返回一個布爾值，表示對應的修飾符是否設置。

ignoreCase：返回一個布爾值，表示是否設置了i修飾符，該屬性只讀。
global：返回一個布爾值，表示是否設置了g修飾符，該屬性只讀。
multiline：返回一個布爾值，表示是否設置了m修飾符，該屬性只讀。

一類與修飾符無關的屬性，主要是下面兩個。

lastIndex：返回下一次開始搜索的位置。該屬性可讀寫，但是隻在設置了g修飾符時有意義。
source：返回正則表達式的字符串形式（不包括反斜槓），該屬性只讀。

正則對象的方法

（1）test
正則對象的test方法返回一個布爾值，表示當前模式是否能匹配參數字符
串。

/cat/.test('cats and dogs') // true

如果正則表達式帶有g修飾符，則每一次test方法都從上一次結束的位置開始向後匹配,還可以通過正則對象的lastIndex屬性指定開始搜索的位置。
lastIndex屬性只對同一個正則表達式有效

var count = 0;
while (/a/g.test('babaa')) count++;

上面代碼會導致無限循環，因爲while循環的每次匹配條件都是一個新的正則表達式，導致lastIndex屬性總是等於0。

new RegExp('').test('abc')
// true
如果正則模式是一個空字符串，則匹配所有字符串。

exec()

正則對象的exec方法，可以返回匹配結果。如果發現匹配，就返回一個數組，成員是每一個匹配成功的子字符串，否則返回null。

var s = '_x_x';
var r1 = /x/;
var r2 = /y/;

r1.exec(s) // ["x"]
r2.exec(s) // null

如果正則表示式包含圓括號（即含有“組匹配”），則返回的數組會包括多個成員。第一個成員是整個匹配成功的結果，後面的成員就是圓括號對應的匹配成功的組。也就是說，第二個成員對應第一個括號，第三個成員對應第二個括號，以此類推。整個數組的length屬性等於組匹配的數量再加1。

exec方法的返回數組還包含以下兩個屬性：
input：整個原字符串。
index：整個模式匹配成功的開始位置（從0開始計數）。

如果正則表達式加上g修飾符，則可以使用多次exec方法，下一次搜索的位置從上一次匹配成功結束的位置開始。

var r = /a(b+)a/g;

var a1 = r.exec('_abbba_aba_');
a1 // ['abbba', 'bbb']
a1.index // 1
r.lastIndex // 6

var a2 = r.exec('_abbba_aba_');
a2 // ['aba', 'b']
a2.index // 7
r.lastIndex // 10

var a3 = r.exec('_abbba_aba_');
a3 // null
a3.index // TypeError: Cannot read property 'index' of null
r.lastIndex // 0

var a4 = r.exec('_abbba_aba_');
a4 // ['abbba', 'bbb']
a4.index // 1
r.lastIndex // 6

當第三次匹配結束以後，整個字符串已經到達尾部，正則對象的lastIndex屬性重置爲0，意味着第四次匹配將從頭開始。
利用g修飾符允許多次匹配的特點，可以用一個循環完成全部匹配。

var r = /a(b+)a/g;
var s = '_abbba_aba_';

while(true) {
  var match = r.exec(s);
  if (!match) break;
  console.log(match[1]);
}
// bbb
// b

如果正則對象是一個空字符串，則exec方法會匹配成功，但返回的也是空字符串。

3.字符串對象的方法

match()：返回一個數組，成員是所有匹配的子字符串。
search()：按照給定的正則表達式進行搜索，返回一個整數，表示匹配開始的位置。
replace()：按照給定的正則表達式進行替換，返回替換後的字符串。
split()：按照給定規則進行字符串分割，返回一個數組，包含分割後的各個成員。

String.prototype.match()

字符串的match方法與正則對象的exec方法非常類似：匹配成功返回一個數組，匹配失敗返回null。
如果正則表達式帶有g修飾符，則該方法與正則對象的exec方法行爲不同，會一次性返回所有匹配成功的結果。
設置正則表達式的lastIndex屬性，對match方法無效，匹配總是從字符串的第一個字符開始。

String.prototype.search()

字符串對象的search方法，返回第一個滿足條件的匹配結果在整個字符串中的位置。如果沒有任何匹配，則返回-1。
正則表達式使用g修飾符之後，使用lastIndex屬性指定開始匹配的位置，結果無效，還是從字符串的第一個字符開始匹配。

String.prototype.replace()

字符串對象的replace方法可以替換匹配的值。它接受兩個參數，第一個是搜索模式，第二個是替換的內容。
搜索模式如果不加g修飾符，就替換第一個匹配成功的值，否則替換所有匹配成功的值。
replace方法的一個應用，就是消除字符串首尾兩端的空格。

var str = '  #id div.class  ';
str.replace(/^\s+|\s+$/g, '')
// "#id div.class"

replace方法的第二個參數可以使用美元符號$，用來指代所替換的內容。

$& 指代匹配的子字符串。
$` 指代匹配結果前面的文本。
$' 指代匹配結果後面的文本。
$n 指代匹配成功的第n組內容，n是從1開始的自然數。
$$ 指代美元符號$。

replace方法的第二個參數還可以是一個函數，將每一個匹配內容替換爲函數返回值。
作爲replace方法第二個參數的替換函數，可以接受多個參數。第一個參數是捕捉到的內容，第二個參數是捕捉到的組匹配（有多少個組匹配，就有多少個對應的參數）。此外，最後還可以添加兩個參數，倒數第二個參數是捕捉到的內容在整個字符串中的位置（比如從第五個位置開始），最後一個參數是原字符串。

String.prototype.split()

字符串對象的split方法按照正則規則分割字符串，返回一個由分割後的各個部分組成的數組。
該方法接受兩個參數，第一個參數是分隔規則，第二個參數是返回數組的最大成員數。

JS——正則詳解

1.正則匹配規則

字面量字符串

元字符:

轉義字符

特殊字符

字符類

預定義模式

重複類

量詞類

貪婪模式

修飾符

組匹配

2.正則表達式

正則對象的屬性

正則對象的方法

exec()

3.字符串對象的方法

String.prototype.match()

String.prototype.search()

String.prototype.replace()

String.prototype.split()

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

Shell/Python中的用戶名獲取

React-Native使用Nanohttpd實現跨平臺互傳文件

一些好用的小技巧

7月第四周

CSS縮寫屬性整理

7月第一週

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結