lua string處理

  LUA中的正則表達式 

Step By Step(Lua字符串庫)

--------------------------------------------------------------------------------------------------
【基本函數】


string.gfind(s, pattern)
返回一個迭代器,迭代器每執行一次,返回下一個匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用於泛性for循環,下面的例子結果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
函數 描述 示例 結果
len 計算字符串長度 string.len("abcd") 4
rep 返回字符串s的n個拷貝 string.rep("abcd",2) abcdabcd
lower 返回字符串全部字母大寫 string.lower("AbcD") abcd
upper 返回字符串全部字母小寫 string.upper("AbcD") ABCD
format 返回一個類似printf的格式化字符串 string.format("the value is:%d",4) the value is:4
sub returns substring from index i to j of s string.sub("abcd",2) bcd
string.sub("abcd",-2) cd
string.sub("abcd",2,-2) bc
string.sub("abcd",2,3) bc
find 在字符串中查找
返回首次出現的起始和結束索引
string.find("cdcdcdcd","ab") nil
string.find("cdcdcdcd","cd") 1 2
string.find("cdcdcdcd","cd",7) 7 8
gsub 在字符串中替換
string.gsub(s, pattern, reps)
第1個參數:源字符串
第2個參數:待替換之模式串
第3個參數:替換爲reps(參數是table)
將s中所有符合pattern的字串替換爲reps,返回結果串+匹配數

string.gsub(s, pattern, func)
第3個參數:自定義函數,對找到的匹配操作,並傳出替換值

string.gfind(s, pattern)
返回一個迭代器,迭代器每執行一次,返回下一個匹配串;
iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")
print(iter()) <== a=b
print(iter()) <== c=d
通常用於泛性for循環,下面的例子結果同上
for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do
print(s)
end
string.gsub("abcdabcd","a","z"); zbcdzbcd 2
string.gsub("aaaa","a","z",3); zzza 3
byte 返回字符的整數形式 string.byte("ABCD",4) 68
char 將整型數字轉成字符並連接 string.char(97,98,99,100) abcd
--------------------------------------------------------------------------------------------------
【基本模式串】

字符類 描述 示例 結果
. 任意字符 string.find("",".") nil
%s 空白符 string.find("ab cd","%s%s") 3 4
%S 非空白符 string.find("ab cd","%S%S") 1 2
%p 標點字符 string.find("ab,.cd","%p%p") 3 4
%P 非標點字符 string.find("ab,.cd","%P%P") 1 2
%c 控制字符 string.find("abcd\t\n","%c%c") 5 6
%C 非控制字符 string.find("\t\nabcd","%C%C") 3 4
%d 數字 string.find("abcd12","%d%d") 5 6
%D 非數字 string.find("12abcd","%D%D") 3 4
%x 十六進制數字 string.find("efgh","%x%x") 1 2
%X 非十六進制數字 string.find("efgh","%X%X") 3 4
%a 字母 string.find("AB12","%a%a") 1 2
%A 非字母 string.find("AB12","%A%A") 3 4
%l 小寫字母 string.find("ABab","%l%l") 3 4
%L 大寫字母 string.find("ABab","%L%L") 1 2
%u 大寫字母 string.find("ABab","%u%u") 1 2
%U 非大寫字母 string.find("ABab","%U%U") 3 4
%w 字母和數字 string.find("a1()","%w%w") 1 2
%W 非字母非數字 string.find("a1()","%W%W") 3 4
--------------------------------------------------------------------------------------------------
【轉義字符%
用%進行轉義。'%%'代表'%'
字符類 描述 示例 結果
% 轉義字符 string.find("abc%..","%%") 4 4
string.find("abc..d","%.%.") 4 5
--------------------------------------------------------------------------------------------------
【用[]創建字符集,"-"爲連字符,"^"表示字符集的補集】

字符類 描述 示例 結果
[01] 匹配二進制數 string.find("32123","[01]") 3 3
[AB][CD] 匹配AC、AD、BC、BD string.find("ABCDEF","[AB][CD]") 2 3
[[]] 匹配一對方括號[] string.find("ABC[]D","[[]]") 4 5
[1-3] 匹配數字1-3 string.find("312","[1-3][1-3][1-3]") 1 3
[b-d] 匹配字母b-d string.find("dbc","[b-d][b-d][b-d]") 1 3
[^%s] 匹配任意非空字符 string.find(" a ","[^%s]") 3 3
[^%d] 匹配任意非數字字符 string.find("123a","[^%d]") 4 4
[^%a] 匹配任意非字母字符 string.find("abc1","[^%a]") 4 4
--------------------------------------------------------------------------------------------------
【用"()"進行捕獲】

字符類 描述 示例 結果
() 捕獲字符串 string.find("12ab","(%a%a)") 3 4 ab
string.find("ab12","(%d%d)") 3 4 12
--------------------------------------------------------------------------------------------------
【模式修飾符】

修飾符 描述 示例 結果
+ 表示1個或多個,匹配最多個 string.find("aaabbb","(a+b)") 1 4 aaab
string.find("cccbbb","(a+b)") nil
- 表示0個或多個,匹配最少個 string.find("zzxyyy","(xy-)") 3 3 x
string.find("zzzyyy","(x-y)") 4 4 y
* 表示0個或多個,匹配最多個 string.find("mmmnnn","(m*n)") 1 4 mmmb
string.find("lllnnn","(m*n)") 4 4 n
? 表示0個或1個 string.find("aaabbb","(a?b)") 3 4 ab
string.find("cccbbb","(a?b)") 4 4 b


下面的表列出了Lua支持的所有字符類:

. 任意字符

%s 空白符

%p 標點字符

%c 控制字符

%d 數字

%x 十六進制數字

%z 代表0的字符

%a 字母

%l 小寫字母

%u 大寫字母

%w 字母和數字

上面字符類的大寫形式表示小寫所代表的集合的補集。例如,'%A'非字母的字符:

模式串中的特殊字符

( ) . % + - * ? [ ^ $

'%' 用作特殊字符的轉義字符

'%.' 匹配點;

'%%' 匹配字符 '%'。

轉義字符 '%'不僅可以用來轉義特殊字符,還可以用於所有的非字母的字符。當對一個字符有疑問的時候,爲安全起見請使用轉義字符轉義他。

用'[]'創建字符集

'[%w_]' 匹配字母數字和下劃線

'[01]' 匹配二進制數字

'[%[%]]'匹配一對方括號

在'[]'中使用連字符'-'

'%d'    表示 '[0-9]';

'%x'    表示 '[0-9a-fA-F]'

'[0-7]' 表示 '[01234567]'

在'[]'開始處使用 '^' 表示其補集:

'[^0-7]' 匹配任何不是八進制數字的字符;

'[^\n]' 匹配任何非換行符戶的字符。

'[^%s]' == '%S'

模式修飾符

+ 匹配前一字符1次或多次

* 匹配前一字符0次或多次;最長匹配

- 匹配前一字符0次或多次;最短匹配

? 匹配前一字符0次或1次

^ 匹配字符串開頭 

$ 匹配字符串結尾

捕獲:用()將要捕獲的部分包圍起來

pair = "name = Anna"

firstidx, lastidx, key, value = string.find(pair, "(%a+)%s*=%s*(%a+)")

print(key, value) <== name Anna

拷貝捕獲(%1-%9)

s = "abc \"it\'s a cat\""

_,_,_,q = string.find(s, "([\"'])(.-)%1"))

print(q) <== it's a cat 如果%d代表第幾個捕獲的拷貝。

string.gsub(s, pattern, reps)

第1個參數:源字符串

第2個參數:待替換之模式串

第3個參數:替換爲reps

將s中所有符合pattern的字串替換爲reps,返回結果串+匹配數

print(string.gsub("hello, world", "o", "a"))       <== hella, warld        2

gsub也可以用拷貝捕獲技巧

print(string.gsub("hello, world", "(o)", "%1-%1")) <== hello-o, wo-orld    2

print(string.gsub("hello Lua", "(.)(.)", "%2%1")) <== ehll ouLa           4

function trim (s) return (string.gsub(s, "^%s*(.-)%s*$", "%1")) end <== 注意匹配數用括號丟棄

string.gsub(s, pattern, func)

第3個參數:自定義函數,對找到的匹配操作,並傳出替換值

s, n = string.gsub("hello world", "l+", function(s) return "xxx" end) 

print(s, n) <== hexxxo worxxxd 2

string.gfind(s, pattern)

返回一個迭代器,迭代器每執行一次,返回下一個匹配串;

iter = string.gfind("a=b c=d", "[^%s+]=[^%s+]")

print(iter()) <== a=b

print(iter()) <== c=d

通常用於泛性for循環,下面的例子結果同上

for s in string.gfind("a=b c=d", "[^%s+]=[^%s+]") do

print(s)

end




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章