一、基礎說明
public String replaceAll(String regex, String replacement)
使用replacement
替換字符串中和regex
匹配的所有子串,
regex
爲正則表達式,源碼:
/**
* @since 1.4
* @spec JSR-51
*/
public String replaceAll(String regex, String replacement) {
return Pattern.compile(regex).matcher(this).replaceAll(replacement);
}
請注意區分
public String replace(CharSequence target, CharSequence replacement)
public String replace(CharSequence target, CharSequence replacement)
源碼
/**
* 使用replacement替換字符串中所有和target匹配的子串
* 從字符串開始到結尾依次替換
* 例如:“aaa”.replace("aa","b"),結果爲“ba”,而不是“ab”
*
* @since 1.5
*/
public String replace(CharSequence target, CharSequence replacement) {
return Pattern.compile(target.toString(), Pattern.LITERAL).matcher(this).replaceAll(Matcher.quoteReplacement(replacement.toString()));
}
從源碼可以看出,兩者都是使用的Matcher.replaceAll(String replacement)
二、捕獲組用法
replaceAll的一般用法就不介紹了,直接說捕獲組用法,示例代碼
String phone = "18310005432";
phone = phone.replaceAll("(\\d{3})\\d+(\\d{4})", "$1****$2");
System.out.println(phone);// 183****5432
捕獲組是正則表達式中的概念,如上例中(\\d{3})\\d+(\\d{4})
,一個括號()爲一個捕獲組,捕獲組按左括號先後順序編號,(\\d{3})
爲1號,(\\d{4})
爲2號,整個正則表達式爲0號捕獲組,可以使用$
加編號(索引)對捕獲組進行引用
- jdk 中文API
- 英文原版
上文示例代碼理解,(\\d{3})\\d+(\\d{4})
匹配整個字符串,其中捕獲組1(\\d{3})
匹配到183
,捕獲組2(\\d{4})
匹配到5432
,$1****$2
中$1
是對1組匹配值的引用,$2
同理
三、命名捕獲組
我們可以給捕獲組起名字,方便引用,適用於包含大量捕獲組的正則表達式
- 命名方式:
(?<NAME>A)
,捕獲組A被命名爲NAME,例:(?<n1>\\d{3})
,名字僅允許[A-Za-z0-9] - 引用
\k<Name>
正則表達式內部引用前面定義過的捕獲組,k大概是back的意思backref(回引),例:(?<char>.{1})\\k<char>*
;${Name}
在Matcher’s replacement 字符串中引用命名捕獲組;group(String NAME)
Matcher的group方法,返回命名捕獲組匹配到的子串;
- 用例
String phone = "18310005432";
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****${n2}"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****$2"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n2}****$2"));
- 複雜用例
String input = "aabbbccdddef";
String regex = "(?<char>.{1})\\k<char>*";
//Matcher用法
Pattern pattern = Pattern.compile(regex);
Matcher matcher=pattern.matcher(input);
while(matcher.find()) {
System.out.println(matcher.group()+":"+matcher.group(0)+":"+matcher.group(1)+":"+matcher.group("char"));
}
//replaceAll
String temp = input.replaceAll(regex, "$0,");
String[] arr = temp.split(",");
System.out.println(java.util.Arrays.toString(arr));
(?<char>.{1})\\k<char>*
理解 (?<char>.{1})
匹配一個字符,\\k<char>*
零個或多個該字符
group()內部調用的group(0)
group(1)和group(“char”)都是指向第一個捕獲組