Java String.ReplaceAll捕獲組用法(正則表達式捕獲組及命名捕獲組)

一、基礎說明

public String replaceAll(String regex, String replacement) 使用replacement替換字符串中和regex匹配的所有子串,
regex正則表達式,源碼:

  /** 
   * @since 1.4
   * @spec JSR-51
   */
    public String replaceAll(String regex, String replacement) {
        return Pattern.compile(regex).matcher(this).replaceAll(replacement);
    }

請注意區分
public String replace(CharSequence target, CharSequence replacement)

public String replace(CharSequence target, CharSequence replacement)源碼

  /**
    * 使用replacement替換字符串中所有和target匹配的子串
    * 從字符串開始到結尾依次替換
    * 例如:“aaa”.replace("aa","b"),結果爲“ba”,而不是“ab”
    *
    * @since 1.5
    */
   public String replace(CharSequence target, CharSequence replacement) {
       return Pattern.compile(target.toString(), Pattern.LITERAL).matcher(this).replaceAll(Matcher.quoteReplacement(replacement.toString()));
   }

從源碼可以看出,兩者都是使用的Matcher.replaceAll(String replacement)

二、捕獲組用法

replaceAll的一般用法就不介紹了,直接說捕獲組用法,示例代碼

String phone = "18310005432";
phone = phone.replaceAll("(\\d{3})\\d+(\\d{4})", "$1****$2");
System.out.println(phone);// 183****5432

捕獲組是正則表達式中的概念,如上例中(\\d{3})\\d+(\\d{4}),一個括號()爲一個捕獲組,捕獲組按左括號先後順序編號,(\\d{3}) 爲1號,(\\d{4})爲2號,整個正則表達式爲0號捕獲組,可以使用$加編號(索引)對捕獲組進行引用

  • jdk 中文API在這裏插入圖片描述
  • 英文原版
    在這裏插入圖片描述
    上文示例代碼理解,(\\d{3})\\d+(\\d{4}) 匹配整個字符串,其中捕獲組1(\\d{3})匹配到183,捕獲組2(\\d{4})匹配到5432,$1****$2$1 是對1組匹配值的引用,$2同理

三、命名捕獲組

我們可以給捕獲組起名字,方便引用,適用於包含大量捕獲組的正則表達式

  • 命名方式:
    (?<NAME>A),捕獲組A被命名爲NAME,例:(?<n1>\\d{3}),名字僅允許[A-Za-z0-9]
  • 引用
    • \k<Name> 正則表達式內部引用前面定義過的捕獲組,k大概是back的意思backref(回引),例:(?<char>.{1})\\k<char>*;
    • ${Name}在Matcher’s replacement 字符串中引用命名捕獲組;
    • group(String NAME)Matcher的group方法,返回命名捕獲組匹配到的子串;
  • 用例
String phone = "18310005432";
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****${n2}"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n1}****$2"));
System.out.println(phone.replaceAll("(?<n1>\\d{3})\\d+(?<n2>\\d{4})", "${n2}****$2"));
  • 複雜用例
String input = "aabbbccdddef";
String regex = "(?<char>.{1})\\k<char>*";
//Matcher用法
Pattern pattern = Pattern.compile(regex);
Matcher matcher=pattern.matcher(input);
while(matcher.find()) {
   System.out.println(matcher.group()+":"+matcher.group(0)+":"+matcher.group(1)+":"+matcher.group("char"));
}
//replaceAll
String temp = input.replaceAll(regex, "$0,");
String[] arr = temp.split(",");
System.out.println(java.util.Arrays.toString(arr));

(?<char>.{1})\\k<char>* 理解 (?<char>.{1})匹配一個字符,\\k<char>*零個或多個該字符
group()內部調用的group(0)
group(1)和group(“char”)都是指向第一個捕獲組

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章