IPV4地址由4個組數字組成,每組數字之間以.分隔,每組數字的取值範圍是0-255。
IPV4必須滿足以下四條規則:
1、任何一個1位或2位數字,即0-99;
2、任何一個以1開頭的3位數字,即100-199;
3、任何一個以2開頭、第2位數字是0-4之間的3位數字,即200-249;
4、任何一個以25開頭,第3位數字在0-5之間的3位數字,即250-255。
這樣把規則全部羅列出來之後,構造一個正則表達式的思路就清晰了。
首先滿足第一條規則的正則是:\d{1,2}
首先滿足第二條規則的正則是:1\d{2}
首先滿足第三條規則的正則是:2[0-4]\d
首先滿足第四條規則的正則是:25[0-5]
把它們組合起來,就得到一個匹配0-255數字的正則表達式了:
(\d{1,2})|(1\d{2})|(2[0-4]\d)|( 25[0-5])(中間用|連接)
IPV4由四組這樣的數字組成,中間由.隔開,或者說由三組數字和字符.和一組數字組成,所以匹配IPV4的正則表達式如下:
(((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))\.){3}((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))
Java測試代碼如下:
public static void matchAndPrint(String regex, String sourceText){
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(sourceText);
while(matcher.find()){
System.out.println(matcher.group());
}
}
public static void main(String[] args) {
String regex = "^(((\\d{1,2})|(1\\d{2})|(2[0-4]\\d)|(25[0-5]))\\.){3}((\\d{1,2})|(1\\d{2})|(2[0-4]\\d)|(25[0-5]))$";
matchAndPrint(regex, "23.135.2.255");
matchAndPrint(regex, "255.255.0.256");
matchAndPrint(regex, "0.0.0.0");
}
輸出結果如下:
23.135.2.255
0.0.0.0
這個正則有一個缺陷,就是如果不使用邊界匹配的話,像第二個測試IP 255.255.0.256也會被匹配到,匹配到的結果是255.255.0.25。可以添加限制條件,前後要麼是邊界,要麼是非數字,並且使用前後查找(lookaround),前後查找將在後面介紹。即:
(?<=(\\b|\\D))(((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))\.){3}((\d{1,2})|(1\d{2})|(2[0-4]\d)|(25[0-5]))(?=(\\b|\\D))
String regex = "(?<=(\\b|\\D))(((\\d{1,2})|(1\\d{2})|(2[0-4]\\d)|(25[0-5]))\\.){3}((\\d{1,2})|(1\\d{2})|(2[0-4]\\d)|(25[0-5]))(?=(\\b|\\D))";
參考:http://blogs.msdn.com/b/oldnewthing/archive/2006/05/22/603788.aspx