Linux Shell 通配符、元字符、轉義符使用實例介紹

http://www.cnblogs.com/chengmo/archive/2010/10/17/1853344.html


說到shell通配符(wildcard),大家在使用時候會經常用到。下面是一個實例:

1
 
1
2
3
4
[chengmo@localhost ~/shell]$ ls
a.txt  b.txt  c.old
 
#2
1
2
3
4
[chengmo@localhost ~/shell]$ ls *.txt
a.txt  b.txt
 
#3
1
2
[chengmo@localhost ~/shell]$ ls d*.txt
ls: 無法訪問 d*.txt: 沒有那個文件或目錄

從上面這個實例,不知道大家有沒有發現問題呢。我們先了解一下,通配符相關知識,再分析下這個實例吧。

一、linux shell通配符(wildcard)

通配符是由shell處理的(不是由所涉及到命令語句處理的,其實我們在shell各個命令中也沒有發現有這些通配符介紹), 它只會出現在 命令的“參數”裏(它不用在 命令名稱裏, 也不用在 操作符上)。當shell在“參數”中遇到了通配符時,shell會將其當作路徑或文件名去在磁盤上搜尋可能的匹配:若符合要求的匹配存在,則進行代換(路徑擴展);否則就將該通配符作爲一個普通字符傳遞給“命令”,然後再由命令進行處理。總之,通配符 實際上就是一種shell實現的路徑擴展功能。在 通配符被處理後, shell會先完成該命令的重組,然後再繼續處理重組後的命令,直至執行該命令。

 

我們回過頭分析上面命令吧:在第2個命令中,*.txt 實際shell搜索文件,找到了符合條件的文件,命令會變成:ls a.txt b.txt ,實際在執行ls 時候傳給它的是a.txt b.txt .

 

而命令3,d*.txt 由於當前目錄下面沒有這樣的文件或目錄,直接將”d*.txt” 作爲ls 參數,傳給了 ls .這個時候”*” 只是一個普通的 ls 參數而已,已經失去了它通配意義。 由於找不到文件,所以會出現:無法訪問提示!

瞭解了shell通配符,我們現在看下,shell常見通配符有那一些了。

shell常見通配符:

字符 含義 實例
* 匹配 0 或多個字符 a*b  a與b之間可以有任意長度的任意字符, 也可以一個也沒有, 如aabcb, axyzb, a012b, ab。
? 匹配任意一個字符 a?b  a與b之間必須也只能有一個字符, 可以是任意字符, 如aab, abb, acb, a0b。
[list]  匹配 list 中的任意單一字符 a[xyz]b   a與b之間必須也只能有一個字符, 但只能是 x 或 y 或 z, 如: axb, ayb, azb。
[!list]  匹配 除list 中的任意單一字符 a[!0-9]b  a與b之間必須也只能有一個字符, 但不能是阿拉伯數字, 如axb, aab, a-b。
[c1-c2] 匹配 c1-c2 中的任意單一字符 如:[0-9] [a-z] a[0-9]b  0與9之間必須也只能有一個字符 如a0b, a1b... a9b。
{string1,string2,...} 匹配 sring1 或 string2 (或更多)其一字符串 a{abc,xyz,123}b    a與b之間只能是abc或xyz或123這三個字符串之一。

 

需要說明的是:通配符看起來有點象正則表達式語句,但是它與正則表達式不同的,不能相互混淆。把通配符理解爲shell 特殊代號字符就可。而且涉及的只有,*,? [] ,{} 這幾種。

 

 

二、shell元字符(特殊字符 Meta)

shell 除了有通配符之外,由shell 負責預先先解析後,將處理結果傳給命令行之外,shell還有一系列自己的其他特殊字符。

字符 說明
IFS 由 <space> 或 <tab> 或 <enter> 三者之一組成(我們常用 space )。
CR 由 <enter> 產生。
= 設定變量。
$ 作變量或運算替換(請不要與 shell prompt 搞混了)。
> 重導向 stdout。 *
< 重導向 stdin。 *
| 命令管線。 *
& 重導向 file descriptor ,或將命令置於背境執行。 *
( ) 將其內的命令置於 nested subshell 執行,或用於運算或命令替換。 *
{ } 將其內的命令置於 non-named function 中執行,或用在變量替換的界定範圍。
; 在前一個命令結束時,而忽略其返回值,繼續執行下一個命令。 *
&& 在前一個命令結束時,若返回值爲 true,繼續執行下一個命令。 *
|| 在前一個命令結束時,若返回值爲 false,繼續執行下一個命令。 *
! 執行 history 列表中的命令。*

加入”*” 都是作用在命令名直接。可以看到shell 元字符,基本是作用在命令上面,用作多命令分割(或者參數分割)。因此看到與通配符有相同的字符,但是實際上作用範圍不同。所以不會出現混淆。

 

以下是man bash 得到的英文解析:

metacharacter
              A character that, when unquoted, separates words.  One of the following:
              |  & ; ( ) < > space tab
control operator
              A token that performs a control function.  It is one of the following symbols:
              || & && ; ;; ( ) | <newline>

 

三、shell轉義符

有時候,我們想讓 通配符,或者元字符 變成普通字符,不需要使用它。那麼這裏我們就需要用到轉義符了。 shell提供轉義符有三種。

字符 說明
‘’(單引號) 又叫硬轉義,其內部所有的shell 元字符、通配符都會被關掉。注意,硬轉義中不允許出現’(單引號)。
“”(雙引號) 又叫軟轉義,其內部只允許出現特定的shell 元字符:$用於參數代換 `用於命令代替
\(反斜槓)   又叫轉義,去除其後緊跟的元字符或通配符的特殊意義。

man bash 英文解釋如下:

There are three quoting mechanisms: the escape character, single quotes, and double quotes.

實例:

 

1
2
3
4
5
6
7
8
9
10
11
[chengmo@localhost ~/shell]$ ls \*.txt
ls: 無法訪問 *.txt: 沒有那個文件或目錄
 
[chengmo@localhost ~/shell]$ ls '*.txt'
ls: 無法訪問 *.txt: 沒有那個文件或目錄
 
[chengmo@localhost ~/shell]$ ls 'a.txt'
a.txt
 
[chengmo@localhost ~/shell]$ ls *.txt
a.txt  b.txt

 

可以看到,加入了轉義符 “*”已經失去了通配符意義了。

四、shell解析腳本的過程

看到上面說的這些,想必大家會問到這個問題是,有這麼想特殊字符,通配符,那麼 shell在得到一條命令,到達是怎麼樣處理的呢?我們看下下面的圖:

1

如果用雙引號包括起來,shell檢測跳過了1-4步和9-10步,單引號包括起來,shell檢測就會跳過了1-10步。也就是說,雙引號 只經過參數擴展、命令代換和算術代換就可以送入執行步驟,而單引號轉義符直接會被送入執行步驟。而且,無論是雙引號轉義符還是單引號轉義符在執行的時候能夠告訴各個命令自身內部是一體的,但是其本身在執行時是並不是命令中文本的一部分。

發佈了41 篇原創文章 · 獲贊 5 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章