Shell中的IFS解惑

一、IFS 介紹

     Shell 腳本中有個變量叫 IFS(Internal Field Seprator) ,內部域分隔符。完整定義是The shell uses the value stored in IFS, which is the space, tab, and newline characters by default, to delimit words for the read and set commands, when parsing output from command substitution, and when performing variable substitution.

     Shell 的環境變量分爲 set, env 兩種,其中 set 變量可以通過 export 工具導入到 env 變量中。其中,set 是顯示設置shell變量,僅在本 shell 中有效;env 是顯示設置用戶環境變量 ,僅在當前會話中有效。換句話說,set 變量裏包含了 env 變量,但 set 變量不一定都是 env 變量。這兩種變量不同之處在於變量的作用域不同。顯然,env 變量的作用域要大些,它可以在 subshell 中使用。

     而 IFS 是一種 set 變量,當 shell 處理"命令替換"和"參數替換"時,shell 根據 IFS 的值,默認是 space, tab, newline 來拆解讀入的變量,然後對特殊字符進行處理,最後重新組合賦值給該變量。

二、IFS 簡單實例

1、查看變量 IFS 的值。

  1. $ echo $IFS  
  2.   
  3. $ echo "$IFS" | od -b  
  4. 0000000 040 011 012 012  
  5. 0000004  

直接輸出IFS是看不到的,把它轉化爲二進制就可以看到了,"040"是空格,"011"是Tab,"012"是換行符"\n" 。最後一個 012 是因爲 echo 默認是會換行的。

2、$* 和 $@ 的細微差別
     從下面的例子中可以看出,如果是用冒號引起來,表示這個變量不用IFS替換!!所以可以看到這個變量的"原始值"。反之,如果不加引號,輸出時會根據IFS的值來分割後合併輸出! $* 是按照IFS中的第一個值來確定的!下面這兩個例子還有細微的差別!

  1. $ IFS=:;  
  2. $ set x y z  
  3. $ echo $*  
  4. x y z  
  5. $ echo "$*"  
  6. x:y:z  
  7. $ echo $@  
  8. x y z  
  9. $ echo "$@"  
  10. x y z  

 

上例 set 變量其實是3個參數,而下面這個例子實質是2個參數,即 set "x y z"  和 set x y z 是完全不同的。

  1. $ set "x" "y z"  
  2. $ echo $*  
  3. x y z  
  4. $ echo "$*"  
  5. x:y z  
  6. $ echo $@  
  7. x y z  
  8. $ echo "$@"  
  9. x y z  
  10. $ echo $* |od -b  
  11. 0000000 170 040 171 040 172 012  
  12. 0000006  
  13. $ echo "$*" |od -b  
  14. 0000000 170 072 171 040 172 012  
  15. 0000006  

小結:$* 會根據 IFS 的不同來組合值,而 $@ 則會將值用" "來組合值!

3、for 循環中的奇怪現象

  1. $ for x in $var ;do echo $x |od -b ;done  
  2. 0000000 012  
  3. 0000001  
  4. 0000000 040 141 012  
  5. 0000003  
  6. 0000000 142 012  
  7. 0000002  
  8. 0000000 012  
  9. 0000001  
  10. 0000000 143 012  
  11. 0000002  

 

先暫且不解釋 for 循環的內容!看下面這個輸出!IFS 的值同上! var=": a:b::c:"

  1. $ echo $var |od -b  
  2. 0000000 040 040 141 040 142 040 040 143 012  
  3. 0000011  
  4. $ echo "$var" |od -b  
  5. 0000000 072 040 141 072 142 072 072 143 072 012  
  6. 0000012  

"$var"的值應該沒做替換,所以還是 ": a:b::c:" (注 "072" 表示冒號),但是$var 則發生了變化!注意輸出的最後一個冒號沒有了,也沒有替換爲空格!Why?

 

使用 $var 時是經歷了這樣一個過程!首先,按照這樣的規則 [變量][IFS][變量][IFS]……根據原始 var 值中所有的分割符(此處是":")劃分出變量,如果IFS的值是有多個字符組成,如IFS=":;",那麼此處的[IFS]指的是IFS中的任意一個字符($* 是按第一個字符來分隔!),如 ":" 或者 ";" ,後面不再對[IFS]做類似說明!(注:[IFS]會有多個值,多虧 #blackold 的提醒);然後,得到類似這樣的 list, ""   " a"   "b"  ""   "c"  。如果此時 echo $var,則需要在這些變量之間用空格隔開,也就是""  [space]   "  a"  [space]  "b" [space]  "" [space]  "c" ,忽略掉空值最終輸出是 [space][space]a[space]b[space][space]c

如果最後一個字符不是分隔符,如 var="a:b",那麼最後一個分隔符後的變量就是最後一個變量!

這個地方要注意下!!如果IFS就是空格,那麼類似於" [space][space]a[space]b[space][space]c "會合並重復的部分,且去頭空格,去尾空格,那麼最終輸出會變成類似 a[space]b[space]c ,所以,如果IFS是默認值,那麼處理的結果就很好算出來,直接合並、忽略多餘空格即可!

另外,$* 和 $@ 在函數中的處理過程是這樣的(只考慮"原始值"!)!"$@",就是像上面處理後賦值,但是 "$*" 卻不一樣!它的值是用分隔符(如":")而不是空格隔開!具體例子見最後一個例子!

好了,現在來解釋 for 循環的內容。for 循環遍歷上面這個列表就可以了,所以 for 循環的第一個輸出是空!("012"是echo輸出的換行符 )。。。。後面的依次類推!不信可以試試下面這個例子,結果是一樣的!

  1. $ for x in "" " a" "b" "" "c" ;do echo $x |od -b ;done  
  2. 0000000 012  
  3. 0000001  
  4. 0000000 040 141 012  
  5. 0000003  
  6. 0000000 012  
  7. 0000001  
  8. 0000000 142 012  
  9. 0000002  
  10. 0000000 012  
  11. 0000001  
  12. 0000000 143 012  
  13. 0000002  

三、IFS的其他實例

Example 1:

 

  1. $ IFS=:  
  2. $ var=ab::cd  
  3. $ echo $var  
  4. ab  cd  
  5. $ echo "$var"  
  6. ab::cd  

解釋下:x 的值是 "ab::cd",當進行到 echo $x 時,因爲$符,所以會進行變量替換。Shell 根據 IFS 的值將 x 分解爲 ab "" cd,然後echo,插入空隔,ab[space]""[space]cd,忽略"",輸出  ab  cd 。

Example 2 :

  1. $ read a  
  2.        xy  z  
  3. $ echo $a  
  4. xy  z  

 

解釋:這是 http://bbs.chinaunix.net/thread-207178-1-1.html 上的一個例子。此時IFS是默認值,本希望把所有的輸入(包括空格)都放入變量a中,但是輸出的a卻把前面的空格給忽略了!!原因是:默認的 IFS 會按 space tab newline 來分割。這裏需要注意的一點是,read 命令的實現過程,即在讀入時已經替換了。解決辦法是在開頭加上一句 IFS=";" ,這裏必須加上雙引號,因爲分號有特殊含義。

Example 3 :

  1. $ tmp="   xy z"  
  2. $ a=$tmp  
  3. $ echo $a  
  4. $ echo "$a"  

解釋:什麼時候會根據 IFS 來"處理"呢?我覺得是,對於不加引號的變量,使用時都會參考IFS,但是要注意其原始值!

Example 4 :

  1. #!/bin/bash  
  2. IFS_old=$IFS      #將原IFS值保存,以便用完後恢復  
  3. IFS=$’\n’        #更改IFS值爲$’\n’ ,注意,以回車做爲分隔符,IFS必須爲:$’\n’  
  4. for i in $((cat pwd.txt)) #pwd.txt 來自這個命令:cat /etc/passwd >pwd.txt  
  5. do  
  6.     echo $i  
  7. done  
  8. IFS=$IFS_old      #恢復原IFS值  

另外一個例子,把IP地址逆轉輸出:

Example 5 :

  1. #!/bin/bash  
  2.   
  3. IP=220.112.253.111  
  4. IFS="."  
  5. TMPIP=$(echo $IP)  
  6. IFS=" " # space  
  7. echo $TMPIP  
  8. for x in $TMPIP ;do   
  9.     Xip="${x}.$Xip"  
  10. done  
  11. echo ${Xip%.}  

Complex_Example 1:  http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=3660898&page=1#pid21798049

  1. function output_args_ifs(){  
  2.     echo "=$*"  
  3.     echo "="$*  
  4.     for m in $* ;do   
  5.         echo "[$m]"  
  6.     done  
  7. }  
  8.   
  9. IFS=':'  
  10. var='::a:b::c:::'  
  11. output_args_ifs $var  

 

輸出爲:

  1. =::a:b::c::  # 少了最後一個冒號!看前面就知道爲什麼了  
  2. =  a b  c   
  3. []  
  4. []  
  5. [a]  
  6. [b]  
  7. []  
  8. [c]  
  9. []  

由於 "output_args_ifs $var" 中 $var 沒有加引號,所以根據IFS替換!根據IFS劃分出變量: ""  ""  "a"  "b"  ""  "c" "" ""(可以通過輸出 $# 來測試參數的個數!),重組的結果爲

 "$@" 的值是  "" [space] "" [space]  "a" [space]  "b"  [space] "" [space]  "c" [space] "" [space] "",可以通過,echo==>"  a b  c   "
"$*" 的值是   "" [IFS] "" [IFS]  "a" [IFS]  "b"  [IFS] "" [IFS]  "c" [IFS] "" [IFS] "",忽略"",echo=>"::a:b::c::"

注意, $* 和 $@ 的值都是  ""   ""   "a"   "b"   ""   "c"  ""  "" 。可以說是一個列表……因爲他們本來就是由 $1 $2 $3……組成的。

所以,《Linux程序設計》裏推薦使用 $@,而不是$*

總結:IFS 其實還是很麻煩的,稍有不慎就會產生很奇怪的結果,因此使用的時候要注意!我也走了不少彎路,只希望能給後來者一些幫助。本文若有問題,歡迎指正!!謝謝!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章