sed命令詳解

注意,這篇文章博主修改過原作者的文章

1. 簡介

sed命令是一個很強大的文本編輯器,可以對來自文件、以及標準輸入的文本進行編輯。

執行時,sed會從文件或者標準輸入中讀取一行,將其複製到緩衝區,對文本編輯完成之後,讀取下一行直到所有的文本行都編輯完畢。

所以sed命令處理時只會改變緩衝區中文本的副本,如果想要直接編輯原文件,可以使用-i選項或者將結果重定向到新的文件中。

sed命令的基本語法如下:

sed [options] commands [inputfile...]

options表示sed命令的一些選項,常見的選項如下表:

選項名 作用
-n 取消默認輸出
-e 多點編輯,可以執行多個子命令
-f 從腳本文件中讀取命令(sed操作可以事先寫入腳本,然後通過-f讀取並執行)
-i 直接編輯原文件
-l 指定行的長度
-r 在腳本中使用擴展表達式

[root@www ~]# sed [-nefr] [動作]
選項與參數:
-n :使用安靜(silent)模式。在一般 sed 的用法中,所有來自 STDIN 的數據一般都會被列出到終端上。但如果加上 -n 參數後,則只有經過sed 特殊處理的那一行(或者動作)纔會被列出來。
-e :直接在命令列模式上進行 sed 的動作編輯;
-f :直接將 sed 的動作寫在一個文件內, -f filename 則可以運行 filename 內的 sed 動作;
-r :sed 的動作支持的是延伸型正規表示法的語法。(默認是基礎正規表示法語法)
-i :直接修改讀取的文件內容,而不是輸出到終端。

動作說明: [n1[,n2]]function
n1, n2 :不見得會存在,一般代表『選擇進行動作的行數』,舉例來說,如果我的動作是需要在 10 到 20 行之間進行的,則『 10,20[動作行爲] 』

function:
a :新增, a 的後面可以接字串,而這些字串會在新的一行出現(目前的下一行)~
c :取代, c 的後面可以接字串,這些字串可以取代 n1,n2 之間的行!
d :刪除,因爲是刪除啊,所以 d 後面通常不接任何咚咚;
i :插入, i 的後面可以接字串,而這些字串會在新的一行出現(目前的上一行);
p :列印,亦即將某個選擇的數據印出。通常 p 會與參數 sed -n 一起運行~
s :取代,可以直接進行取代的工作哩!通常這個 s 的動作可以搭配正規表示法!例如 1,20s/old/new/g 就是啦!

2. 應用場景

sed命令比較適用於大的文本文件,用普通文本編輯器難以勝任的情況。下面分別介紹直接打印、插入、刪除、替換等編輯操作。
   實驗用文件內容

#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566

(1)行打印,輸出緩衝區內容,使用sed的p子命令

sed '1,3 p' test1.txt
echo "====================="
sed -n '1,3 p' test1.txt

#輸出結果
letitia
letitia
mail
mail
uuencode
uuencode
1003605091
01566
=====================
letitia
mail
uuencode

p子命令代表print,可以打印出sed緩衝區內的內容。
sed命令中,直接採用數字代表某個特定的文本行:'1 p'代表打印第一行;'1,3 p'代表打印1到3行;特別的,最後一行的行號爲$。

觀察輸出結果,不使用-n選項時,sed命令把1到3行輸出了兩次。這是因爲不使用-n時,sed首先讀取一行,並默認將緩衝區內的文本輸出出來,之後p子命令再次輸出。使用-n時,默認輸出取消,只有p子命令的輸出結果。

sed -n '/^ma/,5 p' test1.txt

#輸出結果
mail
uuencode
1003605091
01566

sed命令支持正則表達式定位。語法爲/re/,re表示正則表達式。
本例表示打印出從匹配正則表達式的地方到第5行,也就是從匹配以ma開頭的文本行處開始。

sed -n '1~2 p' test1.txt

#輸出結果
letitia
uuencode
01566

1~2表示從第一行開始,行號遞增2輸出,即輸出奇數行。語法格式爲first~step

(2)插入文本行,追加文本行
這兩種情況很類似。插入文本使用i子命令,表示在指定位置前面插入文本;追加文本使用a子命令,表示在指定位置之後插入文本。觀察一下兩個的區別:

sed -n -e '2 i insert' -e '1,4 p' test1.txt 

#-e選項表示多個子命令,本例執行i子命令之後執行了p子命令
#輸出結果
letitia
insert
mail
uuencode
1003605091
sed -n -e '2 a insert' -e '1,4 p' test1.txt

#輸出結果
letitia
mail
insert
uuencode
1003605091

(3)刪除文本行,使用d子命令

sed -n -e '2 d' -e '1,$ p' test1.txt

#輸出結果
letitia
uuencode
1003605091
01566

(4)替換文本行,使用c子命令

sed -n -e '2 c newmail' -e '1,$ p' test1.txt

#輸出結果
letitia
newmail
uuencode
1003605091
01566

【注】以上均未使用-i選項,所以更改的只是副本。

<b>(5)替換指定文本,使用s子命令</b>
這一個命令實用性很廣,並且靈活。語法也比之上面特別一些:

sed '位置參數 s/pattern/replaced/[flag]'

pattern爲要替換的文本,支持正則表達式,replaced表示用來替換的一般字符串(不支持正則表達式)。

flag是替換標誌,用來影響匹配替換的規則:

flag 用法
g 全局匹配,會替換文本行中所有匹配的字符串
十進制n 替換文本行中第n個匹配的字符串
p 替換第一個匹配的字符串,並且將緩衝區輸出到標準輸出
w 替換第一個匹配的字符串,並且將改動的行輸出到磁盤文件中
缺省 替換第一個匹配的字符串
sed -n -e 's/[0-9]\{10\}/miss letitia/g' -e '1,$ p' test1.txt
#{}要轉義,因爲此處使用的不是擴展正則表達式

#輸出結果
letitia
mail
uuencode
miss letitia
01566
sed -n -e '1,/^ma/ s/l/L/g' -e '1,$ p' test1.txt

#輸出結果
Letitia
maiL
uuencode
miss letitia
01566
#可以看到,本例將前兩行裏的l替換爲L。
sed -n '1,3{
            s/l/L/g
            s/e/E/g
            2 i tyrone
            p
            }' test1.txt

#輸出結果
LEtitia
tyrone
maiL
uuEncodE

最後這個例子比較複雜。使用大括號,表示對1到3行做了一組操作。

3. 其他的小事

  • 以上都是採用了文件輸入做實驗,也可以採用其他方式,例如
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
#將grep的結果作爲輸入,注意要用反引號括起來,將括號內部分解釋爲linux命令
  • 當用戶的編輯操作比較複雜時,建議使用sed腳本文件。
  • 同正則表達式一樣,匹配元字符時要用轉義。使用基本正則表達式時,{}等也要轉義。



作者:tyrone_li
鏈接:https://www.jianshu.com/p/89163e927a2c
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯繫作者獲得授權並註明出處。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章