文本處理——sed初步

sed是一種流編輯器,它一次處理一行內容。
處理時,把當前處理的行存儲在臨時緩衝區(pattern space),同時輸出到屏幕,接着用sed命令處理緩衝區中的內容,接着讀取下一行,這樣不斷重複,直到文件末尾。

用法:

sed -[options] [操作] inputfile

-n:不輸出模式空間內容到屏幕,即不自動打印
-e: 多點編輯
-f:/PATH/SCRIPT_FILE: 從指定文件中讀取編輯腳本
-r: 支持使用擴展正則表達式
-i.bak: 原處編輯並且備份源文件(.bak可以改爲任意字符)

操作: [地址定界]function

地址定界:最簡單的是n1,n2function:從n1匹配到n2的行,然後進行操作比如:10,20[動作行爲]

單地址:
       #:指定的行
                /pattern/:被此模式匹配到的行,如果要使用擴展的正則表達式,則要使用-f選項
            地址範圍:
       #,#從行到行
                #,+#:比如3,+6代表是從第3行開始增加6行到第9行
                /pat1/,/pat2/:pat1到pat2的行,如果匹配到pat1到pat2,將其加入到緩衝區,並且會繼續向下匹配
                #,/pat1/
       ~:步進
                1~2:匹配奇數行。從第一行開始,每隔2行匹配一次
                2~2:匹配偶數行

function:

d: 刪除模式空間匹配的行,因爲是刪除啊,所以 d 後面通常不接任何咚咚;
p: 顯示模式空間中的內容
a [\]text:在指定行後面追加文本
支持使用\n實現多行追加
i [\]text:在行前面插入文本
c [\]text:替換行爲單行或多行文本
w /path/somefile: 保存模式匹配的行至指定文件,sed '10,90w /root/file' file1將從f1匹配到的行到file
r /path/somefile:讀取指定文件的文本至模式空間中
匹配到的行後
=: 爲模式空間中的行打印行號
!:模式空間中匹配行取反處理cat
s///:查找替換,支持使用其它分隔符,s@@@,s###
替換標記:
g: 行內全局替換
w /PATH/TO/SOMEFILE:將替換成功的行保存至文件中

數據的搜尋並執行命令

搜索/etc/passwd,找到root對應的行,執行後面花括號中的一組命令,每個命令之間用分號分隔,這裏把bash替換爲blueshell,再輸出這行:
nl /etc/passwd | sed -n '/root/{s/bash/blueshell/;p}'
root:x:0:0:root:/root:/bin/blueshell

如果只替換/etc/passwd的第一個bash關鍵字爲blueshell,就退出
nl /etc/passwd | sed -n '/bash/{s/bash/blueshell/;p;q}'    
root:x:0:0:root:/root:/bin/blueshell
最後的q是退出。

案例:

nl /etc/passwd |sed '2d'只刪除第 2 行
sed '/^#\|^[[:space:]]*$/d' f1搜索出來以#號開頭或有空白行
sed –n '2p' /etc/passwd    輸出第二行
sed –n '1,4p' /etc/passwd從第一行到第四行顯示
sed –n '/root/p' /etc/passwd    顯示匹配到root的行
sed –n '2,/root/p' /etc/passwd 從2行開始匹配root,並顯示
sed -n '/^$/=' file 顯示空行行號
sed –n –e '/^$/p' –e '/^$/=' file 多點編輯,我覺得類似grep的-e選項,或者的關係
sed '/root/a\superman' /etc/passwd行後添加字符
sed '/root/i\superman' /etc/passwd 行前
sed '/root/c\superman' /etc/passwd 代替行
sed '/^$/d' file刪除空行,不包括空格組成的空行
sed '1,10d' file 
nl /etc/passwd | sed '2,5d'
nl /etc/passwd | sed '2a tea'在第二行後面添加tea
sed 's/test/mytest/g' example 將test替換爲mytest
sed –n 's/root/&superman/p' /etc/passwd 單詞後,相當於後向引用,替換爲rootsuperman
sed –n 's/root/superman&/p' /etc/passwd 單詞前
sed -e 's/dog/cat/' -e 's/hi/lo/' pets
sed –i.bak 's/dog/cat/g' pets 編輯前先將pets備份爲pets.bak然後進行替換編輯

高級編輯命令:

h:把模式空間中的內容覆蓋至保持空間中;
H:把模式空間中的內容追加至保持空間中;
g:把保持空間中的內容覆蓋至模式空間中;
G:把保持空間中的內容追加至模式空間中;
x:把模式空間中的內容與保持空間中的內容互換;
n:覆蓋讀取匹配到的行的下一行至模式空間中;
N:追加讀取匹配到的行的下一行至模式空間中;
d: 刪除模式空間中的行
D:刪除當前模式空間開端至\n的內容(不再傳至標準輸出),放棄之後的命令,但是對剩餘模式空間重新執行sed

示例:

sed  -n  'n;p'  FILE:顯示偶數行;
sed  '1!G;h;$!d'  FILE:逆序顯示文件的內容;
sed  ’$!d'  FILE:取出最後一行;
sed  '$!N;$!D' FILE:取出文件後兩行;
sed '/^$/d;G' FILE:刪除原有的所有空白行,而後爲所有的非空白行後添加一個空白行;
sed  'n;d'  FILE:顯示奇數行;
sed 'G' FILE:在原有的每行後方添加一個空白行;

作業:

1.刪除centos7系統/etc/grub2.cfg文件中所有以空白開頭的行行首的空白字符
        sed 's/^[[:space:]]*//gp' /etc/grub2.cfg
2.刪除/etc/fstab文件中所有以#開頭,後面至少跟一個空白字符的行的行首的#和空白字符
        sed 's/^#[[:space:]]\+//g' /etc/fstab
3、在centos6系統/root/install.log每一行行首增加#號
        sed 's/^/#/' /root/install.log
4、在/etc/fstab文件中不以#開頭的行的行首增加#號
        sed  -n '/^#/!{s/^/#/p}' /root/f1
        sed  's/^[^#]\|^$/#&/' /root/f1
5、處理/etc/fstab路徑,使用sed命令取出其目錄名和基名
        echo "/etc/sysconfig/network-scripts" |sed -r 's@(^/.*/)([^/]+/?)@\2@'
        echo "/etc/sysconfig/network-scripts" |sed -r 's@(^/.*/)([^/]+/?)@\1@'
6、利用sed 取出ifconfig命令中本機的IPv4地址
        ifconfig eth0|sed  -n -e '2s/^.*r://' -e '2s/ .*//p'
7、統計centos安裝光盤中Package目錄下的所有rpm文件的以.分隔倒數第二個字段的重複次數
        ls -1  /misc/cd/Packages/ |sed -nr "s@(.*\.)([[:alnum:]_]+\.rpm)@\2@p" |sort |uniq -c|sort -n
8、統計/etc/init.d/functions文件中每個單詞的出現次數,並排序(用grep和sed兩種方法分別實現)
        grep  -o "[[:alpha:]]\+" /etc/init.d/functions |sort|uniq -c|sort -nr
        sed -nre 's/[^[:alpha:]]+/\n/gp'  /etc/init.d/functions |sort | uniq -c|sort -n
9、將文本文件的n和n+1行合併爲一行,n爲奇數行
        nl f1|sed -n "N;s/\n//p"

後話

做這種題最重要是練習,練得多了,自然就會了,沒有必要找好多文章來說明一種命令的用法,還是慢慢體會的好

發佈了43 篇原創文章 · 獲贊 41 · 訪問量 27萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章