Sort是用於對單個或多個文本文件內容進行排序的Linux程序。Sort命令以空格作爲字段分隔符,將一行分割爲多個關鍵字對文件進行排序。需要注意的是除非你將輸出重定向到文件中,否則Sort命令並不對文件內容進行實際的排序(即文件內容沒有修改),只是將文件內容按有序輸出。
本文的目標是通過14個實際的範例讓你更深刻的理解如何在Linux中使用sort命令。
1、 首先我們將會創建一個用於執行‘sort’命令的文本文件(tecmint.txt)。工作路徑是‘/home/$USER/Desktop/tecmint’。
下面命令中的‘-e’選項將啓用‘\’轉義,將‘\n’解析成換行
$ echo -e "computer\nmouse\nLAPTOP\ndata\nRedHat\nlaptop\ndebian\nlaptop" > tecmint.txt
Split String by Lines in Linux
2、 在開始學習‘sort’命令前,我們先看看文件的內容及其顯示方式。
$ cat tecmint.txt
Check Content of File
3、 現在,使用如下命令對文件內容進行排序。
$ sort tecmint.txt
Sort Content of File linux
注意:上面的命令並不對文件內容進行實際的排序,僅僅是將其內容按有序方式輸出。
4、 對文件‘tecmint.txt’文件內容排序,並將排序後的內容輸出到名爲sorted.txt的文件中,然後使用cat命令查看驗證sorted.txt文件的內容。
$ sort tecmint.txt > sorted.txt
$ cat sorted.txt
Sort File Content in Linux
5、 現在使用‘-r’參數對‘tecmint.txt’文件內容進行逆序排序,並將輸出內容重定向到‘reversesorted.txt’文件中,並使用cat命令查看文件的內容。
$ sort -r tecmint.txt > reversesorted.txt
$ cat reversesorted.txt
Sort Content By Reverse
6、 創建一個新文件(lsl.txt),文件內容爲在home目錄下執行‘ls -l’命令的輸出。
$ ls -l /home/$USER > /home/$USER/Desktop/tecmint/lsl.txt
$ cat lsl.txt
Populate Output of Home Directory
我們將會看到對其他字段進行排序的例子,而不是對默認的開始字符進行排序。
7、 基於第二列(符號連接的數量)對文件‘lsl.txt’進行排序。
$ sort -nk2 lsl.txt
注意:上面例子中的‘-n’參數表示對數值內容進行排序。當想基於文件中的數值列對文件進行排序時,必須要使用‘-n’參數。
Sort Content by Column
8、 基於第9列(文件和目錄的名稱,非數值)對文件‘lsl.txt’進行排序。
$ sort -k9 lsl.txt
Sort Content Based on Column
9、 sort命令並非僅能對文件進行排序,我們還可以通過管道將命令的輸出內容重定向到sort命令中。
$ ls -l /home/$USER | sort -nk5
Sort Content Using Pipe Option
10、 對文件tecmint.txt進行排序,並刪除重複的行。然後檢查重複的行是否已經刪除了。
$ cat tecmint.txt
$ sort -u tecmint.txt
Sort and Remove Duplicates
目前我們發現的排序規則:
除非指定了‘-r’參數,否則排序的優先級按下面規則排序
- 以數字開頭的行優先級最高
- 以小寫字母開頭的行優先級次之
- 待排序內容按字典序進行排序
- 默認情況下,‘sort’命令將帶排序內容的每行關鍵字當作一個字符串進行字典序排序(數字優先級最高,參看規則 1)
11、 在當前位置創建第三個文件‘lsla.txt’,其內容用‘ls -lA’命令的輸出內容填充。
$ ls -lA /home/$USER > /home/$USER/Desktop/tecmint/lsla.txt
$ cat lsla.txt
Populate Output With Hidden Files
瞭解ls命令的讀者都知道‘ls -lA’ 等於 ‘ls -l’ + 隱藏文件,所以這兩個文件的大部分內容都是相同的。
12、 對上面兩個文件內容進行排序輸出。
$ sort lsl.txt lsla.txt
Sort Contents of Two Files
注意文件和目錄的重複
13、 現在我們看看怎樣對兩個文件進行排序、合併,並且刪除重複行。
$ sort -u lsl.txt lsla.txt
Sort, Merge and Remove Duplicates from File
此時,我們注意到重複的行已經被刪除了,我們可以將輸出內容重定向到文件中。
14、 我們同樣可以基於多列對文件內容進行排序。基於第2,5(數值)和9(非數值)列對‘ls -l’命令的輸出進行排序。
$ ls -l /home/$USER | sort -t "," -nk2,5 -k9
Sort Content By Field Column
先到此爲止了,在接下來的文章中我們將會學習到‘sort’命令更多的詳細例