wc:文本數據統計
語法:
wc [OPTION]... [FILE]...
wc [OPTION]... --files0-from=F
說明:
計數單詞總數、行總數、字節總數和字符總數
可以對文件或STDIN中的數據運行
選項:
-l: 只計數行數
-w:只計數單詞總數
-c: 只計數字節總數
-m:只計數字符總數
示例:
[root@localhost testdir]# wc test
3 3 18 test3
行數 字數 字符數 文件名
[root@localhost testdir]# wc -l test
3 test
[root@localhost testdir]# wc -w test
3 test
[root@localhost testdir]# wc -m test
18 test
[root@localhost testdir]# wc -c test
18 test
sort:文本排序
語法:
sort [OPTION]... [FILE]...
sort [OPTION]... --files0-from=F
說明:
將文件進行排序,並將排序結果標準輸出。sort命令既可以從特定的文件,也可以從stdin中獲取輸入。
選項:
-b:忽略每行前面開始出的空格字符;
-c:檢查文件是否已經按照順序排序;
-d:排序時,處理英文字母、數字及空格字符外,忽略其他的字符;
-f:排序時,將小寫字母視爲大寫字母;
-i:排序時,除了040至176之間的ASCII字符外,忽略其他的字符;
-m:將幾個排序號的文件進行合併;
-M:將前面3個字母依照月份的縮寫進行排序;
-n:依照數值的大小排序;
-r:以相反的順序來排序;
-o 輸出文件:將排序後的結果存入制定的文件;
-t分隔字符:指定排序時所用的欄位分隔字符;
+<起始欄位>-<結束欄位>:以指定的欄位來排序,範圍由起始欄位到結束欄位的前一欄位。
-u 選項(獨特, unique)刪除輸出中的重複行
-k X 選項按照使用c字符分隔的X列來整理能夠使用多次
示例:
[root@localhost testdir]# cat test
12345
abcde
abcde
78901
6478
abcde
eftkw
eftkw
[root@localhost testdir]# sort test
12345
6478
78901
abcde
abcde
abcde
eftkw
eftkw
[root@localhost testdir]# sort -r test
eftkw
eftkw
abcde
abcde
abcde
78901
6478
12345
[root@localhost testdir]# sort -u test
12345
6478
78901
abcde
eftkw
[root@localhost testdir]# sort -k2 test
12345
6478
78901
abcde
abcde
abcde
eftkw
eftkw
uniq:統計文件中連續重複的行
語法:
uniq [OPTION]... [INPUT [OUTPUT]]
說明:
uniq命令用於報告或忽略文件中的重複行,一般與sort命令結合使用。
輸出文件:指定要去除重複行後的內容要寫入的輸出文件。如果不指定此選項,則將內容顯示到標準輸出設備(顯示終端)。
選項:
-c: 顯示每行重複出現的次數;
-d: 僅顯示重複過的行;
-u: 僅顯示不曾重複的行;
-f<欄位>或--skip-fields=<欄位>:忽略比較指定的欄位
-s<字符位置>或--skip-chars=<字符位置>:忽略比較指定的字符;
-w<字符位置>或--check-chars=<字符位置>:指定要比較的字符。
示例:
[root@localhost testdir]# cat test
12345
abcde
abcde
78901
6478
abcde
eftkw
eftkw
[root@localhost testdir]# sort test | uniq -c
1 12345
1 6478
1 78901
3 abcde
2 eftkw