文本處理工具
wc(word count) 統計文件內容
wc命令用於統計文件的行數、字節數、用空格隔開的字符單詞數信息
語法:wc [文件名...]
wc [選項] [文件名...]
選項:
-l:統計行數(lines)
-w:統計單詞數(words)
-c:統計字節數(bytes)
-m:統計字符數
-L:統計文件中最長行的長度
cut 字符截取
cut命令用於截取文件中的字符;如果要分割多個數字,則用“,”進行分割;如果要分割連續字段,則用“-”進行分割(1-9)
語法:cut [選項...] [文件名]
cut [指定分隔符] [文件名]
選項:
-d:指定分隔符(只能指定一個),這個選項和字符之間可以不用加空格
-f:指定提取第幾列,這個選項和字符之間可以不用加空格
#:指定的單個字段
#-#:連續的多個字段
#,#:離散的多個字段
-n:與“-b”選項結合使用,不分割多字節字符
-s:不顯示不包含分隔符的行
--output-delimiter=分隔符;指定輸出內容是的字段分割符
cut的侷限
cut命令默認是不能使用多個空格作爲分隔符
可用awk命令解決
sort 排序
sort用於將文件進行排序,並將排序結果標準輸出;sort默認是比較每一行的第一個字符,按字母表中升序進行排序
語法:sort [文件名...]
sort [選項] [文件名...]
選項:
-f:忽略字符大小寫
-r:反向排序
-k:以指定字段爲標準進行排序
-t:指定字段分隔符
-n:以數值大小進行排序
-u:重復的行,只顯示一次
uniq 忽略重復
uniq 用於忽略文件中的重復行,一般與sort結合使用
語法:uniq [選項] [文件名]
選項:
-c:顯示每行出現的次數
-d:僅顯示重復過的行
-u:僅顯示沒有重復過的行