文件內容統計——Linux wc命令

有了該命令,就可以得到當前目錄下所有符合條件的文件總數,如下:

find -type f | wc -l

wc--Linux()

這個命令的功能也很好記,因爲它功能很有限:

wc-c filename:顯示一個文件的字節數

wc-m filename:顯示一個文件的字符數

wc-l filename:顯示一個文件的行數

wc-L filename:顯示一個文件中的最長行的長度

wc-w filename:顯示一個文件的字數



[rocrocket@rocrocketprogramming]$ cat wc1.txt

12

345

你好

[rocrocket@rocrocketprogramming]$ wc -c wc1.txt

16wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -m wc1.txt

12wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -l wc1.txt

3wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -L wc1.txt

4wc1.txt 

[rocrocket@rocrocketprogramming]$ wc -w wc1.txt

5wc1.txt


每行結尾的換行符也算一個字符,空格也算一個字符。



由於採用UTF-8編碼,所以一個漢字在這裏被轉換爲3字節,所以wc-c顯示的結果是16,即“第一行的4個字節+第二行的5個字節+第三行的7個字節”=4+5+7=16

而當使用-m選項時,一個漢字就作爲一個字符計算,所以是4+5+3=12

當使用-L時,是給出最長行的長度,第二行最長,有4個字符長。(顯然是不把換行符計算在內)



使用-w是計算字數,一個字是一個word,所以“34”表示一個word一個“你好”表示一個word(我試過了,當中文是連在一起的,不管多少個,在計算字數word時,只有一個),因此2+2+1=5



插孔說說tab製表符,這個符號比較特殊,當使用-L時,製表符算7個字符(這要依據一個製表符的長度而定,在我的系統中一個製表符算7個空格長度)。而當使用-w時,製表符和空格沒有兩樣,都作爲字的間隔來看待。當用-c時,一個製表符也就算一個字符,因爲它的確就只是一個字符而已。

如果你直接執行wcwc1.txt,則顯示:

[rocrocket@rocrocketprogramming]$ wc wc1.txt 3  5 16 wc1.txt

輸出信息依次是:行數 字數字節數 文件名稱。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章