1、寫一個 bash 腳本以統計一個文本文件 words.txt 中每個單詞出現的頻率。
爲了簡單起見,你可以假設:
words.txt
只包括小寫字母和' '
。
每個單詞只由小寫字母組成。
單詞間由一個或多個空格字符分隔。
示例:
假設 words.txt 內容如下:
the sunny is is```
你的腳本應當輸出(以詞頻降序排列):
```the 4
is 3
sunny 2
day 1```
說明:
不要擔心詞頻相同的單詞的排序問題,每個單詞出現的頻率都是唯一的。
你可以使用一行 Unix pipes 實現嗎?
解題思路:
首先將句變成一個單詞佔一行,然後sort將相同的排在一起,再用uniq -c統計即可
答案:
```cat words.txt |tr -s ' ' '\n'|sort|uniq -c|sort -nr|awk '{print $2,$1}' ```
tr -s ' ' '\n'表示
2、給定一個包含電話號碼列表(一行一個電話號碼)的文本文件 file.txt,寫一個 bash 腳本輸出所有有效的電話號碼。
你可以假設一個有效的電話號碼必須滿足以下兩種格式: (xxx) xxx-xxxx 或 xxx-xxx-xxxx。(x 表示一個數字)
你也可以假設每行前後沒有多餘的空格字符。
示例:
假設 file.txt 內容如下:
<div class="se-preview-section-delimiter"></div>
```987-123-4567
123 456 7890
(123) 456-7890```
你的腳本應當輸出下列有效的電話號碼:
```987-123-4567
(123) 456-7890```
答案:
<div class="se-preview-section-delimiter"></div>
cat file.txt|grep -E ‘^([0-9]{3}-|([0-9]{3}) )[0-9]{3}-[0-9]{4}$’
<div class="se-preview-section-delimiter"></div>
awk ‘/^([0-9]{3}-|([0-9]{3}) )[0-9]{3}-[0-9]{4}$/’ file.txt
3、給定一個文件 file.txt,轉置它的內容。
你可以假設每行列數相同,並且每個字段由 ' ' 分隔.
示例:
假設 file.txt 文件內容如下:
<div class="se-preview-section-delimiter"></div>
name age
alice 21
ryan 30
應當輸出:
<div class="se-preview-section-delimiter"></div>
name alice ryan
age 21 30
答案:
<div class="se-preview-section-delimiter"></div>
awk ‘{
for (i = 1; i <= NF; ++i) {
if (NR == 1) s[i] = i;
}
} END {
for (i = 1; s[i] != “”; ++i) {
print s[i];
}
}’ file.txt
“`
name alice ryan
age 21 30
這題用到了awk數組。我們可以把每一列保存在數組內(通過疊加),最後將數組輸出即可。
答案:
awk '{
for (i = 1; i <= NF; ++i) {
if (NR == 1) s[i] = $i;
else s[i] = s[i] " " $i;
}
} END {
for (i = 1; s[i] != ""; ++i) {
print s[i];
}
}' file.txt
注意,當處理完之後NR等於總行數,NF值爲總列數
給定一個文本文件 file.txt,請只打印這個文件中的第十行。
示例:
假設 file.txt 有如下內容:
Line 1
Line 2
Line 3
Line 4
Line 5
Line 6
Line 7
Line 8
Line 9
Line 10
你的腳本應當顯示第十行:
Line 10
這題挺簡單的!
答案
cat file.txt|awk '{if(NR==10) print $0}'