讀取某一簡單索引文件test.txt,其每行格式爲文檔序號關鍵詞,現需根據這些信息轉化爲倒排索引,即統計關鍵詞在哪些文檔中,格式如下:包含該關鍵詞的文檔數關鍵詞=> 文檔序號。其中,原索引文件作爲命令行參數傳入主程序,並設計一個collect函式統計"關鍵字<->序號" 結果對,最後在主程序中輸出結果至屏幕
test.txt的內容:
1 key1
2 key2
3 key1
7 key3
8 key2
10 key1
14 key2
19 key4
20 key1
30 key3
cmd輸入命令行: