這篇文章,主要是記錄我在使用pandas讀取tsv文件時遇到的一個問題。
pandas模塊“CParserError: Error tokenizing data. C error: Expected 4 fields in line 1250, saw 5”錯誤
在網上看了一位大佬的文章,發現他給的解決方案就是修改文件格式。可是根據他的解決方案,並沒能解決我的問題。而且這個錯誤的字面意思,似乎是在tsv文件的1250行只需要4個區域,實際上卻有五個。
於是我便使用execl打開了這個tsv文件。
結果發現在1250行,真的有五個區域。似乎是製表符出現了問題。
在經過添加製表符,依舊沒有任何變化的情況下。
我選擇了最簡單的刪除大法。
直接將出現的問題的部分刪除即可。