Open Refine能學到什麼

  • 清理不一致的術語拼寫(即“美國”,“美國”,“美國”等)。
  • 將數值(即1.23億美元)的文本描述值轉換爲可用於分析的實際數值(即123000000)。
  • 識別特定列的哪些行包含搜索項
  • 提取和清除日期的值
  • 刪除重複的行
  • 使用散點圖來顯示不同列中的值之間的關係
  • 查找地名列表的地理座標(即大學名稱等)
  • 將清理的數據導出到Excel



Open Refine是一個開源的數據整理根據。功能還是很強大的,雖然沒玩過幾天,不過覺得使用起來非常方便。
感興趣的博友可以看看以下網址,對這個工具的進一步認識。
1.Open Refine教程:   http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial
2.用戶文檔: https://github.com/OpenRefine/OpenRefine/wiki/Documentation-For-Users
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章