原创 從Hive遷移到SparkSQL,有讚的大數據實踐

前言 有贊數據平臺從2017年上半年開始,逐步使用 SparkSQL 替代 Hive 執行離線任務,目前 SparkSQL 每天的運行作業數量5000個,佔離線作業數目的55%,消耗的 cpu 資源佔集羣總資源的50%左右。本文介紹由 Sp