原创 截圖加文字詳細記錄Idea導出jar包的方式

打開Project Structure Artifacts–》+ --》JAR–》From modules with dependencies… 選擇目標Class,之後點擊OK或APPLY直到回到主界面 主

原创 Hive_基於Python預處理、用Hive對movielens數據集進行分析

概述 熟悉Hive的小夥伴都知道,企業中對Hive進行數據預處理ETL,最多的是用UDF和Python腳本。本文主要是實踐在Hive中使用Python腳本進行數據清洗。數據集來源:http://files.grouplens.or