原创 【Python】爬蟲之豆瓣電影大數據分析

平臺部分主要是hadoop分佈式系統,基於該系統融合了組件Spark,Hbase,Hive,Sqoop,Mahout等。 繼而進行相關的數據分析 該項目主要分爲以下幾部分: 1:數據採集 主要是基於豆瓣電影的數據,進行分析,所以首先要爬取