8.6.2 區域銷售額與利潤額分析
由於受區域經濟環境、生活環境、文化環境等的影響,電商企業的產品銷售往往會呈現區域性差異,爲了深入研究該企業的產品是否在2019年具有區域差異性,我們這裏使用subplot函數進行可視化分析,Python代碼如下:
# -*- coding: utf-8 -*-
import Matplotlib as mpl
import Matplotlib.pyplot as plt
from impala.dbapi import connect
mpl.rcParams['font.sans-serif']=['SimHei'] #顯示中文
plt.rcParams['axes.unicode_minus']=False #正常顯示負號
#連接Hadoop數據庫
v1 = []
v2 = []
v3 = []
v4 = []
conn = connect(host='192.168.1.7', port=10000, database='sales',auth_mechanism='NOSASL',user='root')
cursor = conn.cursor()
#讀取Hadoop訂單表數據
sql_num = "SELECT region,ROUND(SUM(sales)/10000,2),ROUND(SUM(profit)/10000,2),ROUND(SUM(amount),2) FROM orders WHERE dt=2019 GROUP BY region"
cursor.execute(sql_num)
sh = cursor.fetchall()
for s in sh:
v1.append(s[0])
v2.append(s[1])
v3.append(s[2])
v4.append(s[3])
figure() #繪製一張圖片
plt.figure(figsize=(15,8)) #設置圖形大小
subplot(231)
plt.plot(v1, v2) #v1、v2的折線圖
subplot(232)
plt.bar(v1, v3) #v1、v3的條形圖
subplot(233)
plt.barh(v2, v3, alpha=0.5, color='red', edgecolor='red', lw=3) #v2、v3的水平條形圖
subplot(234)
plt.bar(v2, v3, alpha=0.5, width=1.6, color='yellow', edgecolor='red', lw=1) #v2、v3的條形圖
subplot(235)
plt.boxplot(v2) #v2的箱線圖
subplot(236)
plt.scatter(v2, v3) #v2、v3的散點圖
plt.suptitle('2019年區域銷售額比較分析', fontsize=15)
plt.show()
在Jupyter lab中運行上述代碼,生成如圖所示的複合圖形圖,從圖中可以看出:該企業在2019年,各區地區的銷售額基本情況,其中華東地區的銷售額最多,而利潤額最多的是中南地區;銷售額多利潤額不一定最多,且可以看出在銷售額在145萬附近時,利潤額是最大的;6個地區的銷售額最大值大約在170萬,平均值在100萬左右。
圖8-10 區域銷售額比較