數學建模:無車承運人平臺線路定價

題目:https://wenku.baidu.com/view/11e65610bc1e650e52ea551810a6f524cdbfcb65.html

摘要:
針對問題一,本文先對數據進行預處理,得到數值化的定距型指標和定類型指標;針對定距型數據採用 Spearman 相關性分析方法,針對定類型數據用單因素方差分析方法,得到影響線路價格的定距型因素有總里程、線路總本、線路指導價、車輛的參數以及計劃的車程時間,定類型因素主要爲地區、調價類型等。 
問題二(綜合模糊評價,不是我搞的)
針對問題三,本文先對附件一數據建立了總里程等相關因素與成交價格、指導價格、線路成本的多元線性迴歸模型;爲了提高線路價格的預測精度,又建立了基於多因素的 LightGBM 迴歸模型並與多元線性迴歸模型進行比較;最後,以歷史成功交易的平均溢價比爲參考,根據不同需求緊急程度爲附件 2 的任務進行了三次報價定價。 

關鍵方法: Spearman 相關性分析 多元線性迴歸  LightGBM迴歸

1、預處理及相關性分析

(1) 數據的清洗:缺失值處理,即表中一些指標的數據存在“N”值的,需要進行剔除,例如調價緊急程度、C 端議價等;重複值處理,我們認爲指標意義相近的可以只擇其一作進一步處理,例如交易成功時長和交易開始時間與交易成功時
間之差相接近,所以我們選擇剔除交易開始時間和交易成功時間。這樣一來,簡化了數據,再進行文本數據和時間數據的數值化處理。 
(2) 文本數據的處理:只針對文本數據中的定序型指標進行量化處理,對其進行等距編碼處理,處理後視爲定距型指標。以運輸等級爲例,一共有一級運輸、二級運輸和三級運輸三個等級,則分別用 1,2,3 來表示。在我們的方法中定類型文本數據無需進行量化處理。
(3) 時間數據的處理:該問我們只涉及部分時間數據,包括所有計劃時間、實際時間。表中的交易時長爲具體的分鐘數,因此我們將計劃時間和實際時間也進行相似的量化,以計劃時間爲例,即 
計劃時長 = 計劃到達時間 – 計劃靠車時間 

程序:https://download.csdn.net/download/weixin_40820983/12565119

結果展示:

spearman相關性分析部分結果

2、 多元線性迴歸及LightGBM迴歸

根據篩選後的指標建立多元線性迴歸模型,並使用 Python 進行計算,得到總里程、車輛長度、車輛噸位、運輸等級、地區、計劃發車計劃到達時間的迴歸分析係數的估計值:

結果展示:

成本多元線性迴歸結果

 

指導價多元線性迴歸結果

 

由於線路成交價預測問題相較於線路總成本具有更多的考慮因素,譬如需求緊急程度、線路編碼、是否續簽等等,因此相較於線路總成本的預測具有更大挑戰性。且通過多元線性迴歸,發現其平均相對誤差大於 10%,因此本部分採用較爲複雜的機器學習模型 LightGBM 迴歸算法。

預測數據殘差平方和: 276.57,預測數據平均相對誤差: 3.248%,也反映了 LightGBM 的強大的擬合能力,這比多元線性迴歸的平均相對誤差 12.605%精度提高了約 9%。

結果展示:

成本價LightGBM迴歸結果

 

定價LightGBM迴歸結果

程序:https://download.csdn.net/download/weixin_40820983/12565138

3、三次調價

對於調價策略,因爲不同緊急程度的訂單顯然調價策略應該有所區別,對於常規訂單,應以提高平臺利潤爲目標;對於緊急訂單,時間相比於特急訂單次重要,但價格儘量應合理;對於特急訂單,應該提高價格讓任務儘快被完成。通過上述分析,整理調價策略如表 7.3 所示: 

定價策略

 

程序同上

 


 
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章