數學建模：無車承運人平臺線路定價

原創

2020-07-02 19:46

題目：https://wenku.baidu.com/view/11e65610bc1e650e52ea551810a6f524cdbfcb65.html

摘要:
針對問題一，本文先對數據進行預處理，得到數值化的定距型指標和定類型指標；針對定距型數據採用 Spearman 相關性分析方法，針對定類型數據用單因素方差分析方法，得到影響線路價格的定距型因素有總里程、線路總本、線路指導價、車輛的參數以及計劃的車程時間，定類型因素主要爲地區、調價類型等。
問題二（綜合模糊評價，不是我搞的）
針對問題三，本文先對附件一數據建立了總里程等相關因素與成交價格、指導價格、線路成本的多元線性迴歸模型；爲了提高線路價格的預測精度，又建立了基於多因素的 LightGBM 迴歸模型並與多元線性迴歸模型進行比較；最後，以歷史成功交易的平均溢價比爲參考，根據不同需求緊急程度爲附件 2 的任務進行了三次報價定價。

關鍵方法： Spearman 相關性分析多元線性迴歸 LightGBM迴歸

1、預處理及相關性分析

(1) 數據的清洗：缺失值處理，即表中一些指標的數據存在“N”值的，需要進行剔除，例如調價緊急程度、C 端議價等；重複值處理，我們認爲指標意義相近的可以只擇其一作進一步處理，例如交易成功時長和交易開始時間與交易成功時
間之差相接近，所以我們選擇剔除交易開始時間和交易成功時間。這樣一來，簡化了數據，再進行文本數據和時間數據的數值化處理。
(2) 文本數據的處理：只針對文本數據中的定序型指標進行量化處理，對其進行等距編碼處理，處理後視爲定距型指標。以運輸等級爲例，一共有一級運輸、二級運輸和三級運輸三個等級，則分別用 1，2，3 來表示。在我們的方法中定類型文本數據無需進行量化處理。
(3) 時間數據的處理：該問我們只涉及部分時間數據，包括所有計劃時間、實際時間。表中的交易時長爲具體的分鐘數，因此我們將計劃時間和實際時間也進行相似的量化，以計劃時間爲例，即
計劃時長 = 計劃到達時間 – 計劃靠車時間

程序：https://download.csdn.net/download/weixin_40820983/12565119

結果展示：