1、建模步驟
模型的建立:當有兩個模型套用時,說的高端點,說成是前兩個字組合後新名字的算法,其實是兩個模型的疊加
模型的分析:表層的分析(從圖表中能夠看出什麼)+深層次的分析
模型的檢驗:例如,給100年數據預測未來10年數據,我們可以將數據按照7:3的比例拆分,用70的來預測未來30年的數據,然後兩個30年來做精度比較。用已知數據去檢驗預測或評價的數據,得到一個精度係數或者誤差因子,再帶入模型求解或未來預測中。
2、數學建模問題
1.數據處理 2.關聯與分析 3.分類與判別 4.評價與決策 5.預測與預報 6.優化與控制
(1)數據處理問題
•①插值擬合
•主要用於對數據的補全和基本的趨勢分析
•②小波分析,聚類分析(高斯混合聚類,K-均值聚類等等)
•主要用於診斷數據異常值並進行剔除
•③主成分分析、線性判別分析、局部保留投影等
•主要用於多維數據的降維處理,減少數據冗餘
•④均值、方差分析、協方差分析等統計方法
•主要用於數據的截取或者特徵選擇
(2)關聯與因果
•①灰色關聯分析方法(樣本點的個數較少)
•②Superman或kendall等級相關分析
•③Person相關(樣本點的個數比較多)
•④Copula相關(比較難,金融數學,概率密度)
•⑤典型相關分析(因變量Y1234,自變量組X1234,各自變量組相關性比較強,問哪一個因變量與哪一個自變量關係比較緊密?)
(3) 分類與判別
•①距離聚類(系統聚類)常用
•②關聯性聚類(常用)
•③層次聚類
•④密度聚類
•⑤其他聚類
•⑥貝葉斯判別(統計判別方法)
•⑦費舍爾判別(訓練的樣本比較少)
•⑧模糊識別(分好類的數據點比較少)
(4)評價與決策
•①模糊綜合評判:評價一個對象優、良、中、差等層次評價,評價一個學校等,不能排序
•②主成分分析:評價多個對象的水平並排序,指標間關聯性很強。
•③層次分析法:做決策,通過指標,綜合考慮做決定
•④數據包絡(DEA)分析法:優化問題,對各省發展狀況進行評判
•⑤秩和比綜合評價法:評價各個對象並排序,指標間關聯性不強
•⑥神經網絡評價:適用於多指標非線性關係明確的評價
•⑦優劣解距離法(TOPSIS法)
•⑧投影尋蹤綜合評價法:糅合多種算法,比如遺傳算法、最優化理論
•⑨方差分析、協方差分析等
• 方差分析:看幾類數據之間有無差異,差異性影響,例如:元素對麥子的產量有無影響,差異量的多少;(1992年作物生長的施肥問題)
協方差分析:有幾個因素,我們只考慮一個因素對問題的影響,忽略其他因素,但注意初始數據的量綱以及初始情況。(2006年,艾滋病療法的評價以及預測問題
(5)預測與預報
•主要有五種:
•小樣本內部預測-迴歸擬合(內部預測,如用身高 體重得預測性別)
•大樣本的內部預測-邏輯迴歸
•小樣本的未來預測-灰色預測(外部預測:用前10年預測第十一年)
•大樣本的隨機因素或週期特徵的未來預測-時間序列
•大樣本的未來預測-神經網絡,小波神經網絡
•①灰色預測模型(★)
• 滿足兩個條件可用:
• a數據樣本點個數少,6-15個
• b數據呈現指數或曲線的形式
•②微分方程預測(備用)
• 無法直接找到原始數據之間的關係,但可以找到原始數據變化速度之間的關係,通過公式推導轉化爲原始數據之間的關係。
•③迴歸分析預測(★)
• 求一個因變量與若干自變量之間的關係,若自變量變化之後,求因變量如何變化;
• 樣本點的個數有要求:
• a自變量之間協方差比較小,最好趨於零,自變量間的關係小;
• b樣本點的個數n>3k+1,k爲自變量的個數;
• c因變量要符合正態分佈
•④馬爾科夫預測(備用)
• 一個序列之間沒有信息的傳遞,前後沒有聯繫,數據與數據之間隨機性強,相互不影響;今天的溫度與昨天、後天沒有直接聯繫,預測後天溫度高、中、低的概率,只能得到概率
•⑤時間序列預測(★)
• 與馬爾科夫預測互補,至少有2個點需要信息的傳遞,ARMA模型,週期模型,季節模型等。
•⑥小波分析預測
•⑦神經網絡預測
•⑧混沌序列預測
(6)優化與控制
•①線性規劃、整數規劃、0-1規劃(有約束,確定的目標)
•②非線性規劃與智能優化算法
•③多目標規劃和目標規劃(柔性約束,目標含糊,超過)
•④動態規劃
•⑤圖論、網絡優化(多因素交錯複雜)
•⑥排隊論與計算機仿真
•⑦模糊規劃(範圍約束)
•⑧灰色規劃(難)