基於集成學習模型的估價預測(量化投資)

股價的預測

這個領域屬於量化投資,也就是通過數量化的方式和模型去做投資決策。量化投資是一個很龐大的領域,從量化投資開始至今,衍生出了大量的投資理念和策略。

縱觀國內外量化投資現狀,國內其實剛剛起步,還有很長的路要走,這裏包括數據的完整性、透明性等。 國內目前散戶(個人投資者)很多,但比如像美國這些歐美國家,絕大部分是以機構投資者爲主的,而且他們很多都在使用量化投資技術。

此項目關注的地方:

1、大概瞭解如何使用AI做量化投資
2、什麼叫特徵工程,如何做?
3、時序數據如何處理?

需要完成的任務是:給定歷史股市行情數據,預測未來漲或者跌。比如給定過去10天的股市行情,預測某一隻股票明天漲或者跌。

K線圖

MA5 過去5天的平均值Moving Average

MA10 每10天平均

MA20 每20天平均

MA60 每60天平均

DMI, OVI, OCC等指標

分時線:

對於國內的A股,它是T+1市場,也就是我們當天買的股票,只能第二天再賣出去,不像美股一樣我們可以針對某一隻股票做無限次買賣操作。所以國內的A股市場,目前是玩不了高頻交易的。所謂的高頻交易就是指比如每秒都可以買賣。

那A股的歷史股票數據從哪裏可以獲得呢?如果自己開公司炒股,那最好通過第三方正規渠道直接買入交易所的數據,這是最精準的。但如果只是學習目的,就想玩一玩的話,可以使用網絡上的一些開源數據。

Tushare接口

任務:

基於過去N天的股市行情數據來預測某隻股票未來M天后的漲跌。所以這個問題本身是二分類問題,其實就是預測某一隻股票漲或者跌!

雖然數據本身是時序數據,但我們完全可以把時序問題轉換成經典的二分類問題。

 

特徵工程技術:如何從給定的股票行情數據構建訓練樣本,以及股票特徵工程技術。

如果基於過去的行情數據來構建樣本?

 

從時序圖抽取指標,比如MA5

基於上述行情數據我們能夠抽取什麼樣的特徵呢?

這裏的學問就大了! 從量化投資誕生以來,很多人試圖尋找有效的"信號“, 這個信號可以簡單理解成特徵就可以了。

比如取一下過去5天的平均收盤價作爲一個信號,或者過去5天最高價作爲信號等等。

股票計算指標計算公式:http://www.yingjia360.com/gongshi/

針對於每一隻股票,我們可以基於它過去一段時間的行情數據來計算各式各樣的指標,然後把指標結果作爲特徵值來對待就可以了,接着通過特徵值預測未來會不會漲或者跌。而且我們可以提前構建好需要預測的標籤。

接下來,就可以通過分類算法來預測,並比較跟真實標籤之間的差異,這個也叫做準確率。

一定要關注特徵工程,而且特徵工程是來自於對問題和數據的理解。模型都是封裝好的,但對問題和數據的理解是無法封裝的

以下項目的指標採用準確率,也就是來看算法對於判斷未來漲或者跌到底有多準確(實際量化投資採用收益率來作爲指標,但涉及較多的金融知識,所以簡化)

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章