配對交易——初識統計套利

配對交易是統計套利中的非常經典的策略。衆所周知,A股市場無法賣空個股,所以中性化的配對交易策略並不能直接“拿來主義”。但這並不妨礙我們學習配對交易的思想,將賣空改成賣出,構造適合A股市場的策略。下面我們就開始學習吧~

一、配對交易:統計套利的基石

配對交易是基於數理分析的策略中的一個典型例子。策略的準則很簡單:假設你持有一對股票X和Y,它們具有經濟上的潛在聯繫。舉例來說,比如兩家公司可能生產同一類產品,或者兩家公司處在同一條供應鏈上。如果我們將這類經濟上的聯繫用數學方法建模,那麼我們就可以從中覓得交易機會。我們下面構造兩隻“虛擬”的股票來說明這一點。

我們假設X股票的日收益服從正態分佈,然後我們畫出它的累積收益圖。

現在我們來構造Y。由於我們假定Y與X有很強的聯繫,所以Y的價格應該與X高度相關。我們不妨對X添加一點噪聲(可用正態分佈),從而得到Y的價格(黃色曲線)。

二、協整:兩個序列的特殊關係

上面我們其實已經構建了兩個協整序列的例子。協整是一種比相關更微妙的關係。如果兩個時間序列是協整的,那麼一定存在它們的某個線性組合,圍繞着其平均值在較小範圍內波動。用數學的語言說,在所有的時間點上,這個線性組合構成的新隨機變量服從相同的概率分佈。

我們下面將X和Y的價差繪圖展示。折線是X和Y的價差,虛線爲價差的平均值。可以看到,折線在虛線兩側波動。

三、協整 VS 相關

協整和相關,概念上容易混淆,但它們並不相同。爲了闡明它們的區別,我們來看看協整但不相關,和相關但不協整的例子。

下面是兩個正態分佈所生成的隨機數的累加序列。它們高度相關,但協整檢驗的p值大於0.05,未能通過檢驗。

協整但不相關的例子相對更難構造一些,我們來看下面的正態分佈序列和方波序列。兩個序列的相關性非常非常低,但!是! ——協整檢驗的p值竟然幾乎爲0:這說明它們一定存在一個能保持“平穩”的線性組合,我們自然會想找到這個線性組合。聊到這兒,配對交易終於要出場了。

四、配對交易:尋找協整的股票組合

因爲不同的股票之間有時走勢方向相同,有時相反,所以我們總能找到它們的價差高點和價差低點:反映在圖像中就是它們股價曲線的距離。配對交易的技巧就是由股票X和股票Y構造對衝組合。如果兩隻股票都保持同步漲幅或者跌幅,我們既不會賺錢也不會虧錢。如果兩隻股票的價差開始向歷史平均值靠近,我們就能賺得收益。

實際上,配對交易是一種下注:你在賭,價差會回覆到歷史均值水準。而有一個重要的點是,當我們在某件事上下注時,要儘量減少這件事與其他因子的依賴性,比如市場。市場中性即意味着,市場的漲跌與你的收益無關,只要你下的注沒走眼,那麼就能賺錢。

具體怎麼做呢?例如當股票Y的價格比股票X的價格高出許多,價差已經明顯高於歷史平均值時,我們買入Y的空頭,X的多頭。類似得,如果兩隻股票的價差已經遠低於歷史平均值,我們可以持有Y的多頭,X的空頭,等待價差回覆到均值水平。具體地說,選取你覺得可能具有協整關係的股票,然後對它們進行協整檢驗。

注意:此處價差並不是兩隻股票的價格簡單相減!後面會說明應該如何計算價差。

五、給定股票池判定協整

我們選取了幾隻來自化工行業的A股股票,來看它們是否具有協整關係。我們選取它們2018年的歷史價格數據作爲考量標準。這幾隻股票是:滄州大化、華魯恆升、巨化股份、利爾化學、玲瓏輪胎(與下面股票代碼順序對應)。我們已經提出了假設,化工行業中的一些股票之間存在某種聯繫。接下來我們希望通過統計方法檢驗它們是否具有協整關係。

我們引入了滬深300指數,即把市場因素也納入我們的數據集中。這是因爲市場會使很多股票的價格漂移趨勢相似,以至於你會覺得兩隻股票很像是協整的,但實際上只是因爲它們都與市場協整。也就是說,市場因素是一個“混淆變量”:與其他變量都有關係的變量,導致我們想考察的變量間出現虛假關係。因此不管你得到什麼樣的關係,記得檢查是不是市場因素在“作祟”。

由上面的熱力圖,我們看到有兩組具有協整關係的序列對。在排除市場因素影響之後,我們認爲'600230.XSHG'和'601966.XSHG',即滄州大化和玲瓏輪胎是具有協整關係,是適合用於配對交易的一對股票。

六、價差的計算

現在我們來計算兩個序列的價差。爲了計算它們的實際價差,我們首先要用線性迴歸來得到兩個序列的迴歸係數。迴歸方程的常數項alpha就是我們需要的價差。也就是說,一隻股票的價格減去另一隻股票的價格乘迴歸係數beta,得到的纔是它們的價差。

順便一提,線性迴歸也能用於估計參數並檢驗序列的協整性,這種方法在計量經濟學中被稱作Engle-Granger方法(我們一般簡稱E-G兩步法),感興趣的話可以參考李子奈老師的《計量經濟學》,系統地學習學習~

檢測價格比率是配對交易中一種很傳統的方法。它能作爲擇時信號的一部分原因是股票價格一般被認爲服從對數正態分佈。由這個假設我們可以推測,當我們在衡量價格比率時,實際上等價於在考察它們收益的線性組合(考慮到價格是收益的指數累積)。

價格比率的方法可能看起來比較刺激,它在實盤上往往是不可行的策略。我們還是應該選擇用價差作爲配對交易的選擇標準。對協整的股票使用線性迴歸計算價差固然方便,但它在實盤上也不見得會有好的效果。其實還有很多其他計算價差的方法,這取決於你對處理協整序列的統計學方法有多瞭解。

回到我們的例子,直接對股票數據進行價差計算在統計學上並不是很合適的手段。我們應該先進行標準化,比如使用熟悉的z-score法。但是我們需要注意,在寫實盤策略時,假設我們的數據服從正態分佈並不明智。金融數據常常是尖峯厚尾的分佈,這意味着它們比正態分佈更可能出現極端值。

藍色折線是標準化後的序列,黑色實線是它的平均值,上下兩條橙色虛線代表平均值加減一倍標準差,即“閾值”。

簡單的配對交易策略:

• 當z-score低於1時做多;

• 當z-score低於1時做空;

• 當z-score趨近0時空倉。

當然,這個策略只是配對交易的冰山一角,純粹是爲了解釋配對交易的流程。如果你想學會寫一個更有實戰意義的配對交易策略(比如多空頭寸比怎麼取),強烈推薦一本書:Algorithmic Trading: Winning Strategies and Their Rationale。關於配對交易的更深入的教程,我們之後有機會再一起學習~

註明:本文改編自Quantopian系列教程之《Introduction to Pairs Trading》,譯者根據原文進行了適當的解讀與排版。


點擊【閱讀原文】,獲取完整源碼~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章