隨機擴散過程參數估計——Hermite序列近似估計轉移密度
這篇博文基於作者個人最近閱讀Yacine(2002)年的一篇很經典的論文的理解。這篇文章比較牛逼之處在於可以通過Hermite序列近似估計出轉移概率密度(regardless the underlying distribution),從而得到一個外生得似然函數。並且可以擴展到多維的隨機過程。
(未完待續 …)
雖然Yacine公開了程序,但是作者最近求知慾爆棚(比較無聊),所以記下自己的理解和自己猜測的一些推導細節。當然,剛開始學習,理解還浮於表面,如果有不到位的地方,希望路過的大牛能夠指出。
對於一個一般的擴散過程:
dXt=μ(Xt;θ)dt+σ(Xt;θ)dWt(1)
比如說CIR過程:
dxt=α(μ−xt)dt+σxtdWt(1*)
從作者的上一篇博文可知,CIR過程服從非中心卡方分佈,轉移概率計算相當複雜。但是通過一系列的變換,Yacine讓以上的過程更加近似於正態分佈,從而可以用Hermite序列來近似估計正態分佈函數。這個變換就是一個從X到Z的過程。得到Z過程的近似轉移概率後,我們可以倒推到X過程,從而推出外生的似然函數,最終目標如下:
ℓn(θ)≡i=1∑nln{pX(Δ,XiΔ∣X(i−1)Δ;θ)}(**)
通過似然函數的最優化,即可以對未知參數進行估計。具體的變化過程如下:
第一步, 標準化,去除方差的影響。 (X→Y)
Y≡γ(X;θ)=∫xdu/σ(u;θ)(2)
帶入Ito公式
dYs=μY(Yt;θ)dt+dWt, where μY(y;θ)=σ(γ−1(y;θ);θ)μ(γ−1(y;θ);θ)−21∂x∂σ(γ−1(y;θ);θ)
第二步, 中心化,去除尖峯影響。(Y→Z)
Z≡Δ−1/2(Y−y0)(3)
第三步,利用Hermite序列近似逼近Z的轉移概率密度:
pZ(J)(Δ,z∣y0;θ)≡ϕ(z)j=0∑JηZ(j)(Δ,y0;θ)Hj(z)(4)
其中ϕ(z)≡e−z2/2/2π, 是標準的正態分佈密度函數。而
Hj(z)≡ez2/2dzjdj[e−z2/2],j≥0(5)
是標準的Hermite序列。係數項可以如下的積分過程得到
ηZ(j)(Δ,y0;θ)≡(1/j!)∫−∞+∞Hj(z)pZ(Δ,z∣y0;θ)dz(6)
這裏我想可以近似於傅里葉逼近來理解,畢竟Hermite序列也是正交序列。所以證明方法應該和傅里葉序列函數逼近差不多,因而我目前還不是特別好奇。
第四步,已知Z的狀態轉移密度,求Y的狀態轉移密度:(Z→Y)
根據(3)和(4):
pY(J)(Δ,y∣y0;θ)≡Δ−1/2pZ(J)(Δ,Δ−1/2(y−y0)∣y0;θ)(7)
第五步,已知Y的轉移密度,得到X的轉移密度:(Z→Y)
pX(J)(Δ,x∣x0;θ)≡σ(x;θ)−1pY(J)(Δ,γ(x,θ)∣γ(x0;θ);θ)(8)
第六步,最大化似然函數(**)。
以上即爲Yacine似然估計的整個流程,而這裏最重要也最複雜的就是第三步,如何通過序列逼近pZ(J)(Δ,z∣y0;θ)
通過較爲簡單的變量替換,我們有如下的結果
ηZ(j)(Δ,y0;θ)=(1/j!)∫−∞+∞Hj(z)pZ(Δ,z∣y0;θ)dz=(1/j!)∫−∞+∞Hj(z)Δ1/2pY(Δ,Δ1/2z+y0∣y0;θ)dz=(1/j!)∫−∞+∞Hj(Δ−1/2(y−y0))pY(Δ,y∣y0;θ)dy=(1/j!)E[Hj(Δ−1/2(Yt+Δ−y0))∣Yt=y0;θ]
這裏,第二行的推導參照(7),可以反解出:
pZ(Δ,z∣y0;θ)=Δ1/2pY(Δ,Δ1/2z+y0∣y0;θ)(9)
第三行帶入(3)即可。最後一行是期望的定義。然後最後一行的期望項用Tarlor公式展開:
E[f(Yt+Δ,y0)∣Yt=y0]=k=0∑KAk(θ)⋅f(y0,y0)k!Δk+E[AK+1(θ)⋅f(Yt+δ,y0)∣Yt=y0](K+1)!ΔK+1(10)
這裏 f(y,y0)=Hj(Δ−1/2(Yt+Δ−y0)). 通過定義 (5),我們展開前七項的Hermite序列
H0(z) |
1 |
H1(z) |
-x |
H2(z) |
x2−1 |
H3(z) |
−x3+3x |
H4(z) |
x4−6x2+3 |
H5(z) |
−x5+10x3−15x |
H6(z) |
x6−15x4+45x2−15 |
而算子A=μy∂y∂+21∂y2∂2。這裏ηZ(k,j)(Δ,y0;θ)有兩個上標, k表示泰勒展開的階數,j代表Hermite序列的階數。Yacine在文章中給出了前七項的表達式,如圖
還有第一項ηZ(0,3)=1;
ηZ(1,3)=−μYΔ1/2−(2μYμY[1]+μY[2])Δ3/2/4−(4μYμY[1]2+4μY2μY[2]+6μY[1]μY[2]+4μYμY[3]+μY[4])Δ5/2/24(a)
這裏給出第二項的證明,其他項亦然:
泰勒展開(10), K=3:
A0f(y0,y0)+A1f(y0,y0)Δ+A2f(y0,y0)2!Δ2+A3f(y0,y0)3!Δ3+E[A3f(yt+δ,y0)]4!Δ4(a.1)
每一項計算如下:
A0f(y,y0)=H(Δ−21(y−y0))∣y=y0=Δ−21(y−y0)∣y=y0=0
A1f(y,y0)=μΔ−21
A2f(y,y0)=A(μΔ−21)=(μ∂y∂(μ)+21∂y2∂2(μ))Δ−21=(μμ(1)+μ(2))Δ−21
A3f(y,y0)=A((μμ(1)+μ(2))Δ−21)=(μ∂y∂(μμ(1)+μ(2))+21∂y2∂2(μμ(1)+μ(2)))Δ−21=21Δ−21(4μYμY[1]2+4μY2μY[2]+6μY[1]μY[2]+4μYμY[3]+μY[4])
帶入以上的泰勒展開(a.1)即可得(a).
下面就來到了我頭疼了兩天的部分,(3)和(4)代入(7),我們會得到
pY(J)(Δ,y∣y0;θ)≡Δ−1/2ϕ(Δ−1/2(y−y0))j=0∑JηZ(j)(Δ,y0;θ)Hj(Δ−1/2(y−y0))(11)
把ηZ(k,j)(Δ,y0;θ)和Hj代入到(11),並且取出Δk的所有係數項。便可推導出這篇文章最最最重要的一個結論:
p~Y(K)(Δ,y∣y0;θ)=Δ−1/2ϕ(Δ1/2y−y0)exp(∫y0yμY(w;θ)dw)k=0∑Kck(y∣y0;θ)k!Δk(12*)
其中c0(y∣y0;θ)=0. 其他的項可以通過迭代算出
cj(y∣y0;θ)=j(y−y0)−j∫y0y(w−y0)j−1×{λY(w;θ)cj−1(w∣y0;θ)+(∂2cj−1(w∣y0;θ)/∂w2)/2}dw(12.1*)
其實,我深知直接用(12*)和(12.1*)就可以解決我大部分的問題,但是小編個人天生愛研究(找虐),居然腦補了兩天這個是怎麼湊出來的,也算是小有所獲,但是今天比較晚了(媽媽叫我去喝牛奶),就先寫到這裏,明天晚上再繼續補充這部分的筆記。
實,我深知直接用(12*)和(12.1*)就可以解決我大部分的問題,但是小編個人天生愛研究(找虐),居然腦補了兩天這個是怎麼湊出來的,也算是小有所獲,但是今天比較晚了(媽媽叫我去喝牛奶),就先寫到這裏,明天晚上再繼續補充這部分的筆記。
參考文獻:
Maximum-Likelihood Estimation of Discretely-Sampled Diffusions: A Closed-Form Approximation Approach, Econometrica,2002, 70, 223-262 (this paper received the 1998 Cornerstone Research
Award)
鏈接:https://www.princeton.edu/~yacine/mle.pdf
結束語:本系列的文章是Yacine大神論文研究的讀後感,不得不表達一下自己的崇拜之情,Yacine開源了自己所有的文章和程序,讓大家使用和學習。超前的研究,超前的思想,雖然大神的境界不可企及,但是可以膜拜。哈哈,最重要的一點對自己說,從明天開始務正業,務正業!!!