詞LSTM部分(整體圖中紅色陰影部分)結構如下圖及式(12)(13):
xb,ew=ew(wb,ed)(12)
⎣⎡ib,ewfb,ewcb,ew⎦⎤=⎣⎡σσtanh⎦⎤(WwT[xb,ewhbc]+bw)cb,ew=fb,ew⊙cbc+ib,ew⊙cb,ew(13)
其中:
wb,ed表示從b開始到e結束的詞的子序列,如w1,2d=南京、w6,7d=大橋;
hbc表示第b個字的LSTM cell的輸出;
其他變量解釋同上。
可以發現詞LSTM細胞中沒有o(output gate),這是因爲詞LSTM之間沒有聯繫,每個詞LSTM的細胞狀態都傳給該詞最後一個字的字LSTM細胞。
詞與字的關聯
整體圖中每個字細胞都有兩種類型的輸入,黑色線表示從前一個字傳過來的細胞狀態,綠色線表示從以該字結尾的所有詞傳過來的細胞狀態,不同的輸入採用加權平均的方法傳入,所以cjc不僅包含與第j個字符有關的信息,還包含以第j個字符結尾的詞的信息,具體如式(15)(16):
cjc=b∈{b′∣wb′,jd∈D}∑αb,jc⊙cb,jw+αjc⊙cjc(15)
其中:
αb,jc=exp(ijc)+∑b∈{b′∣wb′,jd∈D}exp(ib′,jc)exp(ib,jc)αjc=exp(ijc)+∑b∈{b′∣wb′,jd∈D}exp(ib′,jc)exp(ijc)(16)
舉個例子,對於c7c,包含了x7c(橋)、c6,7w(大橋)、c4,7w(長江大橋)的信息,所以:
c7c=α6,7c⊙c6,7c+α4,7c⊙c4,7c+α7c⊙c7c
其中:
α6,7c=exp(i7c)+exp(i6,7c)+exp(i4,7c)exp(i6,7c)α4,7c=exp(i7c)+exp(i6,7c)+exp(i4,7c)exp(i4,7c)α7c=exp(i7c)+exp(i6,7c)+exp(i4,7c)exp(i7c)