ACL 2019 GOLC 優化目標損失函數

原創

2020-06-21 14:26

ACL2019 GOLC:Global Optimization under Length Constraint for Neural Text Summarization

文章目錄

ACL2019 GOLC:Global Optimization under Length Constraint for Neural Text Summarization

論文PDF地址:https://www.aclweb.org/anthology/P19-1099

1 概述

按照論文中的觀點，現有大部分模型都無法控制模型輸出的摘要長度，所以很多時候都會輸出超長的限制。因爲在模型中都沒有考慮到文本長度的信息，或者已有的一些考慮長度的模型都沒有取得很好的分數。故此，論文作者提出了一個考慮到文本長度的優化目標函數（損失函數）。

2 GOLC

2.1 前情提要

之前的生成類模型，大部分都是用的MLE(最大對數似然估計），並且是強制學習（Decoder中每一步的輸入使用真實摘要而不是上一步的輸入）所以單純的MLE無法解決文本過長的問題（因爲訓練過程中，生成到原始摘要長度就停了）

2.2 MRT

論文中使用了改進的MRT（Minimum Risk Training），MRT方法可以在訓練過程中如同預測過程相同，下一個詞的生成是根據上一個詞的，直到生成結束再根據損失進行優化模型。其基本損失定義如下所示
$L_{MRT}(\theta)=\sum_{(x,y)\in D}\sum_{y'\in\tilde{S}(x)}Q_\theta(y'|x)\Delta(y,y')$
其中

$Q_\theta\varpropto p_\theta^\lambda$ ， $p_\theta$ 是給定原文產生該摘要的概率，參數 $\lambda$ 是平滑因子
$\Delta$ 是兩個文檔的負ROUGE分數
$\tilde{S}(x)=S(x)\cup{y}$ 也就是模型可能輸出的摘要與原始摘要的並集

在這種基本情況下，使用ROUGE的Recall、Precision、F1能粗略地控制輸出長度，但還是不夠理想。

2.3 GOLC

作者提出的改進方法，是修改上面的 $\Delta$ 方法，將文本長度加入其中：
$L_{MRT}(\theta)=\sum_{(x,y)\in D}\sum_{y'\in\tilde{S}(x)}Q_\theta(y'|x)\tilde\Delta(y,y')$

$\tilde\Delta(y,y')=-ROUGE(y,trim(y', c_*(y)))+max(0,c_*(y')-c_*(y))$

其中：

$c_*(y)$ 是代表文本y的長度
trim(y,c)是代表將文本y從頭開始截取c個詞的子文本

這樣，如果生成文本超長，第一項ROUGE分數不會再變小（因爲被截取了），那麼 $\tilde\Delta$ 的第二項就不爲0，損失就會變大，在優化模型的過程中，會逐漸令模型的輸出長度趨近於實際長度。

3.效果

作者對比了兩個主要模型，一個是基於LSTM（PG)，一個基於CNN（LC)，效果如下所示，可以看到，超長的情況得到了很大的緩解，而平均生成時間也縮短不少（可能因爲短了）

4 總結

可以從模型效果看出，帶有普通MRT的模型取得了較好的ROUGE成績，雖然加入GOLC模型有些許損失，但是卻從某方面提升了模型效果，也是不錯的思路。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

ACL 2019 GOLC 優化目標損失函數

ACL2019 GOLC:Global Optimization under Length Constraint for Neural Text Summarization

文章目錄

1 概述

2 GOLC

2.1 前情提要

2.2 MRT

2.3 GOLC

3.效果

4 總結

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

BigPatent文本摘要數據集

ACL 2019 GOLC 優化目標損失函數

數值分析(7)-非線性方程求根

[讀論文] 使用相似模式生成科學論文的相關綜述

數值分析(6)-解線性方程組迭代方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結