REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

發表時間:2023(ICLR 2023)
文章要點:文章提出一個簡單有效的ReAct框架,將reasoning和action結合,在交互式的環境上進行測試,取得了很好的效果。其中reasoning作爲推理模塊,幫助模型歸納,跟蹤和更新動作規劃,acting和環境交互收集更多信息(reasoning traces help the model induce, track, and update action plans as well as handle exceptions, while actions allow it to interface with and gather additional information from external sources such as knowledge bases or environments.)。這裏reasoning指的是像chain-of-thought prompting那種模型自己推理,而沒有真正和環境交互的過程,而act就是指和環境交互的過程。
整個方法也很簡單,就是人類先提供幾個例子作爲few-shot in-context examples,然後讓模型根據提供的例子進行類似的reason和act(Each in-context example is a human trajectory of actions, thoughts, and environment observations to solve a task instance)。下圖舉例說明了這種方式相比其他方法的優勢。

總結:主要是提出了一個概念性的東西,方法上其實挺常見的。這種文章我們寫肯定發不出來。
疑問:無。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章