REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

原創

2024-05-05 13:32

發表時間：2023(ICLR 2023)
文章要點：文章提出一個簡單有效的ReAct框架，將reasoning和action結合，在交互式的環境上進行測試，取得了很好的效果。其中reasoning作爲推理模塊，幫助模型歸納，跟蹤和更新動作規劃，acting和環境交互收集更多信息（reasoning traces help the model induce, track, and update action plans as well as handle exceptions, while actions allow it to interface with and gather additional information from external sources such as knowledge bases or environments.）。這裏reasoning指的是像chain-of-thought prompting那種模型自己推理，而沒有真正和環境交互的過程，而act就是指和環境交互的過程。
整個方法也很簡單，就是人類先提供幾個例子作爲few-shot in-context examples，然後讓模型根據提供的例子進行類似的reason和act（Each in-context example is a human trajectory of actions, thoughts, and environment observations to solve a task instance）。下圖舉例說明了這種方式相比其他方法的優勢。

總結：主要是提出了一個概念性的東西，方法上其實挺常見的。這種文章我們寫肯定發不出來。
疑問：無。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「遊記」2024 吉林省賽和 2024 東北四省賽

Before 本文是 \(2024\) 中國大學生程序設計競賽全國邀請賽（長春）暨第 \(17\) 屆吉林省大學生設計競賽和新建比賽的遊記寫的很爛寫的很爛寫的很爛 Day0 省賽報到及熱身賽。 \(14：00\) 前報到。 \(12：

2024-05-18 14:35:35

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

一、前言在使用yolo做人工智能運算後，運算結果除了一個方框，還可能需要增加文字顯示在對應方框上，以便標記是何種物體，比如顯示是人還是動物，或者還有可能追蹤人員，顯示該人員的姓名。這種應用場景非常普遍，而且非常有必要，可以非常直觀的直接看

2024-05-18 14:35:25

WPS技巧——MARK住

一、如何對一列數據進行相同操作，比如全都添加雙引號 https://www.jiachong.com/wps/340708.html 1.首先打開表格,按Ctrl+C複製第一個單元格內容, 2.然後把複製的單元格內容按Ctrl+V粘貼到與其

2024-05-18 14:34:35

LightDB通過金融信創生態實驗室測試

　　恆生電子LightDB順利通過了金融信創生態實驗室的產品測試，本次測試基於典型金融業務場景並在國產硬件環境中進行，經過測試，LightDB在產品性能、功能性、兼容性以及可靠性等多個維度100%符合金融業務系統，表現優異。　　在本

2024-05-18 14:32:25

國產數據庫金融行業實踐者：LightDB通過強制性國家標準GB18030-2022最高級別認證

　　8月1日，強制性國家標準GB 18030-2022《信息技術中文編碼字符集》實施。10月09日，恆生電子LightDB正式通過中國電子技術標準化研究院強制性國家標準GB18030-2022《信息技術中文編碼字符集》最高級（實現級別

2024-05-18 14:32:25

記一次asp.net 8 服務器爆滿的解決過程

1.描述一下服務器配置: 一臺2c4g的centos,做api接口反代一臺8c16g的windows 2019 作爲實際服務器,跑了iis,sql server,mongodb,redis 2.業務描述 2.0 服務器分爲兩個站

2024-05-18 14:26:04

一次nginx文件打開數的問題排查處理

現象：nginx域名配置合併之後，發現consul-template無法完成nginx重載，然後發現需要重啓nginx，才能讓配置生效。注意：下次哪個服務有報錯，就看重啓時所有日誌輸出，各種情況日誌輸出。不要忽略細節。很多時候其實已經

2024-05-18 14:17:33

docker 運行minio standalone模式

sudo docker run -it -d --name minio_latest -p 9000:9000 -p 9001:9001 -v /minio/data:/data -e MINIO_ROOT_USER="賬號" -e MIN

2024-05-18 14:15:13

HTML 09 - Quotations

Quotations in HTML allow you to include and format quoted text within your web content. HTML provides tags such as <bl

2024-05-18 14:14:12

HTML 10 - Comments

HTML Comments are used to comment in HTML codes, so the developer can understand the purpose of that code section and it

2024-05-18 14:14:12

Nginx R31 doc 官方文檔-01-nginx 如何安裝

從 Ubuntu 存儲庫安裝預構建的 Ubuntu 包更新 Ubuntu 存儲庫信息： sudo apt-get update 安裝包： sudo apt-get install nginx 驗證安裝： sudo ngin

2024-05-18 14:01:41

Android 15 的新功能與適配

前臺服務變化前臺服務一直是比較損耗電池壽命的操作，在 Android 15 Beta 2 裏，**dataSync 和 mediaProcessing 的前臺服務類型現在有大約 6 小時的超時時間**，之後系統將調用 Android 15

2024-05-18 14:00:31

高薪線下週末班馬上開班，手把手帶你提升職業技能

管理學大師彼得·德魯克說“終身學習是現在社會的生存法則”，而現實中，很少有人能清醒地意識到這一點，人們總是習慣在舒適區兜圈，重複做已經掌握的事情，對真正需要突破的職業困境視而不見。偶爾看到同事跳槽漲薪，技術越來越嫺熟，自己也期望着可以跟他

霍格沃茲測試學院

2024-05-18 13:54:11

提升團隊生產力：2024年必知的一體化協同辦公平臺

本文介紹的主流一體化協同辦公平臺有：Worktile、PingCode、Microsoft Teams、釘釘、Google Workspace、Jive、Avaya、Bitrix24、Asana、ClickUp、飛書。在現代工作環

2024-05-18 13:54:00

Mono 支持LoongArch架構

近期，著名的.NET開源社區Mono正式支持LoongArch（龍架構），目前LoongArch64架構已出現在.NET社區主幹分支上。詳細內容可以跟蹤 https://github.com/mono/mono/issues/21381,

2024-05-18 13:53:40

24小時熱門文章

最新文章

最新評論文章