Reflexion: Language Agents with Verbal Reinforcement Learning

作者： Noah Shinn, Federico Cassano, Edward Berman, Ashwin Gopinath, Karthik Narasimhan, Shunyu Yao (2023)

领域

应用

TLDR（中文）

让 agent 在失败后用自然语言做"复盘"，下一轮把反思塞进 prompt。"无梯度的自我改进"思路被广泛复用于 coding agent、SWE-agent。

TLDR (English)

Makes agent do natural language "post-mortem" after failure, injecting reflection into next round's prompt. "Gradient-free self-improvement" approach widely reused in coding agents, SWE-agent.

出现在这些文章里

Agent 与工具使用：模型不只是聊天
Agents and Tool Use: Models Are More Than Chat

同被引用

这些论文与本文出现在同一篇文章中

Reflexion: Language Agents with Verbal Reinforcement Learning

领域

TLDR（中文）

TLDR (English)

出现在这些文章里

同被引用

相关论文