Self-Rewriting Meta-Prompt Loop

Nikola Balic (@nibzard)· emerging

问题

当Agent遇到新任务和边缘案例时，静态系统Prompt会变得过时或过于僵化。手动编辑这类Prompt不仅速度慢，还容易出错。

方案

让Agent在每次交互后重写自身的system prompt：

复盘最新对话或交互轮次。
草拟对指令的改进方案（添加启发式规则、优化工具使用建议、废弃无效规则）。
验证草拟的方案（开展内部合理性检查或外部准入校验）。
用修订后的版本替换旧的system prompt，并在版本控制系统中持久化存储。
在新一轮交互中使用新的prompt，完成自我优化闭环。

# 伪代码
dialogue = run_episode()  # 执行一轮交互会话
delta = LLM("基于对话内容复盘并提出prompt修改建议", dialogue)
if passes_guardrails(delta):  # 通过校验规则
    system_prompt += delta  # 将修改增量合并到system prompt
    save(system_prompt)  # 保存更新后的system prompt

权衡

优点：适配速度快；针对小幅调整无需人工介入闭环。缺点：存在模型漂移（drift）或越狱（jailbreak）风险——需设置强有力的防护环节。

参考文献

关键词：

聚焦元提示技术，提出一种可实现语言智能体自我提升的简便方案，该文献发布于Substack平台。

\n\n

直译：

古德曼，《元提示：一种简单的自我提升型语言智能体》。（来源：noahgoodman.substack.com）

来源摘要

正在获取来源并生成中文摘要…

来源: https://noahgoodman.substack.com/p/meta-prompt-a-simple-self-improving

← 返回社区