Anthropic声称已解决了长期存在的重大代理问题,即人工智能在跨会话过程中会忘记先前接收到的指令。他们采用了一种双代理架构,该架构能够连接不同的情境窗口。
基于基础模型构建的代理在会话之间会丢失内存,因为上下文窗口是有限的,这导致在复杂任务中出现异常行为和遗忘指令
Anthropic的解决方案:初始化代理设置环境并记录进度,而编码代理进行增量更改并为下一个会话留下结构化更新
以前的失败表现为两种模式:代理人尝试过多,在任务中途失去了背景;或者代理人看到部分进展,过早地宣布工作完成了。
工程师们在“高效的软件工程师每天做的事情”的启发下,增加了测试工具,帮助代理识别单从代码中看不到的缺陷。
方法在全栈Web开发中进行了测试;Anthropic指出,单个通用代理与多代理结构仍然是一个开放的研究问题。
为什么重要:
代理内存一直是限制企业 AI 应用的隐形天花板——系统如果在项目进行中忘记指令,便会产生不可预测且对企业安全构成威胁的行为。Anthropic的双代理切换模式将上下文限制视为架构问题,而不是模型能力问题,这可能允许任意进行长时间代理会话。更广泛的影响:复杂的多阶段任务,如科学研究与财务建模,可能最终有望由自主 AI 来完成。


雷达卡





京公网安备 11010802022788号







