The model kept finding better approaches the longer it ran, which connects directly to the long horizon behavior that makes agentic models actually useful in production.
这个发现揭示了代理模型在长时间运行任务中的独特优势 - 它们能够持续改进而非达到性能上限。这与传统AI模型形成鲜明对比,后者通常在训练完成后性能相对固定。这种持续学习能力可能是代理模型在实际生产环境中超越其他模型的关键因素。