2 Matching Annotations
  1. Last 7 days
    1. Our main thesis is to keep the scaffold light and easy to change so the intelligence of the model is tested, rather than the ingenuity of the scaffold

      这是整个项目最重要的设计哲学,也是最有争议的赌注。大多数AI智能体系统的成功来自精心设计的脚手架——复杂的提示工程、分步骤工作流、大量错误处理逻辑。Andon Labs反其道而行:最小化脚手架,让模型内在能力暴露出来。这既是测试方法论,也是关于AI发展路径的信仰声明:如果模型足够强,它应该能在结构少的情况下工作。

    1. A fixed workflow (propose ideas, generate plans, write code, run smoke tests, run full training, analyze results, repeat) seems reasonable but underperforms giving AARs no workflow at all

      这个发现颠覆了许多人对AI智能体的直觉。我们自然倾向于给AI更多结构——分步骤、有检查点、有模板,以为这会让它更可靠。但论文发现正相反:规定工作流约束了AAR适应具体想法的能力。当流程固定,智能体只能把想法塞进流程;当流程自由,智能体会根据想法定制流程。这对所有AI智能体产品都有启示:过度的scaffolding是一种隐性的能力税。