2 Matching Annotations
  1. Last 7 days
    1. We introduce Mean Robot Utilization (MRU) and Mean Token Utilization (MTU) as new metrics to evaluate the efficiency of physical multi-agent research

      MRU和MTU是两个新指标,揭示了一个此前缺乏语言描述的问题:在物理多智能体研究中,机器人的利用率和token的消耗效率是两个独立的维度,需要同时优化。现有的数字软件评估体系(如pass@k)完全无法捕捉这种物理-计算资源的双重约束。这两个指标本身可能比ENPIRE系统更有长远影响力——它们为后续工作提供了一套评估语言。

    2. Coding agents do not fully utilize robot resources when they are reading logs, writing code, debugging, or waiting for the language-model backbone

      这个发现揭示了一个尚未解决的效率问题:物理资源(机器人)和计算资源(GPU)被智能体的思考时间浪费了。智能体在阅读日志、写代码、等待LM响应时,机器人闲置。这与多处理器计算中的同步开销是同一个问题的变体——如何让智能体的认知周期和物理执行周期更好地交叉重叠,是这类系统真正走向规模化的关键工程挑战。