We introduce Mean Robot Utilization (MRU) and Mean Token Utilization (MTU) as new metrics to evaluate the efficiency of physical multi-agent research
MRU和MTU是两个新指标,揭示了一个此前缺乏语言描述的问题:在物理多智能体研究中,机器人的利用率和token的消耗效率是两个独立的维度,需要同时优化。现有的数字软件评估体系(如pass@k)完全无法捕捉这种物理-计算资源的双重约束。这两个指标本身可能比ENPIRE系统更有长远影响力——它们为后续工作提供了一套评估语言。