Hypothesis

2 Matching Annotations

Last 7 days
enpire-research.github.io enpire-research.github.io

Untitled document

2
1. fxp007 18 Jun 2026
  
  in Public
  
  We introduce Mean Robot Utilization (MRU) and Mean Token Utilization (MTU) as new metrics to evaluate the efficiency of physical multi-agent research
  
  MRU和MTU是两个新指标，揭示了一个此前缺乏语言描述的问题：在物理多智能体研究中，机器人的利用率和token的消耗效率是两个独立的维度，需要同时优化。现有的数字软件评估体系（如pass@k）完全无法捕捉这种物理-计算资源的双重约束。这两个指标本身可能比ENPIRE系统更有长远影响力——它们为后续工作提供了一套评估语言。
  
  MRU MTU 新评估指标
2. fxp007 18 Jun 2026
  
  in Public
  
  Coding agents do not fully utilize robot resources when they are reading logs, writing code, debugging, or waiting for the language-model backbone
  
  这个发现揭示了一个尚未解决的效率问题：物理资源（机器人）和计算资源（GPU）被智能体的思考时间浪费了。智能体在阅读日志、写代码、等待LM响应时，机器人闲置。这与多处理器计算中的同步开销是同一个问题的变体——如何让智能体的认知周期和物理执行周期更好地交叉重叠，是这类系统真正走向规模化的关键工程挑战。
  
  资源利用率 MRU 规模化瓶颈
Visit annotations in context

Tags

MTU

MRU

资源利用率

新评估指标

规模化瓶颈

Annotators

fxp007

URL

enpire-research.github.io/

Tags

Annotators

URL