8 Matching Annotations
  1. Last 7 days
    1. Scaling the robot fleet drives higher token consumption: as more agents read logs, summarize peer branches, and coordinate, the total token budget required to reach a successful policy grows with fleet size

      这是一个关于多智能体扩展的微妙发现:机器人数量增加,总token消耗也增加——主要来自智能体之间的协调开销(阅读彼此的日志、总结peer分支)。更大的团队更快到达成功,但边际收益递减,而边际成本递增。这与人类研究团队的规模化规律惊人地相似:超过某个规模后,协调成本开始主导生产成本。

    1. TEMPO could be replaced by a much cheaper analog, 4-hydroxy-TEMPO, with little loss in performance

      这个细节揭示了AI辅助实验设计的一个实际价值:不只是找到有效的条件,还能系统地探索更实用的替代方案。4-OH-TEMPO比TEMPO便宜得多也更易获得。在人力驱动的研究中,这类成本优化往往因为探索成本太高而被跳过;在高通量系统里,这是一批额外实验,边际成本极低。这种从发现到实用化的自动延伸,正是AI辅助科研的独特价值。

  2. Jun 2026
    1. at approximately $22/AAR-hour, 800 cumulative AAR-hours cost roughly $18,000

      $18,000换来了PGR=0.97——约等于1-2周一个研究员的成本,但这是9个智能体5天并行的结果,相当于45人天的等效工作量。更关键的是扩展性:AI研究的真正优势不在于个体速度,而在于近乎无限的并行化能力。同样$18,000可以运行多个独立搜索,结果可以综合;而人类研究的边际成本随并行度线性上升。

    1. the agents recovered 97% over 800 cumulative hours and used roughly $18,000 in compute

      AI安全研究的具体对比:2名人类研究员用约一周时间恢复了23%的性能差距;AI agent用800累计小时+18,000美元算力恢复了97%。18,000美元的算力成本在AI公司是完全可承受的,而「2名顶尖研究员工作一周」的人力成本远不止于此。同等预算下,AI的输出已经碾压人类。「人类仍然选择了问题和评分标准」——这个保留条款现在是唯一剩余的人类不可替代性,而这篇文章本身就是在论证这个条款也在缩窄。

    2. the agents recovered 97% over 800 cumulative hours and used roughly $18,000 in compute

      AI安全研究的具体对比:2名人类研究员用约一周时间恢复了23%的性能差距;AI agent用800累计小时+18,000美元算力恢复了97%。注意这里的隐含逻辑:18,000美元的算力成本在AI公司是完全可承受的,而「2名顶尖研究员工作一周」的人力成本远不止于此。同等预算下,AI的输出已经碾压人类。「人类仍然选择了问题和评分标准」——这个保留条款现在是唯一剩余的人类不可替代性,而这篇文章本身就是在论证这个条款也在缩窄。

  3. Apr 2022
  4. Mar 2022
    1. 软件行业中,错误的做法往往得到更多的资源。下面是两个例子: 一个公司里面,技术债务最多的团队,员工最多。 问题最多的软件库或编程语言,产生最多的话题。

      HaskellForAll.com

      就像 #帕金森定理 所说, 膨胀或混乱才是一个组织的正常现象. 对抗这种现象需要付出巨大的力量.

      #权力 的衡量标准是根据可以控制的人数来决定的