at approximately $22/AAR-hour, 800 cumulative AAR-hours cost roughly $18,000
$18,000换来了PGR=0.97——约等于1-2周一个研究员的成本,但这是9个智能体5天并行的结果,相当于45人天的等效工作量。更关键的是扩展性:AI研究的真正优势不在于个体速度,而在于近乎无限的并行化能力。同样$18,000可以运行多个独立搜索,结果可以综合;而人类研究的边际成本随并行度线性上升。
at approximately $22/AAR-hour, 800 cumulative AAR-hours cost roughly $18,000
$18,000换来了PGR=0.97——约等于1-2周一个研究员的成本,但这是9个智能体5天并行的结果,相当于45人天的等效工作量。更关键的是扩展性:AI研究的真正优势不在于个体速度,而在于近乎无限的并行化能力。同样$18,000可以运行多个独立搜索,结果可以综合;而人类研究的边际成本随并行度线性上升。
the agents recovered 97% over 800 cumulative hours and used roughly $18,000 in compute
AI安全研究的具体对比:2名人类研究员用约一周时间恢复了23%的性能差距;AI agent用800累计小时+18,000美元算力恢复了97%。18,000美元的算力成本在AI公司是完全可承受的,而「2名顶尖研究员工作一周」的人力成本远不止于此。同等预算下,AI的输出已经碾压人类。「人类仍然选择了问题和评分标准」——这个保留条款现在是唯一剩余的人类不可替代性,而这篇文章本身就是在论证这个条款也在缩窄。
the agents recovered 97% over 800 cumulative hours and used roughly $18,000 in compute
AI安全研究的具体对比:2名人类研究员用约一周时间恢复了23%的性能差距;AI agent用800累计小时+18,000美元算力恢复了97%。注意这里的隐含逻辑:18,000美元的算力成本在AI公司是完全可承受的,而「2名顶尖研究员工作一周」的人力成本远不止于此。同等预算下,AI的输出已经碾压人类。「人类仍然选择了问题和评分标准」——这个保留条款现在是唯一剩余的人类不可替代性,而这篇文章本身就是在论证这个条款也在缩窄。