9 parallel AARs achieved PGR=0.97 in five days, while the human researcher baseline achieved PGR=0.23 in seven days
这是论文最震撼的一行数字:9个并行AI研究员5天达到PGR=0.97,人类研究员7天只有0.23,效率比约为17:1。更关键的是基线的定义——这里的人类是有实验室资源支持的专业研究员。这意味着在这个特定任务上,AI不只是比人快,而是在同等约束条件下达到了近乎完美的解。