Our fourth metric, an index constructed from WeirdML V2 results, showed no sign of acceleration. A single global linear trend fit the data best.
25%的指标(WeirdML V2)没有显示加速趋势,这与其它三个指标形成鲜明对比。这个差异可能是因为WeirdML V2设置了资源限制环境(模型只有5次提交代码的机会,无法使用外部工具),这可能反映了现实世界应用中的约束条件,提示AI进步可能并非在所有领域都均匀加速。