If this pace of progress continues — doubling task length every six or seven months — we should expect LLMs capable of completing week-long tasks some time next year, and month-long tasks in 2028.
周级任务明年,月级任务 2028——这个时间线与 METR 自己的预测(12-18 个月内 200 小时时间地平线)高度吻合,两个独立来源的收敛给了这个预测更高的可信度。月级任务意味着 AI 能独立完成一个完整的短期项目,从需求到交付。这不是「AI 辅助工作」的时代,而是「AI 执行项目」的时代——而距离这个时代到来,按目前的轨迹只有不到三年。