贝索斯认为AI生产力提升将导致劳动力稀缺,与主流AI领袖预测的大规模失业观点相左。
- Last 7 days
-
www.technologyreview.com www.technologyreview.com
-
DeepMind认为学术界能比企业实验室看得更远,不受短期商业目标限制,这是推动多智能体安全研究的关键动力。
-
-
www.anthropic.com www.anthropic.com
-
It's becoming clear that much of what advances the frontier is automatable; large-scale research progress is mostly a function of tools and resources, which dictate how fast you can run experiments, how many you can run at once, and how quickly you can get results.
这是文中最具争议性的哲学主张:「大部分前沿进展是可自动化的」。反驳:Transformer、RLHF等范式级突破不是「把已知实验跑得更快」的产物,而是概念上的跳跃。作者的反驳是:这些范式突破间隔多年,中间99%的进展靠的是规模化+调试+迭代。如果Claude已经擅长后者,那「前沿」就意味着:方向设定(人类)+大规模自动执行(AI)。这个分工假设成立的前提是:下一个Transformer级别的突破何时到来,以及它是否同样可以自动化。
-
our best model in November 2025 (Opus 4.5) beat the human choice 51% of the time; in April 2026 (Mythos Preview), this grew to 64%
研究判断力的进化:从51%(略好于随机)到64%,6个月内提升13个百分点。但这个设计本身值得仔细审视:实验选取的是「人类做出了次优选择」的时刻(n=129),因此这不是无偏的人机对比,而是「在人类容易出错的情境下,模型犯同样错误的频率有多低」。即便如此,从51%到64%意味着:模型不只是在执行层超越人类,在判断层也开始建立优势——而判断层正是这篇文章认为「人类最后的比较优势」所在。
-
It's becoming clear that much of what advances the frontier is automatable; large-scale research progress is mostly a function of tools and resources, which dictate how fast you can run experiments, how many you can run at once, and how quickly you can get results.
这是文中最具争议性的哲学主张:「大部分前沿进展是可自动化的」。反驳:Transformer、注意力机制、RLHF等范式级突破不是「把已知实验跑得更快」的产物,而是概念上的跳跃。作者的反驳是:这些范式突破间隔多年,中间99%的进展靠的是「规模化+调试+迭代」。如果Claude已经擅长后者,那「前沿」就意味着:方向设定(人类)+大规模自动执行(AI)。这个分工假设成立的前提是:下一个Transformer级别的突破何时到来,以及它是否同样可以自动化。
-
our best model in November 2025 (Opus 4.5) beat the human choice 51% of the time; in April 2026 (Mythos Preview), this grew to 64%
研究判断力的进化:从51%(略好于随机)到64%,6个月内提升13个百分点。但这个设计本身值得仔细审视:实验选取的是「人类做出了次优选择」的时刻(n=129),因此这不是无偏的人机对比,而是「在人类容易出错的情境下,模型犯同样错误的频率有多低」。即便如此,从51%到64%的提升意味着:模型不只是在执行层超越人类,在判断层也开始建立优势——而判断层正是这篇文章认为「人类最后的比较优势」所在。
Tags
Annotators
URL
-
-
sakana.ai sakana.ai
-
this dynamic adversarial process leads to the emergence of increasingly general strategies and reveals an intriguing form of convergent evolution, where different code implementations settle into similar high-performing behaviors
这是全文最重要的实验结果:不同初始条件的独立演化路径,最终收敛到相似的行为策略。这与生物界鸟和蝙蝠各自独立演化出翅膀如出一辙。对 AI 研究者的启示:存在某种「最优策略的引力盆地」——无论从哪个起点出发,对抗压力会把系统推向相同的解。这意味着复杂能力的涌现可能比我们想象的更具必然性。
-