7 Matching Annotations
  1. Last 7 days
    1. It's becoming clear that much of what advances the frontier is automatable; large-scale research progress is mostly a function of tools and resources, which dictate how fast you can run experiments, how many you can run at once, and how quickly you can get results.

      这是文中最具争议性的哲学主张:「大部分前沿进展是可自动化的」。反驳:Transformer、RLHF等范式级突破不是「把已知实验跑得更快」的产物,而是概念上的跳跃。作者的反驳是:这些范式突破间隔多年,中间99%的进展靠的是规模化+调试+迭代。如果Claude已经擅长后者,那「前沿」就意味着:方向设定(人类)+大规模自动执行(AI)。这个分工假设成立的前提是:下一个Transformer级别的突破何时到来,以及它是否同样可以自动化。

    2. our best model in November 2025 (Opus 4.5) beat the human choice 51% of the time; in April 2026 (Mythos Preview), this grew to 64%

      研究判断力的进化:从51%(略好于随机)到64%,6个月内提升13个百分点。但这个设计本身值得仔细审视:实验选取的是「人类做出了次优选择」的时刻(n=129),因此这不是无偏的人机对比,而是「在人类容易出错的情境下,模型犯同样错误的频率有多低」。即便如此,从51%到64%意味着:模型不只是在执行层超越人类,在判断层也开始建立优势——而判断层正是这篇文章认为「人类最后的比较优势」所在。

    3. It's becoming clear that much of what advances the frontier is automatable; large-scale research progress is mostly a function of tools and resources, which dictate how fast you can run experiments, how many you can run at once, and how quickly you can get results.

      这是文中最具争议性的哲学主张:「大部分前沿进展是可自动化的」。反驳:Transformer、注意力机制、RLHF等范式级突破不是「把已知实验跑得更快」的产物,而是概念上的跳跃。作者的反驳是:这些范式突破间隔多年,中间99%的进展靠的是「规模化+调试+迭代」。如果Claude已经擅长后者,那「前沿」就意味着:方向设定(人类)+大规模自动执行(AI)。这个分工假设成立的前提是:下一个Transformer级别的突破何时到来,以及它是否同样可以自动化。

    4. our best model in November 2025 (Opus 4.5) beat the human choice 51% of the time; in April 2026 (Mythos Preview), this grew to 64%

      研究判断力的进化:从51%(略好于随机)到64%,6个月内提升13个百分点。但这个设计本身值得仔细审视:实验选取的是「人类做出了次优选择」的时刻(n=129),因此这不是无偏的人机对比,而是「在人类容易出错的情境下,模型犯同样错误的频率有多低」。即便如此,从51%到64%的提升意味着:模型不只是在执行层超越人类,在判断层也开始建立优势——而判断层正是这篇文章认为「人类最后的比较优势」所在。

    1. this dynamic adversarial process leads to the emergence of increasingly general strategies and reveals an intriguing form of convergent evolution, where different code implementations settle into similar high-performing behaviors

      这是全文最重要的实验结果:不同初始条件的独立演化路径,最终收敛到相似的行为策略。这与生物界鸟和蝙蝠各自独立演化出翅膀如出一辙。对 AI 研究者的启示:存在某种「最优策略的引力盆地」——无论从哪个起点出发,对抗压力会把系统推向相同的解。这意味着复杂能力的涌现可能比我们想象的更具必然性。