convergence does not occur at the level of source code, indicating that what converges is function rather than implementation
表现型(行为)收敛,基因型(代码)不收敛——这个区分极为精妙。不同的代码实现了相同的功能,就像蜘螃和蛇各自独立演化出毒液但分子机制完全不同。对大模型研究的类比:不同架构、不同训练数据的模型可能在能力层面收敛,而在「实现层」保持多样性。评估 AI 能力时,只看代码/权重是不够的,必须看行为。