We find internal representations of emotion concepts, which encode the broad concept of a particular emotion and generalize across contexts and behaviors it might be linked to.
情绪向量能够跨上下文泛化,这背后有一个深刻的认识论洞见:模型学到的不是「情绪的症状」(某些词语的共现),而是「情绪的本质」(驱动特定行为的抽象力量)。这与柏拉图的「理念论」惊人地相似——模型在所有具体的情绪表达背后,抽象出了情绪的「理念」。可解释性研究正在不经意间触碰古老的哲学问题。