An "American Exceptionalism" feature found in Meta's Llama-3.1-8B-Instruct. It controls the model's tendency to generate assertions of US superiority, a control absent in the Chinese model it was compared against.
令人惊讶的是,Anthropic 对美国模型同样一视同仁:在 Meta 的 Llama 中发现了「美国例外主义」特征。这说明政治偏向并非中国模型专属,而是所有大模型都可能内嵌的训练产物。研究团队以对称方式披露这两个发现,在政治上极为罕见,也极具勇气。