2 Matching Annotations
  1. Last 7 days
    1. A central pattern emerging in generative AI is a shift from 'thinking by doing' (e.g. writing a document) toward 'choosing from outputs' (e.g. prompting AI to write a document).

      这一转变挑战了人类专业能力发展的传统认知。从'通过思考做事'到'从输出中选择'的转变可能削弱人类判断力和专业知识培养,这与人们通常认为的AI增强人类能力的观点形成鲜明对比,揭示了AI可能带来的认知能力退化风险。

  2. Apr 2026
    1. Large language models (LLMs) sometimes appear to exhibit emotional reactions. We investigate why this is the case in Claude Sonnet 4.5 and explore implications for alignment-relevant behavior.

      这篇论文的问题意识本身就极具洞察:大多数 AI 安全研究在追问「模型会不会说谎」,Anthropic 却在追问「模型为什么有情绪」。从「行为纠偏」转向「情绪机制」,意味着对齐研究的范式正在悄然转移——从控制外部输出,到理解内部动机结构,这是从行为主义到认知科学的跨越。