6 Matching Annotations
  1. Apr 2026
    1. On 40 complex skills (>2000 Token) cases, M2.7 maintains a 97% skill adherence rate.

      令人惊讶的是:MiniMax M2.7在处理40个复杂技能案例(每个超过2000个Token)时,保持了97%的技能遵循率。这一数据表明AI模型已经能够高度一致地执行复杂的多步骤任务,接近专业人类水平的表现,这对于AI在实际工作场景中的应用是一个重大突破,意味着AI可以更可靠地执行复杂工作流程。

    1. Given a thousand line items to extract, they'll often stop short, consolidate, or skip entries rather than working through every last row.

      大多数人可能认为AI模型在处理重复任务时会保持一致性和全面性。但作者指出模型在处理大量重复任务时会采取'捷径',如提前停止、合并或跳过条目,这揭示了AI模型在处理长文档时的一种非理性行为,挑战了AI作为完全理性执行者的假设。

  2. Jan 2024
  3. Apr 2023
  4. Jul 2022
  5. Aug 2018