3 Matching Annotations
  1. Apr 2026
    1. Opus 4.7 is better at using file system-based memory. It remembers important notes across long, multi-session work, and uses them to move on to new tasks that, as a result, need less up-front context.

      在跨会话记忆和上下文利用上的进步,展示了AI向更持久、更连贯的智能体发展的趋势,这种记忆能力使AI能够进行更复杂、更长期的任务,是向真正自主AI迈进的关键一步。

    1. 200K 的上下文窗口,能处理长文档、视频录屏、复杂的技术文档。输出上限 128K token。

      令人惊讶的是,GLM-5V-Turbo拥有高达200K的上下文窗口和128K的输出上限,这意味着它可以一次性处理整本书或数小时的视频内容并生成完整回应。这种上下文处理能力远超大多数现有模型,为处理复杂长任务提供了可能。

    1. TriAttention enables OpenClaw deployment on a single consumer GPU, where long context would otherwise cause out-of-memory with Full Attention

      大多数人认为处理长上下文需要高端GPU或分布式系统,但作者声称他们的方法只需单个消费级GPU就能实现原本需要高端硬件才能处理的长上下文任务。这一观点挑战了人们对长上下文处理硬件需求的普遍认知。