11 Matching Annotations
  1. Last 7 days
    1. This attack achieved a high success rate against state-of-the-art models, including Claude Opus 4.7.

      大多数人认为最新的AI模型已经足够先进可以抵抗基本的注入攻击,但作者证明即使是像Claude Opus 4.7这样的前沿模型也无法抵御简单的间接提示注入,这挑战了人们对先进AI模型安全性的过高期望。

  2. May 2023
  3. Apr 2023