2 Matching Annotations
  1. Last 7 days
    1. As AI models continue to improve, hardening their defenses might actually get easier.

      大多数人认为随着AI能力增强,安全挑战会越来越大,但作者认为更先进的AI模型实际上可能使防御变得更容易。这一反直觉观点挑战了人们对AI安全威胁随技术进步而加剧的普遍认知,暗示AI安全可能不是线性恶化的问题。

  2. Jan 2021