2 Matching Annotations
  1. Last 7 days
    1. Algorithms like DRQ could even help automate the red-teaming of systems before they are deployed in the real world

      这一句是全文最有商业价值的主张,但也是论证最薄弱的一跳。从「 Core War 里的自动对抗演化」到「现实系统的自动红队测试」,中间需要跨越:真实漏洞空间的结构性差异、目标系统的可执行语义、法律合规约束。Mythos 报告已经展示了 LLM 在真实 CVE 上的能力,DRQ 的贡献更多在框架层(如何用对抗演化系统性探索攻击空间),而非直接的漏洞发现工具。

    2. all programs run on an artificial machine with an artificial language, so nothing generated can execute outside the sandbox

      沙盒安全性是这项研究能够公开发表的前提。但就得警惕的是:沙盒里习得的「攻击策略原理」是可迁移的——即便 Redcode 无法在真实机器执行,演化出的策略(定向轰炸、自复制、多线程扫描)与真实恶意软件的战术同构。DRQ 演化的是「策略模式」,而非具体代码。红队用途的边界需要比「代码不可执行」更仔细地界定。