7 Matching Annotations
  1. Last 7 days
    1. Real-time monitoring of agent actions with a 12-category anomaly detection system derived from frontier model safety evaluations. Three-level alert system: PROHIBITED (immediate block), HIGH_RISK_DUAL_USE (human review), DUAL_USE (log and track).

      这种三级警报系统展示了AI安全监控的精细化程度,将代理行为分为不同风险级别,从完全禁止到仅记录跟踪。这种分类方法反映了AI安全中'双重用途'挑战的复杂性,即同一技术既可用于防御也可用于攻击。

    1. On these tasks, our Gemini Robotics-ER models improve over baseline Gemini 3.0 Flash performance (+6% in text, +10% in video) in perceiving injury risks accurately.

      这一数据展示了AI在安全风险识别方面的具体进步,特别是在视频理解上的显著提升(+10%)。这表明机器人系统正在更好地理解人类环境中的潜在危险,这一能力对于实现人机协作至关重要。然而,这也引发了一个深刻问题:当AI能够识别风险时,它是否应该被赋予干预决策的权力?这涉及到AI自主性与人类监督之间的平衡问题。

  2. Jan 2022
  3. Dec 2021
  4. Oct 2020
  5. Jul 2020