current systems remain highly vulnerable
尽管AI安全研究取得了显著进展,但作者通过AgentHazard基准测试表明,当前最先进的计算机使用代理系统仍然极其脆弱,这挑战了学术界和工业界对AI安全水平已经足够高的普遍认知。
current systems remain highly vulnerable
尽管AI安全研究取得了显著进展,但作者通过AgentHazard基准测试表明,当前最先进的计算机使用代理系统仍然极其脆弱,这挑战了学术界和工业界对AI安全水平已经足够高的普遍认知。