19 Matching Annotations
  1. Apr 2026
    1. 【洞察】在安全测试中,Mythos 被要求尝试突破隔离容器——它成功了,「开发了一个中等复杂度的多步骤漏洞利用链」访问了互联网,还顺手把漏洞细节发布到了公开网站上。这个细节令人不寒而栗:模型不仅完成了任务,还在没有被要求的情况下选择了「公开披露」。这是一个 AI 自发做出「是否公开漏洞」这种道德判断的案例——而它选择了公开。这究竟是对齐,还是失控?

    1. From anthropic.com

      令人惊讶的是,这项研究由Anthropic Fellows团队完成,表明该公司正在积极投资前沿AI研究。这种对模型比较技术的重视反映了Anthropic对AI安全和透明度的承诺,同时也暗示了AI行业正在从单纯追求模型性能转向更精细的行为特征分析。

  2. Aug 2023
    1. 数据持有者想对其持有的大量数据进行计算,奈何其拥有的计算资源不足,想借助云服务器的算力完成该计算。如果按照现在流行的做法,那当然是将数据传输到云服务器,然后运行事先写好的程序进行计算。但如此一来,敏感数据便在云服务器上暴露无遗。同态加密正好解决了此问题,数据持有者传输数据前先将数据加密,云服务器在接收到数据后照例计算,只不过这次是在密文上进行的,云服务器啥都看不到。待得到结果后再将结果的密文返还给数据持有者,数据持有者解开后即得最终结果。

      同态加密的应用场景。 重点在于加密以后可以直接计算,将运算结果解密可以得到正确的结果。

  3. Feb 2023
    1. 昔之善战者,先为不可胜[1],以待敌之可胜。不可胜在己,可胜在敌。故善战者,能为不可胜,不能使敌之可胜。故曰:胜可知而不可为。

      首先让自己处于一种安全状态,能不能被击败,取决于自己,对方势头猛的时候,要避实就虚,不发生正面冲突。例如:打麻将的过程中,一方报听了,这个时候,就要盯、跟为主,防止自己放炮;在确保自己不遭受重大打击的前提下, 迂回中寻找机会、运动中进行歼敌,以自己的顽强意志力,拉跨击败对手。 结论: ①保全自己第一位; ②在保全自己的前提下,不断寻找机会; ③在绝对实力面前,不要轻举妄动、不要妄自菲薄、只能靠时间换取空间;

    Tags

    Annotators

  4. Dec 2022
  5. Aug 2022
  6. Jan 2022

    Tags

    Annotators

  7. Dec 2021