8 Matching Annotations
  1. Jun 2026
    1. OKF cleanly separates who writes the knowledge from who consumes it

      生产者/消费者解耦是OKF三大设计原则中最具工程价值的一条。人手写的文档、元数据导出管线生成的文档、一个LLM合成的文档——都可以被另一个LLM、一个可视化工具或一个搜索引擎无差别地消费。这类似于HTTP把内容生产和内容展现解耦,或者RSS把内容和阅读器解耦。这种解耦一旦发生,生态系统就有机会在两端独立生长:更好的生产工具和更好的消费工具可以各自演进,不需要协同。

    1. When we applied the top AAR-discovered ideas to a production-scale w2s run, we observed only +0.5pt improvement in a noisy floor, suspected to be an elicitation failure

      论文里最诚实的一段。实验室环境的PGR=0.97迁移到生产规模后几乎消失,作者诊断为引发失败——能力在那里,但我们不知道如何正确唤起它。这个失败模式极具代表性:小规模验证和大规模部署之间存在我们目前不完全理解的鸿沟。在对齐研究语境里这尤其危险:一个技术在对照实验中有效,并不保证在实际部署中有效。

    1. more than 80% of the code we merge into Anthropic's codebase was authored by Claude

      这个数字需要和脚注3一起读:80%+是合并到生产环境的行数中可归因于Claude的比例,已经是保守计算——脚注承认归因系统有漏洞,且未归因部分也包括大量非人工手写代码。真实比例可能更接近Anthropic领导层公开引用的90%+。即便是保守的80%,意义也是清晰的:在世界上最顶尖的AI研究机构里,人类工程师的核心工作已经从写代码转变为审查和导向代码。

    2. more than 80% of the code we merge into Anthropic's codebase was authored by Claude

      这个数字需要和脚注3一起读:80%+是合并到生产环境的行数中可归因于Claude的比例,已经是保守计算——脚注承认归因系统有漏洞,且未归因部分也包括大量非人工手写代码。真实比例可能更接近Anthropic领导层公开引用的90%+。但即便是保守的80%,意义也是清晰的:在世界上最顶尖的AI研究机构里,人类工程师的核心工作已经从「写代码」转变为「审查和导向代码」。

  2. Dec 2022
  3. May 2022
    1. 中国是个塑料原料生产大国,更是个巨大的塑料制品消费国。据行业权威数据统计显示,截止2013年国内塑料制品上一定规模的企业有13699个。全国塑料产品产量6188.66万吨,同比增长8.02%。其中,塑料薄膜制品产量为1089.3万吨;塑料日用品产量为471.6万吨;塑料人造革、合成革制品产量为347万吨;纤维强化塑料产品产量259.86万吨;泡沫塑料产品产量为146.5万吨。
  4. Nov 2021