Hypothesis

8 Matching Annotations

Last 7 days
enpire-research.github.io enpire-research.github.io

ENPIRE：现实世界中的智能体机器人策略自我改进 --- ENPIRE: Agentic Robot Policy Self-Improvement in the Real World

1
1. fxp007 18 Jun 2026
  
  in Public
  
  Scaling the robot fleet drives higher token consumption: as more agents read logs, summarize peer branches, and coordinate, the total token budget required to reach a successful policy grows with fleet size
  
  这是一个关于多智能体扩展的微妙发现：机器人数量增加，总token消耗也增加——主要来自智能体之间的协调开销（阅读彼此的日志、总结peer分支）。更大的团队更快到达成功，但边际收益递减，而边际成本递增。这与人类研究团队的规模化规律惊人地相似：超过某个规模后，协调成本开始主导生产成本。
  
  规模化定律 token消耗协调成本
Visit annotations in context

Tags

token消耗

协调成本

规模化定律

Annotators

fxp007

URL

enpire-research.github.io/
openai.com openai.com

Untitled document

1
1. fxp007 18 Jun 2026
  
  in Public
  
  TEMPO could be replaced by a much cheaper analog, 4-hydroxy-TEMPO, with little loss in performance
  
  这个细节揭示了AI辅助实验设计的一个实际价值：不只是找到有效的条件，还能系统地探索更实用的替代方案。4-OH-TEMPO比TEMPO便宜得多也更易获得。在人力驱动的研究中，这类成本优化往往因为探索成本太高而被跳过；在高通量系统里，这是一批额外实验，边际成本极低。这种从发现到实用化的自动延伸，正是AI辅助科研的独特价值。
  
  成本优化 4-OH-TEMPO 实验设计
Visit annotations in context

Tags

4-OH-TEMPO

实验设计

成本优化

Annotators

fxp007

URL

openai.com/index/ai-chemist-improves-reaction/
Jun 2026
alignment.anthropic.com alignment.anthropic.com

自动化弱到强研究者 --- Automated Weak-to-Strong Researcher

1
1. fxp007 12 Jun 2026
  
  in Public
  
  at approximately $22/AAR-hour, 800 cumulative AAR-hours cost roughly $18,000
  
  $18,000换来了PGR=0.97——约等于1-2周一个研究员的成本，但这是9个智能体5天并行的结果，相当于45人天的等效工作量。更关键的是扩展性：AI研究的真正优势不在于个体速度，而在于近乎无限的并行化能力。同样$18,000可以运行多个独立搜索，结果可以综合；而人类研究的边际成本随并行度线性上升。
  
  成本效益可扩展性并行化
Visit annotations in context

Tags

成本效益

可扩展性

并行化

Annotators

fxp007

URL

alignment.anthropic.com/2026/automated-w2s-researcher/
www.anthropic.com www.anthropic.com

When AI builds itself

2
1. fxp007 12 Jun 2026
  
  in Public
  
  the agents recovered 97% over 800 cumulative hours and used roughly $18,000 in compute
  
  AI安全研究的具体对比：2名人类研究员用约一周时间恢复了23%的性能差距；AI agent用800累计小时+18,000美元算力恢复了97%。18,000美元的算力成本在AI公司是完全可承受的，而「2名顶尖研究员工作一周」的人力成本远不止于此。同等预算下，AI的输出已经碾压人类。「人类仍然选择了问题和评分标准」——这个保留条款现在是唯一剩余的人类不可替代性，而这篇文章本身就是在论证这个条款也在缩窄。
  
  数据 AI研究成本效益
2. fxp007 12 Jun 2026
  
  in Public
  
  the agents recovered 97% over 800 cumulative hours and used roughly $18,000 in compute
  
  AI安全研究的具体对比：2名人类研究员用约一周时间恢复了23%的性能差距；AI agent用800累计小时+18,000美元算力恢复了97%。注意这里的隐含逻辑：18,000美元的算力成本在AI公司是完全可承受的，而「2名顶尖研究员工作一周」的人力成本远不止于此。同等预算下，AI的输出已经碾压人类。「人类仍然选择了问题和评分标准」——这个保留条款现在是唯一剩余的人类不可替代性，而这篇文章本身就是在论证这个条款也在缩窄。
  
  数据 AI研究成本效益
Visit annotations in context

Tags

AI研究

数据

成本效益

Annotators

fxp007

URL

anthropic.com/institute/recursive-self-improvement
Apr 2022
www.ruanyifeng.com www.ruanyifeng.com

科技爱好者周刊（第 202 期）：三个有启发的学习方法 - 阮一峰的网络日志

1
1. zoroqi 08 Apr 2022
  
  in Public
  
  计算机使用能量进行计算，那么能不能反过来，使用计算来储存能量？这是可以做到的，让信息变成电池。电力便宜时提前执行某些耗时的计算，并将结果缓存；电力昂贵时，再使用这些计算结果。
  
  《错时计算节省机房成本》
  
  只是减少能量成本, 并没有真的减少能量消耗.
  
  错峰缓存成本
Visit annotations in context

Tags

错峰

成本

缓存

Annotators

zoroqi

URL

ruanyifeng.com/blog/2022/04/weekly-issue-202.html
Mar 2022
www.ruanyifeng.com www.ruanyifeng.com

科技爱好者周刊（第 200 期）：低期望，多尝试 - 阮一峰的网络日志

1
1. zoroqi 25 Mar 2022
  
  in Public
  
  软件行业中，错误的做法往往得到更多的资源。下面是两个例子：一个公司里面，技术债务最多的团队，员工最多。问题最多的软件库或编程语言，产生最多的话题。
  
  HaskellForAll.com
  
  就像 #帕金森定理所说, 膨胀或混乱才是一个组织的正常现象. 对抗这种现象需要付出巨大的力量.
  
  #权力的衡量标准是根据可以控制的人数来决定的
  
  haskell 沉没成本失败
Visit annotations in context

Tags

沉没成本

失败

haskell

Annotators

zoroqi

URL

ruanyifeng.com/blog/2022/03/weekly-issue-200.html
www.ruanyifeng.com www.ruanyifeng.com

科技爱好者周刊（第 198 期）：美国制造是否可能 - 阮一峰的网络日志

1
1. zoroqi 11 Mar 2022
  
  in Public
  
  拜登想要发展美国制造业，有效的方法不是遏制中国，而是让中国的工资上升，那样制造业就会回到美国。
  
  陈平不等式和马恩牌的提出原因吧
  
  制造业成本
Visit annotations in context

Tags

成本

制造业

Annotators

zoroqi

URL

ruanyifeng.com/blog/2022/03/weekly-issue-198.html

Tags

Annotators

URL

Tags

Annotators

URL

Tags

Annotators

URL

Tags

Annotators

URL

Tags

Annotators

URL

Tags

Annotators

URL

Tags

Annotators

URL