2 Matching Annotations
  1. Last 7 days
    1. The most reliable way to improve a skill over time is to evaluate it the same way you would any other prompt for LLM applications.

      大多数人可能认为AI代理技能需要特殊的、独特的评估方法,但作者认为它们应该被视为普通LLM提示应用的一部分进行评估。这个观点挑战了AI代理评估需要特殊框架的共识,主张统一的方法论。

  2. Nov 2021