The most reliable way to improve a skill over time is to evaluate it the same way you would any other prompt for LLM applications.
大多数人可能认为AI代理技能需要特殊的、独特的评估方法,但作者认为它们应该被视为普通LLM提示应用的一部分进行评估。这个观点挑战了AI代理评估需要特殊框架的共识,主张统一的方法论。
The most reliable way to improve a skill over time is to evaluate it the same way you would any other prompt for LLM applications.
大多数人可能认为AI代理技能需要特殊的、独特的评估方法,但作者认为它们应该被视为普通LLM提示应用的一部分进行评估。这个观点挑战了AI代理评估需要特殊框架的共识,主张统一的方法论。
Racine, N., Madigan, S., Cardinal, S., Hartwick, C., Leslie, M., Motz, M., & Pepler, D. (2021). Community-Based Research: Perspectives of Psychology Researchers and Community Partners. PsyArXiv. https://doi.org/10.31234/osf.io/cxrmt