Studying forks and other backends was more productive than searching arxiv. ik_llama.cpp and the CUDA backend directly informed two of the five final optimizations.
令人惊讶的是:在实际项目中,研究分支代码和其他后端实现比查阅学术论文更有价值。这揭示了AI代理在实践中的学习偏好,也表明开源社区的实际贡献往往比理论研究更能提供直接可用的优化方案。