4 Matching Annotations
  1. Last 7 days
    1. Overall, it usually takes me about two hours to do this task. If only it were as simple as a single copy and paste, life would be so much easier — or so I thought.

      作者完成文章发布任务通常需要约2小时,而AI在这一任务上表现极差。这一时间对比数据点突显了AI在看似简单任务上的局限性,支持了莫拉维克悖论的观点。然而,作者没有提供AI完成该任务的具体时间数据,这使得比较不够完整。

  2. Apr 2026
    1. Older models were more prone to submitting prematurely, even when test cases weren't passing.

      这一观察揭示了不同AI模型版本之间在任务坚持性上的显著差异。早期模型更容易过早提交不完整的解决方案,而最新模型表现出更强的任务坚持性和工程判断力。这种差异可能反映了AI在自我评估和任务管理能力上的进化。

  3. Aug 2020
  4. May 2020