最新随机对照实验得出了令人意外的结论:当经验丰富的开源程序员使用当前主流AI工具时,其编码效率反而出现了明显下降?METR(模型评估与威胁研究)团队招募了16位平均拥有多年开源项目经验的开发者,追踪记录他们在维护代码库过程中的246项常规任务,包括漏洞修复、功能开发和代码重构。实验采用分组对照设计:

  • 半数任务使用Cursor Pro或Anthropic Claude等AI工具辅助
  • 另一半任务禁用AI辅助
    为平衡任务难度,研究人员预先评估了各项任务预期耗时,并将代码审查阶段的修改时间纳入整体效率评估。

参与者在实验前预估AI工具可缩短24%工作时间,实际使用后仍主观认为效率提升20%。然而客观数据显示:AI辅助组完成任务耗时反而增加19%,效率不升反降。通过屏幕录像数据发现,AI工具确实减少了开发者33%的主动编码时间,但新增的隐性操作吞噬了这些收益:

  1. 输出审查耗时:开发者需花费9%的总任务时间检查AI生成代码
  2. 交互成本激增:包括指令调试、等待响应等无效时间
  3. 修改成本:仅44%的AI生成代码可直接使用,多数需要人工调整

AI工具尽管减少了某些环节的工作量,却引入了新的效率瓶颈。大部分程序员表示他们需要修改 AI 生成的代码。目前AI工具在编程环境中仍然有很大局限性。

消息来源:https://arstechnica.com/ai/2025/07/study-finds-ai-tools-made-open-source-software-developers-19-percent-slower/