linearb 发布了第5份软件工程基准报告，这次特意出了个ai 生产力版，也叫英文版。

LinearB给咱们发布了第5份软件工程基准报告，这次特意出了个AI生产力版，也叫英文版。这个报告把来自42个国家的4800支开发团队的810多万个拉取请求（PR）都给汇总了，还结合了工程领导力AI调研的定性分析，专门看AI怎么影响软件开发的。报告一共给出了三个维度的数据：交付、可预测性、项目管理。按企业规模分了三种：企业级（1000+员工）、成长期（200-1000员工）、初创级（0-200员工）。比如精英级团队搞完编码只要不到54分钟，周期时间也低于25小时。初创企业在合并频率和部署频率这些交付指标上表现更好，而企业级因为人多流程更复杂。说到AI对开发的影响，这是报告的重点。虽然它确实帮着把代码产量给推高了，但是也带来了评审和测试这些下游的麻烦。更有意思的是，AI做出来的PR跟人工的表现差别很大：用AI辅助写的代码量是人工的2.6倍多，可智能体AI提交后等审查的时间是人工的5.3倍多。AI PR 30天被接受的比例只有32.7%，还没到人工的一半呢。而且用了AI多并不代表交付价值就高了。不同的AI工具接受率也不一样，Devin这块还在慢慢涨，Copilot倒是有点往下滑的趋势。大家还发现AI主要用在写新代码上，对改旧代码这事儿不太感兴趣。现在日常用AI工具的频率已经达到了88.3%，可开发者对AI写出来的代码质量信心不高，只有6.4%的人说极度信任。有45%的公司压根没正式衡量过AI的影响。虽然75%的管理者觉得AI能提升生产力，但效果大多是他们看出来的主观感觉，不是啥精确数据。企业在AI这块也有短板。虽然30.5%的企业有清楚的使用政策，但21.1%完全没有规则可言。而且15.6%的企业数据质量不行没法支撑AI干活，这成了AI落地最大的结构性障碍。不过好在团队在版本控制这些日常工作上挺成熟的。报告指出现在的情况是，AI已经深度融入开发工作了，但配套的流程、工具和组织架构还没跟上步伐。最主要的障碍就是AI生成的代码缺上下文、质量不稳定、所有权还模糊不清，这让评审的时候总是犹豫再三，接受率自然就低。对未来大家是这么看的：领导者觉得以后AI会去干更多基础的开发活，好让开发者腾出时间搞架构设计这些高级的事。不过效果还是要看企业流程和数据基础好不好来定。这次报告特意拿掉了MTTR指标（平均修复时间），因为各个公司的定义和算法太不一样了没法比较。另外还发现73.1%的团队在做迭代规划的时候有点保守，不想冒大险；只有14.7%的团队在规划精度上达到了理想水平。建议大家多看看自家内部指标的趋势变化，比如怎么优化PR的规模和返工率这些方面来提升交付的可预测性。