linearb 发布了第5份软件工程基准报告,这次特意出了个ai 生产力版,也叫英文版。

LinearB给咱们发布了第5份软件工程基准报告,这次特意出了个AI生产力版,也叫英文版。这个报告把来自42个国家的4800支开发团队的810多万个拉取请求(PR)都给汇总了,还结合了工程领导力AI调研的定性分析,专门看AI怎么影响软件开发的。 报告一共给出了三个维度的数据:交付、可预测性、项目管理。按企业规模分了三种:企业级(1000+员工)、成长期(200-1000员工)、初创级(0-200员工)。比如精英级团队搞完编码只要不到54分钟,周期时间也低于25小时。初创企业在合并频率和部署频率这些交付指标上表现更好,而企业级因为人多流程更复杂。 说到AI对开发的影响,这是报告的重点。虽然它确实帮着把代码产量给推高了,但是也带来了评审和测试这些下游的麻烦。更有意思的是,AI做出来的PR跟人工的表现差别很大:用AI辅助写的代码量是人工的2.6倍多,可智能体AI提交后等审查的时间是人工的5.3倍多。AI PR 30天被接受的比例只有32.7%,还没到人工的一半呢。而且用了AI多并不代表交付价值就高了。不同的AI工具接受率也不一样,Devin这块还在慢慢涨,Copilot倒是有点往下滑的趋势。 大家还发现AI主要用在写新代码上,对改旧代码这事儿不太感兴趣。现在日常用AI工具的频率已经达到了88.3%,可开发者对AI写出来的代码质量信心不高,只有6.4%的人说极度信任。有45%的公司压根没正式衡量过AI的影响。虽然75%的管理者觉得AI能提升生产力,但效果大多是他们看出来的主观感觉,不是啥精确数据。 企业在AI这块也有短板。虽然30.5%的企业有清楚的使用政策,但21.1%完全没有规则可言。而且15.6%的企业数据质量不行没法支撑AI干活,这成了AI落地最大的结构性障碍。不过好在团队在版本控制这些日常工作上挺成熟的。 报告指出现在的情况是,AI已经深度融入开发工作了,但配套的流程、工具和组织架构还没跟上步伐。最主要的障碍就是AI生成的代码缺上下文、质量不稳定、所有权还模糊不清,这让评审的时候总是犹豫再三,接受率自然就低。 对未来大家是这么看的:领导者觉得以后AI会去干更多基础的开发活,好让开发者腾出时间搞架构设计这些高级的事。不过效果还是要看企业流程和数据基础好不好来定。这次报告特意拿掉了MTTR指标(平均修复时间),因为各个公司的定义和算法太不一样了没法比较。 另外还发现73.1%的团队在做迭代规划的时候有点保守,不想冒大险;只有14.7%的团队在规划精度上达到了理想水平。建议大家多看看自家内部指标的趋势变化,比如怎么优化PR的规模和返工率这些方面来提升交付的可预测性。