先说三个现象,看看你中了几条:
现象一:需求文档写了三十页,开发看了前两页,后面翻都没翻。
现象二:平均每位员工每周在会议上花费11.3小时,占整个工作周的28.3%。开发同学一边开会,一边心里默默计算”今天还剩几小时能写代码”。
现象三:每次Sprint(迭代周期,即固定时长的开发周期,通常为1-4周)计划会,问”这个功能要几天”,工程师沉默三秒,最后说”大概……五天吧”——这个数字,基本靠感觉。
这不是某一家公司的问题,这是整个产研行业的通病。
而现在,AI来了。
如今距离《敏捷宣言》重塑软件开发方式已二十多年,人工智能正成为催生软件交付”第四次浪潮”的关键力量——过去三年,AI已从实验室走进企业的每个角落,深刻改变着组织规划、构建、测试和发布软件的方式。
很多人的第一反应是恐慌:AI会不会取代我的工作?
这个问题问错了。
真正该问的是:那些已经学会用AI的团队,正在把你甩开多远?
数据说话:使用AI工具的开发者,生产效率提升高达88%。而员工使用AI后平均生产力提升40%,这一提升源于对工具的熟悉、主动尝试和持续学习。
这意味着,同样是一个10人的产研团队,会用AI的团队,实际产出可能等同于不会用AI的团队的14-18人规模。
AI不是来替代产研团队的,它是来淘汰不懂用AI的产研团队的。
在讲怎么做之前,先搞清楚AI到底在冲击什么。分三个维度来看。
需求分析层面:
过去,产品经理(PM)整理用户访谈录音,要逐字逐句听,再手动归纳。现在,上传录音或文字稿,AI能在5分钟内输出结构化的用户痛点清单、高频词汇和情感倾向分析。
竞品调研层面:
一份完整的竞品分析报告,过去需要一个PM花3-5天收集、阅读、整理。现在借助AI,可以在2-3小时内生成初版框架,PM只需负责判断和补充。
原型设计层面:
AI生成低保真原型(即结构草图,用于快速验证想法)的速度已经接近人工的10倍。更关键的是,“原型”和”产品”的边界正在模糊——有些AI生成的代码,直接就能跑起来。
AI辅助编程已经从”副驾驶(Copilot,即给建议但人来决策)“向”驾驶员(Pilot,即AI主导执行)“演进。
使用Copilot或Cursor等工具的开发者,每次会话可以生成3-5倍更多的代码行数。
但这里有一个重要警告:GitClear的2024年数据显示,代码”翻新率”(即写了又改、改了又写的比例)从2021年的3.3%基准线上升到了2024-2025年的5.7%-7.1%。代码量更多、速度更快,并不等于价值更多、速度更快。
这说明:AI能帮你写更多代码,但如果需求没说清楚、审查没做好,这些代码很可能是”高速制造的垃圾”。
另一个趋势是AI智能体的崛起。超过四分之一的AI使用者正在尝试”AI智能体”——这类系统能自主做出决策并跨工具协调工作,早期采用者已将其应用于工作流执行、风险检测、治理,甚至规划环节。
AI正以具体而实用的方式悄然融入敏捷工作流。具体体现在:

很多团队引入AI时犯的第一个错误,是把AI当成”什么都能做的万能助手”,结果要么过度依赖、出了问题没人负责;要么根本不信任、买了工具放在那里吃灰。
正确的起点是:先想清楚人和AI各自负责什么。
这里提出一个实用的框架——“HAI分工矩阵”(Human-AI分工矩阵):
| 任务类型 | 主导方 | 典型举例 |
|---|---|---|
| 创意判断、战略决策 | 人 | 产品方向取舍、用户价值判断 |
| 重复性、结构化任务 | AI | 文档整理、测试用例生成、会议纪要 |
| 数据驱动的分析 | AI辅助 + 人决策 | 需求优先级排序、Sprint速率预测 |
| 跨部门沟通协作 | 人主导 + AI辅助 | 进度同步、利益方对齐 |
这个矩阵的核心逻辑是:AI擅长处理有规律、有上下文、可重复的任务;人擅长处理模糊、需要判断力和情感智识的任务。
一个非常实用的判断方法是问自己:“这个任务,如果换一个聪明但完全不了解我们公司的新员工来做,他能做吗?”
如果能,AI大概率也能;如果不能,那这个任务就仍然需要人的深度介入。
产品工作本质上是三件事:发现问题 → 定义问题 → 设计方案。AI在每个阶段都能嵌入,但方式不同。
过去的做法: PM听录音、整理访谈记录、手动归纳用户需求、写分析报告,一轮用户调研下来,光整理就需要2-3天。
AI新工作法:
第一步:用AI处理用户访谈原始素材
把用户访谈的录音(或转写文字)输入AI,配合以下Prompt模板:
你是一位资深产品研究员。
以下是[产品名]的用户访谈记录,请帮我:
1. 提炼出用户提到的核心痛点(按频次排序)
2. 识别用户真实需求(区分"表面需求"和"深层需求")
3. 找出用户在访谈中情绪最强烈的3-5个时刻,并说明原因
4. 用一句话总结这位用户的核心诉求
访谈记录如下:
[粘贴访谈内容]第二步:用AI做竞品分析
请对[竞品A]、[竞品B]、[竞品C]在[功能模块]上进行对比分析:
1. 各自的核心功能和差异化亮点
2. 用户评价中反复出现的抱怨点(可参考App Store评论、知乎讨论)
3. 针对我们的产品[简要描述],指出最值得借鉴的设计思路
4. 列出至少3个竞品尚未满足的用户需求机会点 注意:
AI输出的竞品分析,受其训练数据时效性限制,新上线的功能可能覆盖不全。务必用PM的实际产品体验来校验和补充。
这个阶段的核心产出是:高质量的用户故事(User Story)和 清晰的验收标准(Acceptance Criteria)。
用户故事:以用户视角描述需求的短句,标准格式为——“作为[用户角色],我希望[完成某件事],以便[实现某个目标]。”
验收标准:描述”什么情况下算完成”的具体条件,用于减少产品、研发、测试三方的理解偏差。
AI辅助撰写用户故事的Prompt:
我有一个产品需求,请帮我拆解为规范的用户故事。
需求描述:[简述需求]
目标用户:[用户角色]
背景:[使用场景]
请为每个用户故事补充:
- 标准格式:作为[角色],我希望[行为],以便[目标]
- 优先级建议(高/中/低)及理由
- 验收标准(至少3条,格式:Given[前提条件] / When[触发操作] / Then[预期结果])
- 潜在风险或依赖项举个实际例子:假设需求是”用户可以在App内分享自己的健身记录到朋友圈”,AI生成的用户故事可能是:
用户故事:作为一名坚持健身的用户,我希望能一键将今天的训练记录生成图片分享到微信朋友圈,以便获得朋友的认可和鼓励,从而保持健身动力。
验收标准:
– Given 用户完成了一次训练记录 / When 用户点击”分享”按钮 / Then 系统自动生成包含训练数据、日期、个人头像的分享图片
– Given 用户已生成分享图片 / When 用户点击”保存到相册” / Then 图片以1080×1080px分辨率保存,且水印Logo在右下角
– Given 用户未登录微信 / When 用户点击”分享到朋友圈” / Then 系统提示”请先授权微信登录”,并引导至授权流程
与Scrum融合:
Product Owner(产品负责人,负责代表用户和业务方管理产品待办列表的角色)在Backlog Refinement(待办梳理会)前,提前用AI预处理用户故事,可以大幅提升会议效率。进入会议时,团队讨论的不再是”这个需求是什么意思”,而是”这个需求的优先级和实现方案”——节省的时间,保守估计50%以上。
AI在设计阶段的主要价值:快速生成可测试的低保真原型,提前暴露设计问题。
一个实用的”AI设计评审”Prompt:
请以一个[用户角色]的身份,审视以下产品设计方案:
[粘贴设计描述或截图说明]
请从以下维度提出挑战性问题:
1. 用户首次使用时可能在哪里迷路或困惑?
2. 这个设计是否覆盖了所有异常状态(空状态、加载中、出错时)?
3. 如果我是一个不耐烦的用户,我会在哪个步骤放弃?
4. 有哪些边界情况(极端场景)可能导致体验崩坏?研发团队引入AI,最大的误区是:把AI当成”搜索引擎升级版”——遇到问题才问,问完就算,没有形成系统性的协作模式。
这里提出一个”AI成熟度五级模型”,帮团队判断自己在哪个阶段,该往哪里走:
| 级别 | 团队特征 | 人的主要角色 |
|---|---|---|
| L1 | 偶尔用AI搜索、问答 | 主力开发者 |
| L2 | AI辅助代码补全(如GitHub Copilot) | 主力开发者 |
| L3 | AI具备跨文件感知,能承接模块级任务 | 代码审查者 + 架构决策者 |
| L4 | AI Agent自主运行数小时,处理完整功能 | 需求说明者 + 审核者 |
| L5 | AI全自动从目标生成生产代码 | 产品战略制定者 |
与Scrum融合——DoD(完成的定义)变得更重要了:
DoD(Definition of Done,完成的定义):团队约定好的”什么叫做一个任务真正完成了”的标准清单,例如:代码已提交 + 单元测试覆盖率≥80% + 代码已Review + 文档已更新。
AI加速代码产出后,“能运行”和”真正完成”之间的差距反而被放大了。GitClear的数据显示,代码翻新率从2021年的3.3%基准线升至2024-2025年的5.7%-7.1%。AI生成的代码更多、更快,但如果DoD不清晰,技术债(指为了快速交付而积累的、日后需要重构的代码问题)会以惊人的速度堆积。
同时需要强化Test-First(测试先行)理念:先写测试用例(定义”正确答案”),再让AI生成代码,用测试结果检验AI的产出。这比”先写代码、再补测试”的方式,能减少大量返工。
Scrum有五个核心活动,俗称”五大仪式”。下面逐一说明AI如何嵌入每一个环节。
传统痛点: 工作量估算全靠经验和感觉,计划会开两小时,到最后还是”差不多这样吧”。
AI如何介入:
1.在会议前,AI自动分析过去5-10个Sprint的历史数据:团队平均速率(Velocity,即每个Sprint完成的工作量)、各类任务的平均完成时长、常见延期原因
2.输出一份”Sprint预测报告”,给出本次Sprint可承接工作量的建议范围
3.AI自动将大的Epic(大功能块)预拆解为Task(具体任务),供团队确认和调整
实用Prompt参考:
以下是我们团队过去6个Sprint的速率数据:
[粘贴Sprint历史数据]
本次Sprint计划纳入以下用户故事:
[粘贴故事清单和初步估算]
请帮我:
1. 基于历史速率,判断本次计划是否超载(给出超载风险概率)
2. 识别哪些故事的估算可能偏低(参考历史相似任务)
3. 建议本次Sprint的优先交付顺序传统痛点:每日站会15分钟,有时变成每日汇报会,光说”昨天做了什么”就花了10分钟,真正的障碍没时间讨论。
AI如何介入:
1.AI自动从代码提交记录(Git log)、任务系统(Jira/Linear)拉取每人昨天的实际进度,生成进度摘要
2.自动识别”超过1天未更新状态的任务”作为潜在障碍(Blocker,即阻碍工作推进的问题)
3.站会开始前,团队人手一份AI生成的”今日快报”,站会直接聚焦”障碍清除”
结果:站会时间从15分钟压缩至5-8分钟,且含金量更高。
传统痛点:Backlog像一个永远整理不完的杂物间——条目重复、描述模糊、缺少验收标准,每次梳理会都要花大量时间”搬运”,而不是”决策”。
Backlog经常变成一个”垃圾场”,AI现在可以帮助整理它、减少杂乱,让产品负责人能够专注于战略,而不是琐碎的整理工作。
AI如何介入(会议前自动完成):
1.去重合并:识别描述相似的条目,标注潜在重复
2.补全验收标准:对缺少AC(Acceptance Criteria)的条目,AI基于描述自动补全初稿
3.优先级预排序:结合业务目标和历史完成情况,AI给出优先级建议
4.拆分过大的条目:识别工作量超过一个Sprint的故事,自动建议拆分方案
进入会议时,团队处理的是”已经预加工过的Backlog”,效率可提升50%-70%。
传统痛点:Review会开始,开发同学花20分钟讲”我们这次做了什么”,利益相关者(Stakeholder,即产品结果的关注方,如管理层、业务方)在台下听得云里雾里,有价值的讨论时间所剩无几。
AI如何介入:
1.Sprint结束前,AI自动汇总:本次完成的故事清单、DoD达成情况、实际交付 vs 计划交付的对比
2.生成一份面向非技术受众的”交付价值说明”——不说”我们完成了8个接口”,而说”用户现在可以在3步内完成注册,比之前的7步减少了57%的操作”
3.Product Owner和利益相关者在Review会上聚焦:这次交付的内容是否达到了预期的用户价值?下一步方向如何调整?
传统痛点:回顾会容易变成情绪宣泄会——“我觉得这次需求变更太多了”,“我感觉沟通有点问题”,讲完就散,下次照旧。
AI如何介入:
1.AI分析多个Sprint的数据,发现重复出现的障碍模式(例如:连续3个Sprint都有测试环节延期,说明测试资源可能是系统性瓶颈)
2.输出”障碍热力图”:哪类问题出现频率最高?哪个阶段最容易出现延误?
3.给出历史改进措施的有效性追踪:上次回顾会提出的改进动作,有没有真正被执行?
与Scrum核心精神的融合:
Scrum的三大支柱是透明(Transparency)、检视(Inspection)、适应(Adaptation)。AI在回顾环节的最大价值,就是把”感觉”变成”数据”——让透明度更高,让检视更准确,让适应更有依据。
理论讲完了。现在说最难的部分:怎么真正推起来。
坑一:“一步到位”陷阱
想法:我们要全面改造工作流,所有环节同时引入AI!
现实:一个月后,没有一个环节真正跑通,大家回到原来的习惯,AI工具变成PPT素材。
正确做法:选一个最痛的点,先跑一个Sprint,出结果,再扩展。
坑二:“工具碎片化”陷阱
想法:这个AI工具做需求,那个做代码,另一个做测试,全部买!
现实:光是学会这些工具就花了两周,上下文在不同工具之间来回粘贴,效率反而下降。
正确做法:先选1-2个核心工具,跑深、跑透,再根据实际痛点按需扩展。
坑三:“AI全权委托”陷阱
想法:让AI写代码就行了,反正它很厉害。
现实:有研究发现,有经验的开发者在使用AI工具完成编程任务时,实际花费的时间反而比预期多19%,尽管他们主观感觉自己快了20%。
原因是:验收标准没写清楚 → AI”理解”了一个错误的需求 → 跑偏了 → 大量返工。
正确做法:AI的输出质量,由输入质量决定。需求写得越清晰,AI干得越好。这是一个必须接受的事实。
不要用”大爆炸式”的改造方式,用Scrum的增量交付思路——小步快跑,每个Sprint都有可见的改善。
| 阶段 | 周期 | 行动路径 | 目标 | 示例 |
|---|---|---|---|---|
| Sprint 1 | 第1-2周 | 选1个痛点 → 引入1个AI工具 → 观察效果 | 找到一个有感知的改善点,建立团队信心 | 用AI自动生成Backlog的验收标准初稿 |
| Sprint 2 | 第3-4周 | 总结经验 → 固化Prompt模板 → 全员培训 | 把偶发性的AI使用,变成团队标准动作 | 建立团队共用的Prompt模板库(用户故事、竞品分析等) |
| Sprint 3-4 | 第5-8周 | 扩展至相邻环节,逐步形成新工作流 | 形成至少3个环节的AI融合流程 | Discovery分析 + 用户故事生成 + Sprint报告自动化 |
| Sprint 5+ | 第9周起 | 复盘ROI,制定下一阶段AI升级计划 | 量化收益,说服管理层,规划下一阶段投入 | 统计引入AI前后的需求交付周期、会议时长、缺陷率变化 |
ROI(投入产出比)量化建议:
在开始前记录基线数据——每个Sprint平均完成故事点数、需求评审会平均时长、每个版本平均缺陷数。8周后对比,数据会说话。
| 角色 | AI时代前:主要做什么 | AI时代后:核心价值在哪里 |
|---|---|---|
| 产品经理(PM) | 写PRD、画原型、开需求评审会 | 用户价值判断、AI产出内容的质检与决策 |
| 研发工程师 | 逐行写代码、查文档、改Bug | 写清楚需求规格、审查AI代码、架构设计 |
| 测试工程师 | 手工执行测试用例 | 设计测试策略、治理AI自动化测试体系 |
| Scrum Master | 组织五大仪式、移除障碍 | 优化人机协作工作流、制定AI使用规范 |
| 产品负责人(PO) | 管理和梳理Backlog | 数据驱动的价值决策、战略方向把控 |
有一个共同规律值得注意:每个角色都从”执行者”向”判断者”迁移。
AI负责生产原材料,人负责判断、取舍、决策。这不是角色的削弱,而是角色的升级——那些能做出高质量判断的人,价值会被进一步放大。
这篇文章里所有的方法论,如果你只是”读了觉得有道理”,它的价值是零。
AI时代的产研竞争,不是”谁买了更多AI工具”,而是”谁真正重构了自己的工作方式”。工具只是载体,思维方式才是根本。
Scrum已经告诉我们二十多年了:敏捷团队强调协作、适应性和快速反馈——这些价值观与AI的生成性和辅助性本质在概念上高度契合。
透明、检视、适应——这三个原则,在人与AI协作的时代,不仅没有过时,而且比以往任何时候都更加重要。
透明:把人机分工说清楚,把AI的边界说清楚,把验收标准说清楚。
检视:不盲信AI的输出,定期回顾AI融入后的真实效果,用数据说话。
适应:没有一套工作流是永恒正确的,根据团队反馈持续迭代,是唯一正确的姿态。
无关联文章