BMAD-METHOD/docs/zh-cn/explanation/quick-dev-new-preview.md

74 lines
4.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Quick Dev 新预览版"
description: 减少人工介入的阻力,同时保留保护输出质量的检查点
sidebar:
order: 2
---
`bmad-quick-dev-new-preview` 是一次大幅改进快速流程的实验性尝试:输入意图,输出代码变更,以更低的仪式感和更少的人工介入轮次,同时不牺牲质量。
它让模型在检查点之间运行更长时间,仅在任务无法安全继续而需要人类判断时,或到了审查最终结果的时候,才将人类带回。
![Quick Dev New Preview 工作流图](/diagrams/quick-dev-diagram.png)
## 为什么需要它
人工介入轮次既必要又昂贵。
当前的大语言模型仍会以可预测的方式失败:它们会误读意图、用自信的猜测填补空白、偏离到无关的工作中、生成嘈杂的审查输出。与此同时,持续的人工干预限制了开发速度。人类注意力是瓶颈。
这个实验性版本的快速流程试图重新平衡这一权衡。它信任模型在更长的时间段内无监督运行,但前提是工作流已经创建了足够强的边界来确保安全。
## 核心设计
### 1. 先压缩意图
工作流从让人类和模型将请求压缩为一个连贯的目标开始。输入可以从粗略的意图表达开始,但在工作流自主运行之前,它必须变得足够小、足够清晰、且没有矛盾。
意图可以有多种形式:几个短语、一个 bug 追踪器链接、计划模式的输出、从聊天会话中复制的文本,甚至是 BMAD 自身 `epics.md` 中的故事编号。对于最后一种情况,工作流不会理解 BMAD 故事跟踪语义,但仍可以获取故事本身并执行。
这个工作流并不消除人类控制,而是将其重新定位到少数高价值时刻:
- **意图澄清** — 将混乱的请求转化为一个连贯的目标,消除隐藏的矛盾
- **规格审批** — 确认冻结的理解是正确的构建目标
- **最终产品审查** — 主要检查点,人类在最后决定结果是否可接受
### 2. 路由到最小安全路径
一旦目标明确,工作流会决定这是一个真正的一步到位变更,还是需要更完整的路径。小型、零爆炸半径的变更可以直接进入实现。其他所有情况都经过规划,使模型在自主运行更长时间之前拥有更强的边界。
### 3. 以更少的监督运行更长时间
在路由决策之后,模型可以自主承担更多工作。在更完整的路径上,已批准的规格成为模型在更少监督下执行的边界——这正是这个实验的重点。
### 4. 在正确的层级诊断失败
如果实现是错的因为意图是错的,修补代码是错误的修复方式。如果代码是错的因为规格薄弱,修补差异也是错误的修复方式。工作流的设计目标是诊断失败进入系统的位置,回到那个层级,从那里重新生成。
审查发现用于决定问题是来自意图、规格生成还是局部实现。只有真正的局部问题才在局部修补。
### 5. 仅在需要时带回人类
意图访谈是人工介入的,但它不同于反复出现的检查点那种中断。工作流尽量将那些反复出现的检查点保持在最低限度。在初始的意图塑造之后,人类主要在工作流无法安全地在没有判断的情况下继续时回来,以及在最后需要审查结果时回来。
- **意图缺口解决** — 当审查证明工作流无法安全推断意图时重新介入
其他一切都是更长自主执行的候选项。这个权衡是刻意的。旧模式在持续监督上花费更多人类注意力。Quick Dev 新预览版在模型上花费更多信任,但将人类注意力节省在人类推理具有最高杠杆的时刻。
## 为什么审查系统很重要
审查阶段不仅仅是为了发现 bug更是为了在不破坏势头的情况下路由纠正。
这个工作流在能够生成子代理的平台上效果最好,或者至少能通过命令行调用另一个大语言模型并等待结果。如果你的平台不原生支持这一点,你可以添加一个技能来实现。无上下文子代理是审查设计的基石。
AI 代理审查通常在两个方面出错:
- 它们生成太多发现,迫使人类筛选噪音。
- 它们通过暴露不相关的问题使当前变更脱轨,将每次运行变成临时清理项目。
Quick Dev 新预览版通过将审查视为分诊来解决这两个问题。
有些发现属于当前变更,有些则不属于。如果一个发现是偶然的,而不是与当前工作有因果关系的,工作流可以推迟它,而不是强迫人类立即处理。这保持了运行的专注性,防止随机的离题消耗注意力预算。
这种分诊有时会不完美,这是可以接受的。通常,误判一些发现比用数千条低价值审查评论淹没人类要好。系统优化的是信号质量,而不是穷尽式召回。