feat(plans): add Scout-Converge-Strike multi-branch exploration plan

commit: 105b610
parent: 7b523f6
author: im_wower
date: 2026-04-02 14:22:47 +0800 CST

feat(plans): add Scout-Converge-Strike multi-branch exploration plan

1 files changed, +166, -0

Raw patch view.

  1diff --git a/plans/SCOUT_CONVERGE_STRIKE.md b/plans/SCOUT_CONVERGE_STRIKE.md
  2new file mode 100644
  3index 0000000000000000000000000000000000000000..b4f495cdfae664a805ef413c8425e39cd622ef86
  4--- /dev/null
  5+++ b/plans/SCOUT_CONVERGE_STRIKE.md
  6@@ -0,0 +1,166 @@
  7+# Scout-Converge-Strike — 多分支探路与汇聚能力
  8+
  9+> 日期: 2026-04-02
 10+> 状态: 方案设计
 11+> 来源: Claude × 葫芦爷 对话推导
 12+
 13+## 核心思想
 14+
 15+当前 AI 在单条对话中思考，是"闭门造车"——一条路走到黑，走错了回不来，thinking token 烧了结论可能是幻觉。
 16+
 17+本方案引入 **借脑** 能力：主线 AI 在动手之前，先通过 conductor 分发 scout（探路）任务给多个 AI 实例，收集探路结果后再做决策。
 18+
 19+**掌拳掌手法：**
 20+- **掌**（散开探）→ 多分支发散，成本在分支里烧掉，幻觉在分支里暴露
 21+- **拳**（收回来打）→ 汇聚点拿到探路报告，置信度极高，token 精准、方向明确
 22+- **掌**（再散开修）→ 拳落地后新分支点出现，再探
 23+
 24+## 问题
 25+
 26+1. 单条路径中 AI 可以一路自洽地错下去（幻觉链）
 27+2. thinking token 成本高，且探索宽度受限于单模型能力
 28+3. 不同 AI 的优势领域不同（Claude 推理强、Gemini 上下文长、ChatGPT 知识广），单 AI 无法兼得
 29+4. 主线 AI 的 context window 不该浪费在"想事"上，应该全花在"做事"上
 30+
 31+## 核心洞察
 32+
 33+编辑消息并开分支 = 穷人版并行编排。Conductor 可以自动化这个过程：
 34+
 35+- 从同一个 prompt 分发给多个 AI
 36+- 收集各路径结果
 37+- 构造"先知 prompt"送回主线
 38+- 多条分支互相照镜子，矛盾立刻浮出来
 39+
 40+**三个人都说通的路，基本不会是幻觉；三个人说法不一的地方，才是真正需要小心的。**
 41+
 42+## 与 CIE 三核的映射
 43+
 44+| CIE 概念 | Scout 映射 |
 45+|---------|----------|
 46+| 能见度 | 分支探路 = 看到多条路径的结果，提升能见度 |
 47+| 置信度 | 汇聚判断 = 置信度在极短时间内被"注入"而非"积累" |
 48+| 旋度 | 路径选择 = 路径之间的不对称性就是旋度的来源 |
 49+
 50+## BAA 指令原语
 51+
 52+新增一个 conductor 原语：
 53+
 54+```baa
 55+@conductor::scout::{
 56+  "prompt": "<探路问题>",
 57+  "branches": [
 58+    { "target": "claude", "variant": "focus on architecture" },
 59+    { "target": "chatgpt", "variant": "focus on known patterns" },
 60+    { "target": "gemini", "variant": "focus on edge cases" }
 61+  ],
 62+  "converge_strategy": "intersection | best_of | preserve_conflicts",
 63+  "max_tokens_per_branch": 2000,
 64+  "timeout_ms": 60000
 65+}
 66+```
 67+
 68+### 参数说明
 69+
 70+- `prompt`: 探路问题，所有分支共享的基础 prompt
 71+- `branches`: 分支列表，每条指定 target AI 和可选的 variant（侧重方向）
 72+- `converge_strategy`: 汇聚策略
 73+  - `intersection`: 取共识（所有分支都认同的部分）
 74+  - `best_of`: 取最优（由主线 AI 从结果中选）
 75+  - `preserve_conflicts`: 保留矛盾点（最适合关键决策）
 76+- `max_tokens_per_branch`: 每条分支的 token 预算
 77+- `timeout_ms`: 超时时间
 78+
 79+### 返回格式
 80+
 81+```json
 82+{
 83+  "scout_id": "scout-20260402-001",
 84+  "branches": [
 85+    {
 86+      "target": "claude",
 87+      "status": "completed",
 88+      "summary": "<压缩后的探路结果>",
 89+      "confidence": 0.85,
 90+      "key_findings": ["..."],
 91+      "warnings": ["..."]
 92+    }
 93+  ],
 94+  "consensus": ["所有分支都认同的结论"],
 95+  "conflicts": [
 96+    {
 97+      "topic": "<矛盾点>",
 98+      "positions": { "claude": "...", "chatgpt": "...", "gemini": "..." }
 99+    }
100+  ],
101+  "recommendation": "<基于汇聚策略的建议>"
102+}
103+```
104+
105+## 链路
106+
107+```
108+主线 AI 发出 scout 指令
109+  → conductor 解析 @conductor::scout
110+  → 并行分发 prompt 给各 target AI（通过浏览器 a11y 或 API）
111+  → 各 AI 独立回复
112+  → conductor 收集所有回复
113+  → 执行 converge_strategy 压缩结果
114+  → 返回探路报告给主线 AI
115+  → 主线 AI 基于报告做高置信决策
116+```
117+
118+## 与续命系统的配合
119+
120+Scout 任务天然嵌入续命循环：
121+
122+- scout 发出 = 一轮心跳开始
123+- 探路回来 = 续命成功，主线继续
124+- 探路超时 = 续命失败，走降级策略（用已收到的部分结果继续）
125+
126+## 实现阶段
127+
128+### Phase 1: 手动 Scout（当前可做）
129+
130+- 在 BAA 指令系统中注册 `@conductor::scout` 解析
131+- conductor 收到后，通过现有 a11y 通道逐个发给各 AI
132+- 串行执行，人工汇聚（conductor 把各回复拼在一起返回）
133+- 验证链路可行性
134+
135+### Phase 2: 并行 Scout
136+
137+- 多浏览器标签页 / 多窗口并行发送
138+- conductor 维护 scout session 状态
139+- 自动超时和部分结果降级
140+
141+### Phase 3: 智能汇聚
142+
143+- conductor 内置轻量 converge 逻辑（关键词提取、矛盾检测）
144+- 或将汇聚本身作为一个 AI 任务（meta-scout）
145+- 探路报告模板标准化
146+
147+### Phase 4: 递归 Scout
148+
149+- scout 结果中的矛盾点可以触发二级 scout（更深层探路）
150+- 形成 scout 树，类似蒙特卡洛树搜索的 expand→simulate→backprop
151+- 设置最大递归深度，防止无限展开
152+
153+## 反幻觉机制
154+
155+本方案的核心副产品是天然的反幻觉能力：
156+
157+1. **交叉验证**: 单条路径里 AI 可以一路自洽地错下去，但三条分支互相照镜子，矛盾立刻浮出来
158+2. **低维投影暴露**: 单分支是低维投影里的稳定 pattern（逻辑自洽），多分支暴露高维不一致
159+3. **成本前置**: 幻觉在探路阶段暴露，比在主线执行阶段暴露代价小得多
160+
161+## 工程约束
162+
163+- 探路结果必须压缩后再注入主线（context window 是总预算）
164+- 每条分支的 prompt 要包含足够上下文但不能太长（宽度换深度的 tradeoff）
165+- converge 过程本身不能引入新幻觉（优先用规则而非 AI 做汇聚）
166+- 要有 dry-run 模式：只生成 scout 计划不实际执行，供人审核
167+
168+## 设计哲学
169+
170+> 思考的成本外包出去，做事的 token 留给自己。
171+> 不是未卜先知，是遍历之后装作没遍历过。
172+> 掌拳掌：散开探路，收回来打，再散开修。