baa-conductor


commit
105b610
parent
7b523f6
author
im_wower
date
2026-04-02 14:22:47 +0800 CST
feat(plans): add Scout-Converge-Strike multi-branch exploration plan
1 files changed,  +166, -0
Raw patch view.
  1diff --git a/plans/SCOUT_CONVERGE_STRIKE.md b/plans/SCOUT_CONVERGE_STRIKE.md
  2new file mode 100644
  3index 0000000000000000000000000000000000000000..b4f495cdfae664a805ef413c8425e39cd622ef86
  4--- /dev/null
  5+++ b/plans/SCOUT_CONVERGE_STRIKE.md
  6@@ -0,0 +1,166 @@
  7+# Scout-Converge-Strike — 多分支探路与汇聚能力
  8+
  9+> 日期: 2026-04-02
 10+> 状态: 方案设计
 11+> 来源: Claude × 葫芦爷 对话推导
 12+
 13+## 核心思想
 14+
 15+当前 AI 在单条对话中思考,是"闭门造车"——一条路走到黑,走错了回不来,thinking token 烧了结论可能是幻觉。
 16+
 17+本方案引入 **借脑** 能力:主线 AI 在动手之前,先通过 conductor 分发 scout(探路)任务给多个 AI 实例,收集探路结果后再做决策。
 18+
 19+**掌拳掌手法:**
 20+- **掌**(散开探)→ 多分支发散,成本在分支里烧掉,幻觉在分支里暴露
 21+- **拳**(收回来打)→ 汇聚点拿到探路报告,置信度极高,token 精准、方向明确
 22+- **掌**(再散开修)→ 拳落地后新分支点出现,再探
 23+
 24+## 问题
 25+
 26+1. 单条路径中 AI 可以一路自洽地错下去(幻觉链)
 27+2. thinking token 成本高,且探索宽度受限于单模型能力
 28+3. 不同 AI 的优势领域不同(Claude 推理强、Gemini 上下文长、ChatGPT 知识广),单 AI 无法兼得
 29+4. 主线 AI 的 context window 不该浪费在"想事"上,应该全花在"做事"上
 30+
 31+## 核心洞察
 32+
 33+编辑消息并开分支 = 穷人版并行编排。Conductor 可以自动化这个过程:
 34+
 35+- 从同一个 prompt 分发给多个 AI
 36+- 收集各路径结果
 37+- 构造"先知 prompt"送回主线
 38+- 多条分支互相照镜子,矛盾立刻浮出来
 39+
 40+**三个人都说通的路,基本不会是幻觉;三个人说法不一的地方,才是真正需要小心的。**
 41+
 42+## 与 CIE 三核的映射
 43+
 44+| CIE 概念 | Scout 映射 |
 45+|---------|----------|
 46+| 能见度 | 分支探路 = 看到多条路径的结果,提升能见度 |
 47+| 置信度 | 汇聚判断 = 置信度在极短时间内被"注入"而非"积累" |
 48+| 旋度 | 路径选择 = 路径之间的不对称性就是旋度的来源 |
 49+
 50+## BAA 指令原语
 51+
 52+新增一个 conductor 原语:
 53+
 54+```baa
 55+@conductor::scout::{
 56+  "prompt": "<探路问题>",
 57+  "branches": [
 58+    { "target": "claude", "variant": "focus on architecture" },
 59+    { "target": "chatgpt", "variant": "focus on known patterns" },
 60+    { "target": "gemini", "variant": "focus on edge cases" }
 61+  ],
 62+  "converge_strategy": "intersection | best_of | preserve_conflicts",
 63+  "max_tokens_per_branch": 2000,
 64+  "timeout_ms": 60000
 65+}
 66+```
 67+
 68+### 参数说明
 69+
 70+- `prompt`: 探路问题,所有分支共享的基础 prompt
 71+- `branches`: 分支列表,每条指定 target AI 和可选的 variant(侧重方向)
 72+- `converge_strategy`: 汇聚策略
 73+  - `intersection`: 取共识(所有分支都认同的部分)
 74+  - `best_of`: 取最优(由主线 AI 从结果中选)
 75+  - `preserve_conflicts`: 保留矛盾点(最适合关键决策)
 76+- `max_tokens_per_branch`: 每条分支的 token 预算
 77+- `timeout_ms`: 超时时间
 78+
 79+### 返回格式
 80+
 81+```json
 82+{
 83+  "scout_id": "scout-20260402-001",
 84+  "branches": [
 85+    {
 86+      "target": "claude",
 87+      "status": "completed",
 88+      "summary": "<压缩后的探路结果>",
 89+      "confidence": 0.85,
 90+      "key_findings": ["..."],
 91+      "warnings": ["..."]
 92+    }
 93+  ],
 94+  "consensus": ["所有分支都认同的结论"],
 95+  "conflicts": [
 96+    {
 97+      "topic": "<矛盾点>",
 98+      "positions": { "claude": "...", "chatgpt": "...", "gemini": "..." }
 99+    }
100+  ],
101+  "recommendation": "<基于汇聚策略的建议>"
102+}
103+```
104+
105+## 链路
106+
107+```
108+主线 AI 发出 scout 指令
109+  → conductor 解析 @conductor::scout
110+  → 并行分发 prompt 给各 target AI(通过浏览器 a11y 或 API)
111+  → 各 AI 独立回复
112+  → conductor 收集所有回复
113+  → 执行 converge_strategy 压缩结果
114+  → 返回探路报告给主线 AI
115+  → 主线 AI 基于报告做高置信决策
116+```
117+
118+## 与续命系统的配合
119+
120+Scout 任务天然嵌入续命循环:
121+
122+- scout 发出 = 一轮心跳开始
123+- 探路回来 = 续命成功,主线继续
124+- 探路超时 = 续命失败,走降级策略(用已收到的部分结果继续)
125+
126+## 实现阶段
127+
128+### Phase 1: 手动 Scout(当前可做)
129+
130+- 在 BAA 指令系统中注册 `@conductor::scout` 解析
131+- conductor 收到后,通过现有 a11y 通道逐个发给各 AI
132+- 串行执行,人工汇聚(conductor 把各回复拼在一起返回)
133+- 验证链路可行性
134+
135+### Phase 2: 并行 Scout
136+
137+- 多浏览器标签页 / 多窗口并行发送
138+- conductor 维护 scout session 状态
139+- 自动超时和部分结果降级
140+
141+### Phase 3: 智能汇聚
142+
143+- conductor 内置轻量 converge 逻辑(关键词提取、矛盾检测)
144+- 或将汇聚本身作为一个 AI 任务(meta-scout)
145+- 探路报告模板标准化
146+
147+### Phase 4: 递归 Scout
148+
149+- scout 结果中的矛盾点可以触发二级 scout(更深层探路)
150+- 形成 scout 树,类似蒙特卡洛树搜索的 expand→simulate→backprop
151+- 设置最大递归深度,防止无限展开
152+
153+## 反幻觉机制
154+
155+本方案的核心副产品是天然的反幻觉能力:
156+
157+1. **交叉验证**: 单条路径里 AI 可以一路自洽地错下去,但三条分支互相照镜子,矛盾立刻浮出来
158+2. **低维投影暴露**: 单分支是低维投影里的稳定 pattern(逻辑自洽),多分支暴露高维不一致
159+3. **成本前置**: 幻觉在探路阶段暴露,比在主线执行阶段暴露代价小得多
160+
161+## 工程约束
162+
163+- 探路结果必须压缩后再注入主线(context window 是总预算)
164+- 每条分支的 prompt 要包含足够上下文但不能太长(宽度换深度的 tradeoff)
165+- converge 过程本身不能引入新幻觉(优先用规则而非 AI 做汇聚)
166+- 要有 dry-run 模式:只生成 scout 计划不实际执行,供人审核
167+
168+## 设计哲学
169+
170+> 思考的成本外包出去,做事的 token 留给自己。
171+> 不是未卜先知,是遍历之后装作没遍历过。
172+> 掌拳掌:散开探路,收回来打,再散开修。