- commit
- 105b610
- parent
- 7b523f6
- author
- im_wower
- date
- 2026-04-02 14:22:47 +0800 CST
feat(plans): add Scout-Converge-Strike multi-branch exploration plan
1 files changed,
+166,
-0
Raw patch view.
1diff --git a/plans/SCOUT_CONVERGE_STRIKE.md b/plans/SCOUT_CONVERGE_STRIKE.md
2new file mode 100644
3index 0000000000000000000000000000000000000000..b4f495cdfae664a805ef413c8425e39cd622ef86
4--- /dev/null
5+++ b/plans/SCOUT_CONVERGE_STRIKE.md
6@@ -0,0 +1,166 @@
7+# Scout-Converge-Strike — 多分支探路与汇聚能力
8+
9+> 日期: 2026-04-02
10+> 状态: 方案设计
11+> 来源: Claude × 葫芦爷 对话推导
12+
13+## 核心思想
14+
15+当前 AI 在单条对话中思考,是"闭门造车"——一条路走到黑,走错了回不来,thinking token 烧了结论可能是幻觉。
16+
17+本方案引入 **借脑** 能力:主线 AI 在动手之前,先通过 conductor 分发 scout(探路)任务给多个 AI 实例,收集探路结果后再做决策。
18+
19+**掌拳掌手法:**
20+- **掌**(散开探)→ 多分支发散,成本在分支里烧掉,幻觉在分支里暴露
21+- **拳**(收回来打)→ 汇聚点拿到探路报告,置信度极高,token 精准、方向明确
22+- **掌**(再散开修)→ 拳落地后新分支点出现,再探
23+
24+## 问题
25+
26+1. 单条路径中 AI 可以一路自洽地错下去(幻觉链)
27+2. thinking token 成本高,且探索宽度受限于单模型能力
28+3. 不同 AI 的优势领域不同(Claude 推理强、Gemini 上下文长、ChatGPT 知识广),单 AI 无法兼得
29+4. 主线 AI 的 context window 不该浪费在"想事"上,应该全花在"做事"上
30+
31+## 核心洞察
32+
33+编辑消息并开分支 = 穷人版并行编排。Conductor 可以自动化这个过程:
34+
35+- 从同一个 prompt 分发给多个 AI
36+- 收集各路径结果
37+- 构造"先知 prompt"送回主线
38+- 多条分支互相照镜子,矛盾立刻浮出来
39+
40+**三个人都说通的路,基本不会是幻觉;三个人说法不一的地方,才是真正需要小心的。**
41+
42+## 与 CIE 三核的映射
43+
44+| CIE 概念 | Scout 映射 |
45+|---------|----------|
46+| 能见度 | 分支探路 = 看到多条路径的结果,提升能见度 |
47+| 置信度 | 汇聚判断 = 置信度在极短时间内被"注入"而非"积累" |
48+| 旋度 | 路径选择 = 路径之间的不对称性就是旋度的来源 |
49+
50+## BAA 指令原语
51+
52+新增一个 conductor 原语:
53+
54+```baa
55+@conductor::scout::{
56+ "prompt": "<探路问题>",
57+ "branches": [
58+ { "target": "claude", "variant": "focus on architecture" },
59+ { "target": "chatgpt", "variant": "focus on known patterns" },
60+ { "target": "gemini", "variant": "focus on edge cases" }
61+ ],
62+ "converge_strategy": "intersection | best_of | preserve_conflicts",
63+ "max_tokens_per_branch": 2000,
64+ "timeout_ms": 60000
65+}
66+```
67+
68+### 参数说明
69+
70+- `prompt`: 探路问题,所有分支共享的基础 prompt
71+- `branches`: 分支列表,每条指定 target AI 和可选的 variant(侧重方向)
72+- `converge_strategy`: 汇聚策略
73+ - `intersection`: 取共识(所有分支都认同的部分)
74+ - `best_of`: 取最优(由主线 AI 从结果中选)
75+ - `preserve_conflicts`: 保留矛盾点(最适合关键决策)
76+- `max_tokens_per_branch`: 每条分支的 token 预算
77+- `timeout_ms`: 超时时间
78+
79+### 返回格式
80+
81+```json
82+{
83+ "scout_id": "scout-20260402-001",
84+ "branches": [
85+ {
86+ "target": "claude",
87+ "status": "completed",
88+ "summary": "<压缩后的探路结果>",
89+ "confidence": 0.85,
90+ "key_findings": ["..."],
91+ "warnings": ["..."]
92+ }
93+ ],
94+ "consensus": ["所有分支都认同的结论"],
95+ "conflicts": [
96+ {
97+ "topic": "<矛盾点>",
98+ "positions": { "claude": "...", "chatgpt": "...", "gemini": "..." }
99+ }
100+ ],
101+ "recommendation": "<基于汇聚策略的建议>"
102+}
103+```
104+
105+## 链路
106+
107+```
108+主线 AI 发出 scout 指令
109+ → conductor 解析 @conductor::scout
110+ → 并行分发 prompt 给各 target AI(通过浏览器 a11y 或 API)
111+ → 各 AI 独立回复
112+ → conductor 收集所有回复
113+ → 执行 converge_strategy 压缩结果
114+ → 返回探路报告给主线 AI
115+ → 主线 AI 基于报告做高置信决策
116+```
117+
118+## 与续命系统的配合
119+
120+Scout 任务天然嵌入续命循环:
121+
122+- scout 发出 = 一轮心跳开始
123+- 探路回来 = 续命成功,主线继续
124+- 探路超时 = 续命失败,走降级策略(用已收到的部分结果继续)
125+
126+## 实现阶段
127+
128+### Phase 1: 手动 Scout(当前可做)
129+
130+- 在 BAA 指令系统中注册 `@conductor::scout` 解析
131+- conductor 收到后,通过现有 a11y 通道逐个发给各 AI
132+- 串行执行,人工汇聚(conductor 把各回复拼在一起返回)
133+- 验证链路可行性
134+
135+### Phase 2: 并行 Scout
136+
137+- 多浏览器标签页 / 多窗口并行发送
138+- conductor 维护 scout session 状态
139+- 自动超时和部分结果降级
140+
141+### Phase 3: 智能汇聚
142+
143+- conductor 内置轻量 converge 逻辑(关键词提取、矛盾检测)
144+- 或将汇聚本身作为一个 AI 任务(meta-scout)
145+- 探路报告模板标准化
146+
147+### Phase 4: 递归 Scout
148+
149+- scout 结果中的矛盾点可以触发二级 scout(更深层探路)
150+- 形成 scout 树,类似蒙特卡洛树搜索的 expand→simulate→backprop
151+- 设置最大递归深度,防止无限展开
152+
153+## 反幻觉机制
154+
155+本方案的核心副产品是天然的反幻觉能力:
156+
157+1. **交叉验证**: 单条路径里 AI 可以一路自洽地错下去,但三条分支互相照镜子,矛盾立刻浮出来
158+2. **低维投影暴露**: 单分支是低维投影里的稳定 pattern(逻辑自洽),多分支暴露高维不一致
159+3. **成本前置**: 幻觉在探路阶段暴露,比在主线执行阶段暴露代价小得多
160+
161+## 工程约束
162+
163+- 探路结果必须压缩后再注入主线(context window 是总预算)
164+- 每条分支的 prompt 要包含足够上下文但不能太长(宽度换深度的 tradeoff)
165+- converge 过程本身不能引入新幻觉(优先用规则而非 AI 做汇聚)
166+- 要有 dry-run 模式:只生成 scout 计划不实际执行,供人审核
167+
168+## 设计哲学
169+
170+> 思考的成本外包出去,做事的 token 留给自己。
171+> 不是未卜先知,是遍历之后装作没遍历过。
172+> 掌拳掌:散开探路,收回来打,再散开修。