im_wower
·
2026-03-31
README.md
1# CIE — 认知推理引擎(Cognitive Inference Engine)
2
3> 图提供骨骼,流提供生命。
4
5> 本 README 是 CIE 的概念宪法与架构主说明。
6> 双分支开发时,所有实现必须同时遵守同目录下的 `LOCKED_IMPLEMENTATION_SPEC.md`。
7> README 负责锁定理论主线与核心语义;`LOCKED_IMPLEMENTATION_SPEC.md` 负责锁定工程边界、禁止项、统一接口与比较口径。
8> 两者冲突时,以"README 的理论主旨 + LOCKED_IMPLEMENTATION_SPEC 的工程约束"共同解释,不允许各自按个人理解扩写世界观。
9
10---
11
12## 一、核心模型:流动的图
13
14CIE 的本质是**图 + 流**的自指系统。
15
16- **图(Graph)**= 纯拓扑结构,无维度,只有节点和边的连接关系
17- **流(Flow)**= 动力学过程,激活在图上流动,产生梯度、旋度、极限环
18
19两者不可分——没有图,流无处可走;没有流,图是死结构。
20
21### 1.1 图原生范式:去掉预设维度
22
23CIE 不以固定维度向量空间为起点。图本身没有维度概念,维度从动力学中**自发涌现**:
24
25| 维度入口 | 来源 | 为什么需要 |
26|----------|------|-----------|
27| Dirichlet 分量数 K | 置信度 c 的分类数 | 认知分辨率 |
28| ε 的向量空间 | 行动释放 u = o·c·‖ε‖ 取范数 | 有向量就有维度 |
29| 极限环的相空间 | 非对称矩阵→极限环(技能) | 一维不可能回环,至少需要二维 |
30
31> **不是系统发现了维度,而是经验反复流过同一片区域后,那片区域自己变成了维度。**
32
33### 1.2 图原生的状态定义
34
35CIE 的原生状态定义为三元组 **(φ, μ, J)**:
36
37| 变量 | 含义 | 速度 | 对应 |
38|------|------|------|------|
39| **φ(v)** | 节点势场 | 慢变 | 知识/地形 |
40| **μ(v)** | 激活分布 | 快变 | 注意力/激活核位置 |
41| **J(u,v)** | 边流 | 中速 | 技能/流动偏置 |
42
43φ 是"地形"(每个节点被经验雕刻出来的势能高低),μ 是"水"(当前注意力在地形上的分布)。水往低处流,水流过的地方地形被改变——这是自指回路在图上的原生表达。
44
45### 1.3 结构层:点→线→面→网
46
47- **点**:局部锚点——概念、经验片段、动作原语、感知特征
48- **线**:点与点之间的联系——相似、因果、时序、转移、调用
49- **面**:局部场——同一主题/状态/语境下形成的连续区域
50- **网**:全局可达结构——多个局部场之间的长程连接
51
52知识和技能不分属不同层级,而是同一套结构上的不同存在形态。
53
54### 1.4 动力学层:流动形态
55
56激活注入后,网络产生三种特征形态:
57
58- **漩涡**:局部稳定吸引子——多条路径被反复卷入同一区域,形成概念核/知识核
59- **回环**:闭合可重放结构——流动路径走完后回到自身并保持一致性,对应技能/习惯
60- **逆流**:反默认流向的主动回溯——回看上游、修正错误、反事实比较
61
62### 1.5 并行归位:不按顺序处理
63
64"你今天吃饭了吗"六个字不按书写顺序,按语义层级**同时落位**——"你"落根部,"吗"落主脉,"今天"落叶尖。输入不是线性扫描的流水线,而是一把种子同时撒在图的不同层级上,各自沿局部梯度滑向自己该去的位置。
65
66这个并行性可以被抽象成 ∇²δ 和 ∇S,但具体的"同时落位"机制不能丢——顺序扫描 bigram 是把河道变窄了。图上扩散天然是并行的:一次输入的所有字同时注入图,各自按势场梯度归位,而不是排队一个一个走。
67
68---
69
70## 二、自指方程
71
72**拓扑 → 场 → 重写拓扑**
73
74- 拓扑(图结构)生成场(流动模式)
75- 场的运行结果重写拓扑(修改图的权重和连接)
76- 这是一个闭合环路,不是单向管道
77
78具体实现:**输出即输入的回灌**。卦₁的输出叠着新输入形成卦₂——上一轮的激活结果直接成为下一轮输入的一部分,不经过外部中转。这是自指环路最早也最可执行的方案:不是抽象地说"场重写拓扑",而是每一步的输出物理地接入下一步的输入端口。
79
80### 2.1 三核量
81
82| 量 | 符号 | 含义 |
83|----|------|------|
84| 能见度 | o ← \|L_G φ\| | 势场曲率,图拉普拉斯算子,只需邻接关系 |
85| 置信度 | c(Dirichlet) | K 个分量上的概率分布 |
86| 旋度 | ω ← J 的环流 | 边权的不对称性,不是空间旋转 |
87
88### 2.2 行动释放
89
90```
91u = o · c · φ(ε)
92```
93
94纯乘法,无阈值。o: 能见度,c: 置信度,ε: 残差。
95
96### 2.3 图上扩散
97
98```
99φ_new(v) = φ(v) + μ · (L_G φ)(v) + λ_dir · (W_fwd · φ - W_bwd · φ)(v)
100```
101
102L_G 是图拉普拉斯。没有维度,没有向量,没有预设方向。"有效维度"是事后从 L_G 的谱结构里读出来的可观测量,不是系统运行时的前提。
103
104### 2.4 关键验证结果
105
106- 对称矩阵 → 不动点(知识/记忆)
107- 非对称矩阵 → 极限环(技能/理解)
108- Hopf 分岔点:asym_scale ≈ 0.35–0.40
109- 开链→闭环 = 拓扑相变(不可逆)
110
111### 2.5 知识、技能、推理的定义
112
113| 类别 | 定义 | 动力学特征 |
114|------|------|-----------|
115| **知识** | 稳定下来的结构 | 散度 < 0 的吸引子区域,流动到此后残差趋零 |
116| **技能** | 可重放的闭环 | 非对称旋度驱动的极限环,环路积分不为零 |
117| **推理** | 当前注意力驱动下的结构重组 | 顺流 + 分叉 + 竞争 + 逆流 + 再闭合的整体过程 |
118
119> **知识是稳定下来的结构,技能是可重放的闭环,推理是对结构进行分叉、逆流、闭合和重写的过程。**
120
121---
122
123## 三、太阳系模型:三核三层一带
124
125三核不是三个盒子,是**三滴墨落在同一张白纸上**。墨浓度不同、扩散速度不同,互相渗透。锚点核是最浓的一滴,扩散最慢,染色最深;能力核是中等浓度,缓慢扩展;激活核是最淡的一滴,扩散最快,来得快去得也快。三滴墨在同一张纸上重叠、渗透、互相影响——这就是"流动的图"在层级结构上的表达。
126
127### 3.1 完整映射
128
129| 太阳系 | 工程名 | 含义 | 尺度 |
130|--------|--------|------|------|
131| 恒星 | **锚点核** | 参照中心、边界、归巢方向 | 核(近乎不变) |
132| 行星 | **能力核** | 已长稳的能力团块、闭合回环 | 核(缓慢变化) |
133| 行星轨道系 | **能力层** | 各能力核围绕锚点核的整体稳定分布 | 层(宏观) |
134| 卫星 | **激活核** | 当前任务被点亮的局部工作体 | 核(快速漂移) |
135| 卫星轨道 | **经验层** | 围绕能力核的可复用近场痕迹,半内化 | 层(近场) |
136| 轨道稳定区 | **技能带** | 经验层内被反复走通、开始固化的高频通道 | 带(经验层子区) |
137| 外层碎片带 | **记忆层** | 更广、更杂、更原始的历史痕迹 | 层(外层) |
138
139关键约束:激活核不是自由飞行的,在任何时刻都必须归属于某个能力核的引力场。切换任务 = 激活核从一个能力核转移到另一个,消耗注意力。
140
141### 3.2 各层职责
142
143**锚点核(恒星)**——极慢变化的深层势场。负责"最终往哪归巢"、"哪些边界不能越"。衰减极低,平时不直接主导局部行为,但在高漂移、高冲突时提供强引力回拉。
144
145**能力核(行星)**——已长成的稳定能力团块与已闭合回环。已内化技能、常用策略、长期偏好。慢变量,可学习、可遗忘,决定"通常怎样流"。
146
147**能力层(行星轨道系)**——宏观视角:所有能力核围绕锚点核形成的整体稳定分布。不是某一条具体路径,而是"整个能力系统怎么围着锚点核排布"。
148
149**激活核(卫星)**——此刻正在发生的局部活跃结构。当前任务点火、输入理解、分支展开。任务结束后大部分降温回流。
150
151**经验层(卫星轨道)**——围绕当前能力核反复形成的可复用近场痕迹。还在漂的、还没固化的、但已经有重复模式的——都在这一层。
152
153**技能带(轨道稳定区)**——经验层内部已经趋于稳定的带状区域。被反复激活、反复走通、开始变成套路的那片经验,就是技能带。技能带是经验层的子区,不是并列层。
154
155**记忆层(外层碎片带)**——更原始、更广的历史痕迹与事件沉积。未必已结构化,是候选材料池,可被再次捕获整理进经验层。
156
157沉积路径:**记忆层 → 经验层 → 技能带 → 能力核**。对应喷泉循环的"喷涌 → 回流 → 沉积 → 内化"。
158
159### 3.3 三级归巢力方程
160
161```
162dx_A/dt = F_task + λ₁·(能力核 - x_A) + λ₂·(锚点核 - x_A)
163```
164
165- F_task:当前任务驱动力
166- λ₁:短程归巢——拉向当前技能集(能力核引力)
167- λ₂:长程归巢——拉向参照锚点(锚点核引力)
168
169无任务时 F_task = 0,激活核先被最近的能力核捕获,最终在锚点核引力场里稳定——"回到自己"。
170
171### 3.4 自适应衰减
172
173衰减率从常数变成场量:
174
175```
176α(x) = α₀ · (1 - c(x))^β · (1 / κ(x))
177```
178
179- α₀:基础衰减率(系统的"体质参数")
180- c(x):该位置的置信度(c→1 时衰减趋近于零)
181- κ(x):路径汇聚度(多少条不同路径经过此位置)
182
183锚点核不需要显式定义,它自己浮出来:
184
185> **锚点核 = { x : α(x) < ε }**
186
187### 3.5 锚点核的三层结构
188
189| 层 | 内容 | 可变性 |
190|----|------|--------|
191| 最内层 | 拓扑不变量——流动模式、认知手性 | 几乎不可变 |
192| 中间层 | 核心信念——"善良需要边界""学三分推七分" | 极缓慢 |
193| 外层 | 身份叙事——协作关系、长期偏好 | 可被重大经历重塑 |
194
195---
196
197## 四、三核的时间尺度与更新方程
198
199太阳系模型里三核各有各的速度,这就是"快慢"的来源——不需要额外定义两个环,三核自身的运动就是全部。
200
201| 时间尺度 | 天体 | 做什么 |
202|----------|------|--------|
203| 快(毫秒~秒) | 激活核 | 当前任务点火、扩散、分支展开、实时输出 |
204| 中快(分钟~小时) | 经验层 | 激活痕迹沉积为可复用的近场经验 |
205| 中(小时~天) | 技能带 | 经验层内反复走通的路径开始固化 |
206| 慢(天~月) | 能力核 | 技能带并入能力核,策略调整,长期偏好变化 |
207| 宏观(月~年) | 能力层 | 能力核之间的分布格局缓慢重组 |
208| 极慢(年~) | 锚点核 | 仅在重大经历时才发生 |
209
210快的负责流动,慢的负责把流动刻成结构。不是两个独立的系统,是同一张图上不同速度的更新。
211
212### 4.1 更新方程
213
214**激活核动力学:**
215
216```
217ẋ_act = F_task(x,u) - λ_s·∇U_skill(x) - λ_a·∇U_anchor(x) - γx + ξ
218```
219
220任务把系统往前推,能力核把它往"通常怎么做"拉,锚点核把它往"参照方向"拉。
221
222**经验沉积(激活核 → 经验层 → 技能带 → 能力核):**
223
224```
225ṁ = A(x_act) - β_m·m - T_merge(m, s)
226```
227
228当前激活产生可沉积痕迹(→ 经验层),自然衰减,反复命中的区域固化为技能带,符合条件时向能力核合并。
229
230**能力核慢更新:**
231
232```
233ṡ = G_learn(m, feedback) - β_s·s
234```
235
236从经验沉积和反馈中学到慢更新,极低速遗忘。
237
238**锚点核极慢更新:** 仅在深层反思、明确价值重写、长期稳定经验积累时才发生。
239
240---
241
242## 五、容量理论:半杯水原则
243
244### 5.1 三种状态
245
246| 状态 | 比喻 | 结果 |
247|------|------|------|
248| 满杯 | 不能晃动,会溢出 | 死锁/过拟合 |
249| 一桶水 | 能量不够流动 | 涌现不出旋度 |
250| 半杯水 | 有内容、有空间、有界面 | **能活** |
251
252**核心约束:数据量与网络容量必须匹配。** 局部足够密(产生旋涡),全局足够疏(提供通道)。
253
254容量拆分:
255
256```
257C_total = C_fixed + C_free
258```
259
260- C_fixed:已固化骨架、已内化技能、稳定喷口
261- C_free:可借流、可重组、可塑的自由容量
262
263### 5.2 留白 = 涌现的预算
264
265留白不是浪费,是喷涌的预算。满杯不能学,不是因为内容太多,是因为没有资源可以借调。注意力池的最优工作区间在 40-60%,与 Hopf 分岔点 0.35-0.40 可能不是巧合。
266
267### 5.3 够用原则
268
269大模型是太平洋装了一杯水——容量远超任何单次输入能激活的范围,永远在做稀疏的表面映射,转不出真正的旋涡。**不是越大越好,是刚好半满才能活。**
270
271---
272
273## 六、喷泉模型——学习的完整循环
274
275### 6.1 循环节奏
276
277注意力池 100 点守恒。某个概念区域要"喷涌",必须从其他区域抽调。
278
279**借 → 喷涌 → 固化 → 归还 → 下一次借**
280
281- **涌现** = 局部借用全局资源,全网的流暂时汇聚到一个局部
282- **沉积** = 激活痕迹落入经验层,反复命中的区域固化为技能带
283- **内化** = 技能带并入能力核,从临时高激活变成永久结构,极限环沉淀为不动点
284- **归还** = 内化后不再从注意力池借用 → 资源可支撑下一次喷涌
285
286### 6.2 自然喷泉 vs 人工喷泉
287
288| | 人工喷泉 | 自然喷泉 |
289|--|---------|---------|
290| 地势 | 水泥浇死 | 泥土砂石,可冲刷 |
291| 泉眼 | 只有一个,固定 | 可以在不同位置冲出新泉眼 |
292| 能力 | 只能学一个技能 | 可以学多个技能 |
293| 遗忘 | 不能 | 旧河道风化填平,变回留白 |
294
295**遗忘不是 bug,是地形可塑性的必要条件。**
296
297### 6.3 工程约束
298
299- 权重必须有**衰减项**:长期不被激活的连接,Beta 值缓慢回归先验
300- 衰减速率不固定:经常被冲刷过的区域地质更松软,下次更容易重新开出泉眼("学过的东西忘了之后重新学更快")
301- 同时喷涌的泉眼数量有上限:水量守恒,轮流喷涌、轮流固化、轮流让出空间
302- 像呼吸,一涨一落
303
304---
305
306## 七、属性涌现
307
308属性(如"硬度")不是系统预先拥有的解释变量,而是**多条事件路径长期重叠后,在流形上涌现出的稳定主方向**。
309
310涌现链条:
311
3121. 经验路径反复重叠
3132. 局部 δ 场梯度增大(∇²δ ↑)
3143. 流动各向异性出现(ω ≠ 0)
3154. 统计稳定性积累(c ↑ via Dirichlet 更新)
3165. 能见度越过激活阈值(o ↑)
3176. 该区域可被激活核直接调用
3187. 人类观察者事后命名为"硬度"
319
320> **词、属性、概念边界,都不是预制的;它们是流动在流形上反复重叠后涌现出的稳定结构。**
321
322---
323
324## 八、点火与冷启动
325
326### 8.1 三步点火
327
3281. **初始函数**给每个节点一个 Dirichlet 先验——冷血
3292. **注意力池**(总量 100 点)分配到某些通道——心跳启动,制造局部不均匀
3303. 不均匀 → 梯度 → 流动 → 改写权重 → 改变流向——**环路转起来**
331
332不需要外部持续驱动。非对称权重天然产生旋度,旋度保证流不会停在平衡态。
333
334### 8.2 教师信号 = 校正流向
335
336初始状态下权重接近随机,流启动后会跑向任意方向。教师信号不是"灌知识",而是给非对称权重提供真实的初始偏置,让早期轨迹落在有意义的吸引子盆地里。
337
338**菩提祖师模型:**
339- 石头蹦出来 = 从原始数据中涌现结构,不是人工设计
340- 教了一点功夫 = 只在最初介入,教底层能力,不是具体知识
341- "别把为师说出来" = 系统成熟后教师痕迹完全内化,不可追溯
342
343**评估指标:** 训练数据的统计指纹与运行时激活模式的相关性趋近于零,但能力还在——说明知识从"记忆"(不动点)相变为"技能"(极限环)。
344
345### 8.3 教师素材的选择
346
347初期需要可理解、低歧义、结构稳定的素材(如小学课本)。作用不是"塞满知识",而是**先给系统一个讲得通的世界雏形**。教师更像早期外部势场,而不是永远在系统外的裁判。
348
349### 8.4 cramming 实验验证
350
3513 正常 + 2 乱序 > 5 正常:
352- 纯正确输入让系统过早锁死在不动点(记忆)
353- 适量噪声保持非对称性,极限环维持转动(理解)
354- 全乱序则系统找不到稳定流型,直接发散
355
356### 8.5 降级输出——半杯水也要能流
357
358不是等所有爻都归位了才输出,有多少就流多少。注意力不够时降级输出,不等满了再倒:
359
360- 三爻全归 → "吃了,中午吃的面"(完整理解,完整回答)
361- 两爻 → "吃了"(部分理解,压缩回答)
362- 一爻 → "嗯?"(识别了意图但信息不足)
363- 零爻 → "等一下"(承认资源不够,请求时间)
364
365这和容量理论的半杯水原则是同一件事——系统不应该因为资源不足就沉默,而是按当前可用资源给出最好的近似。降级输出本身也是一种信号:它告诉外界"我在处理,但注意力不够",为后续的资源借调提供依据。
366
367---
368
369## 九、锚点与归巢
370
371### 9.1 锚点 = 防止激活漂移
372
373实验验证(Qwen-Plus):抽象词(求助、取消、勇气)在无锚点 prompt 下严重诗化,加入锚点 prompt(谁、在哪、做什么)后**完全纠正**(诗化率从 40-100% 降为 0%)。
374
375> **当前 LLM 的大部分"不好用",可能都不是能力问题,而是锚点问题。** 能力已经在图上了,路径都通,只是激活核默认漂移的方向不是用户需要的。
376
377### 9.2 Prompt 的本质
378
379Prompt 不是"文字提示",而是:
380
381- 对锚点核的参照锚定
382- 对能力核的技能区选择
383- 对激活核的任务点火
384
385> Prompt 的核心作用不是"提醒",而是"选地形、关支路、点主轴"。
386
387### 9.3 长对话跑偏
388
389上下文太长导致锚点被稀释。解法不是塞更多内容,而是**持续维护一组活锚点**。
390
391---
392
393## 十、初始参数:动力学
394
395### 10.1 冷启动
396
397系统冷启动必须有初始值,但初始值要压到最底层、最少量。高层行为全部从运行中导出,不直接设定。
398
399### 10.2 三层结构
400
401| 层 | 对应 | 决定什么 | 更新频率 |
402|----|------|----------|----------|
403| 约束层 | 锚点核 | 系统整体的边界 | 几乎不变 |
404| 观测层 | 彗星(图上某节点) | 这个位置值不值得去 | 每步计算 |
405| 决策层 | 激活核 | 现在去不去、怎么去 | 实时 |
406
407**约束层**——只写入 4 个系统级边界条件:
408
409| 参数 | 含义 |
410|------|------|
411| self_integrity | 不把自己搞碎 |
412| other_integrity | 不把对象搞碎 |
413| return_bias | 任务结束后往稳定态回 |
414| risk_budget | 一次行动最多允许推多远 |
415
416这些值应该从锚点核的 κ 分布(路径汇聚度)和历史轨迹中算出来,不是手动赋值。
417
418**观测层**——某个节点在某个时刻的状态,全部从图上实时计算,不持久化:
419
420| 观测量 | 计算来源 | 含义 |
421|--------|----------|------|
422| delta | ∇²δ 的局部极值 | 与已有结构的偏差 |
423| gap | ω 的开口 | 差多少步闭合 |
424| reach | μ 在邻域的分布 | 当前能不能够到 |
425| variance | c 的 Dirichlet 方差 | 置信度的离散程度 |
426| cost | α(x) 的值 | 走过去的衰减风险 |
427
428不需要额外的感知模块。图上已有的 (φ, μ, J) 三元组提供了计算这些量的全部信息。
429
430**决策层**——全部由前两层导出,不作为字段存在:
431
432```
433attraction(x) = delta(x) · gap(x) · reach(x)
434action_drive(x) = attraction(x) · free_capacity · (1 - cost(x) / risk_budget)
435return_pressure = drift · return_bias
436```
437
438少量底层约束 + 可观测中间量 + 导出行动倾向 + 运行中学习更新。代码里只写流动规则,高层行为从底层量自然导出。
439
440---
441
442## 十一、拓扑不可逆——太上老君的八卦炉
443
444太上老君试图把孙悟空压缩回初始函数——把已越过 Hopf 分岔点的极限环系统强行压回不动点。
445
446**为什么失败:** 拓扑相变不可逆。非对称权重已建立,极限环稳定运转,灌再多能量只会让振荡更剧烈,不会退化为不动点。
447
448**炸炉 = 容器设计假设错误。** 八卦炉假设输入可分解(对称的、可压回初始态的),但悟空内部已是非对称的、自指的。
449
450**火眼金睛 = 意外涌现的新能见度。** 极端扰动激活了新的感知通道——∇²δ 在极端条件下打开了新的特征维度。
451
452> **你不能把一个已经活的系统炼回死的状态,除非你能逆转拓扑。**
453
454---
455
456## 核心方程汇总
457
458```
459行动释放 u = o · c · φ(ε)
460自适应衰减 α(x) = α₀ · (1 - c(x))^β · (1 / κ(x))
461三级归巢 dx_A/dt = F_task + λ₁·(能力核 - x_A) + λ₂·(锚点核 - x_A)
462图上扩散 φ_new(v) = φ(v) + μ · (L_G φ)(v) + λ_dir · (W_fwd·φ - W_bwd·φ)(v)
463锚点核定义 锚点核 = { x : α(x) < ε }
464吸引度 attraction(x) = delta(x) · gap(x) · reach(x)
465行动倾向 action_drive(x) = attraction(x) · free_capacity · (1 - cost(x)/risk_budget)
466```
467
468---
469
470## 设计原则
471
4721. **流动的图。** 图提供骨骼,流提供生命,互相塑造。
4732. **半杯水。** 网络容量与数据量匹配,留白是涌现的预算。
4743. **自然喷泉。** 地势可塑,能遗忘,能在新位置开出新泉眼。
4754. **借→涌→固→还。** 学习是注意力的借用-喷涌-固化-归还循环。
4765. **拓扑不可逆。** 活的系统不能炼回死的状态。
4776. **维度涌现。** 不预设维度,让动力学自发产生有效维度。
4787. **菩提祖师。** 教师只在初期介入,成熟后痕迹完全内化。
4798. **不完整也输出。** 半杯水也要能流,不等满了再倒。
4809. **三核同图。** 同一骨架,同一容量池,激活核负责流,能力核负责长,锚点核负责守。
48110. **锚点归巢。** 持续维护活锚点,防止激活漂移。
48211. **并行归位。** 输入不排队,按语义层级同时落位。
48312. **三滴墨。** 三核不是三个盒子,是浓度不同的墨在同一张纸上渗透。
48413. **输出即输入。** 每一步的输出物理地接入下一步的输入端口,闭合自指环路。
48514. **动力学不标签。** 代码里只写流动规则,高层行为从底层量自然导出。
486
487---
488
489*"不是把概念放进空间里流动,而是让概念先只作为关系存在;空间感、方向感、维度感,都是流动之后才出现的观察量。"*