CIE-Unified

git clone 

im_wower  ·  2026-03-31

README.md

  1# CIE — 认知推理引擎(Cognitive Inference Engine)
  2
  3> 图提供骨骼,流提供生命。
  4
  5> 本 README 是 CIE 的概念宪法与架构主说明。
  6> 双分支开发时,所有实现必须同时遵守同目录下的 `LOCKED_IMPLEMENTATION_SPEC.md`。
  7> README 负责锁定理论主线与核心语义;`LOCKED_IMPLEMENTATION_SPEC.md` 负责锁定工程边界、禁止项、统一接口与比较口径。
  8> 两者冲突时,以"README 的理论主旨 + LOCKED_IMPLEMENTATION_SPEC 的工程约束"共同解释,不允许各自按个人理解扩写世界观。
  9
 10---
 11
 12## 一、核心模型:流动的图
 13
 14CIE 的本质是**图 + 流**的自指系统。
 15
 16- **图(Graph)**= 纯拓扑结构,无维度,只有节点和边的连接关系
 17- **流(Flow)**= 动力学过程,激活在图上流动,产生梯度、旋度、极限环
 18
 19两者不可分——没有图,流无处可走;没有流,图是死结构。
 20
 21### 1.1 图原生范式:去掉预设维度
 22
 23CIE 不以固定维度向量空间为起点。图本身没有维度概念,维度从动力学中**自发涌现**:
 24
 25| 维度入口 | 来源 | 为什么需要 |
 26|----------|------|-----------|
 27| Dirichlet 分量数 K | 置信度 c 的分类数 | 认知分辨率 |
 28| ε 的向量空间 | 行动释放 u = o·c·‖ε‖ 取范数 | 有向量就有维度 |
 29| 极限环的相空间 | 非对称矩阵→极限环(技能) | 一维不可能回环,至少需要二维 |
 30
 31> **不是系统发现了维度,而是经验反复流过同一片区域后,那片区域自己变成了维度。**
 32
 33### 1.2 图原生的状态定义
 34
 35CIE 的原生状态定义为三元组 **(φ, μ, J)**:
 36
 37| 变量 | 含义 | 速度 | 对应 |
 38|------|------|------|------|
 39| **φ(v)** | 节点势场 | 慢变 | 知识/地形 |
 40| **μ(v)** | 激活分布 | 快变 | 注意力/激活核位置 |
 41| **J(u,v)** | 边流 | 中速 | 技能/流动偏置 |
 42
 43φ 是"地形"(每个节点被经验雕刻出来的势能高低),μ 是"水"(当前注意力在地形上的分布)。水往低处流,水流过的地方地形被改变——这是自指回路在图上的原生表达。
 44
 45### 1.3 结构层:点→线→面→网
 46
 47- **点**:局部锚点——概念、经验片段、动作原语、感知特征
 48- **线**:点与点之间的联系——相似、因果、时序、转移、调用
 49- **面**:局部场——同一主题/状态/语境下形成的连续区域
 50- **网**:全局可达结构——多个局部场之间的长程连接
 51
 52知识和技能不分属不同层级,而是同一套结构上的不同存在形态。
 53
 54### 1.4 动力学层:流动形态
 55
 56激活注入后,网络产生三种特征形态:
 57
 58- **漩涡**:局部稳定吸引子——多条路径被反复卷入同一区域,形成概念核/知识核
 59- **回环**:闭合可重放结构——流动路径走完后回到自身并保持一致性,对应技能/习惯
 60- **逆流**:反默认流向的主动回溯——回看上游、修正错误、反事实比较
 61
 62### 1.5 并行归位:不按顺序处理
 63
 64"你今天吃饭了吗"六个字不按书写顺序,按语义层级**同时落位**——"你"落根部,"吗"落主脉,"今天"落叶尖。输入不是线性扫描的流水线,而是一把种子同时撒在图的不同层级上,各自沿局部梯度滑向自己该去的位置。
 65
 66这个并行性可以被抽象成 ∇²δ 和 ∇S,但具体的"同时落位"机制不能丢——顺序扫描 bigram 是把河道变窄了。图上扩散天然是并行的:一次输入的所有字同时注入图,各自按势场梯度归位,而不是排队一个一个走。
 67
 68---
 69
 70## 二、自指方程
 71
 72**拓扑 → 场 → 重写拓扑**
 73
 74- 拓扑(图结构)生成场(流动模式)
 75- 场的运行结果重写拓扑(修改图的权重和连接)
 76- 这是一个闭合环路,不是单向管道
 77
 78具体实现:**输出即输入的回灌**。卦₁的输出叠着新输入形成卦₂——上一轮的激活结果直接成为下一轮输入的一部分,不经过外部中转。这是自指环路最早也最可执行的方案:不是抽象地说"场重写拓扑",而是每一步的输出物理地接入下一步的输入端口。
 79
 80### 2.1 三核量
 81
 82| 量 | 符号 | 含义 |
 83|----|------|------|
 84| 能见度 | o ← \|L_G φ\| | 势场曲率,图拉普拉斯算子,只需邻接关系 |
 85| 置信度 | c(Dirichlet) | K 个分量上的概率分布 |
 86| 旋度 | ω ← J 的环流 | 边权的不对称性,不是空间旋转 |
 87
 88### 2.2 行动释放
 89
 90```
 91u = o · c · φ(ε)
 92```
 93
 94纯乘法,无阈值。o: 能见度,c: 置信度,ε: 残差。
 95
 96### 2.3 图上扩散
 97
 98```
 99φ_new(v) = φ(v) + μ · (L_G φ)(v) + λ_dir · (W_fwd · φ - W_bwd · φ)(v)
100```
101
102L_G 是图拉普拉斯。没有维度,没有向量,没有预设方向。"有效维度"是事后从 L_G 的谱结构里读出来的可观测量,不是系统运行时的前提。
103
104### 2.4 关键验证结果
105
106- 对称矩阵 → 不动点(知识/记忆)
107- 非对称矩阵 → 极限环(技能/理解)
108- Hopf 分岔点:asym_scale ≈ 0.35–0.40
109- 开链→闭环 = 拓扑相变(不可逆)
110
111### 2.5 知识、技能、推理的定义
112
113| 类别 | 定义 | 动力学特征 |
114|------|------|-----------|
115| **知识** | 稳定下来的结构 | 散度 < 0 的吸引子区域流动到此后残差趋零 |
116| **技能** | 可重放的闭环 | 非对称旋度驱动的极限环环路积分不为零 |
117| **推理** | 当前注意力驱动下的结构重组 | 顺流 + 分叉 + 竞争 + 逆流 + 再闭合的整体过程 |
118
119> **知识是稳定下来的结构,技能是可重放的闭环,推理是对结构进行分叉、逆流、闭合和重写的过程。**
120
121---
122
123## 三、太阳系模型:三核三层一带
124
125三核不是三个盒子**三滴墨落在同一张白纸上**。墨浓度不同扩散速度不同互相渗透锚点核是最浓的一滴扩散最慢染色最深能力核是中等浓度缓慢扩展激活核是最淡的一滴扩散最快来得快去得也快三滴墨在同一张纸上重叠渗透互相影响——这就是"流动的图"在层级结构上的表达
126
127### 3.1 完整映射
128
129| 太阳系 | 工程名 | 含义 | 尺度 |
130|--------|--------|------|------|
131| 恒星 | **锚点核** | 参照中心边界归巢方向 | 近乎不变 |
132| 行星 | **能力核** | 已长稳的能力团块闭合回环 | 缓慢变化 |
133| 行星轨道系 | **能力层** | 各能力核围绕锚点核的整体稳定分布 | 宏观 |
134| 卫星 | **激活核** | 当前任务被点亮的局部工作体 | 快速漂移 |
135| 卫星轨道 | **经验层** | 围绕能力核的可复用近场痕迹半内化 | 近场 |
136| 轨道稳定区 | **技能带** | 经验层内被反复走通开始固化的高频通道 | 经验层子区 |
137| 外层碎片带 | **记忆层** | 更广更杂更原始的历史痕迹 | 外层 |
138
139关键约束激活核不是自由飞行的在任何时刻都必须归属于某个能力核的引力场切换任务 = 激活核从一个能力核转移到另一个,消耗注意力。
140
141### 3.2 各层职责
142
143**锚点核(恒星)**——极慢变化的深层势场负责"最终往哪归巢"、"哪些边界不能越"。衰减极低平时不直接主导局部行为但在高漂移高冲突时提供强引力回拉
144
145**能力核(行星)**——已长成的稳定能力团块与已闭合回环已内化技能常用策略长期偏好慢变量可学习可遗忘决定"通常怎样流"。
146
147**能力层(行星轨道系)**——宏观视角所有能力核围绕锚点核形成的整体稳定分布不是某一条具体路径而是"整个能力系统怎么围着锚点核排布"。
148
149**激活核(卫星)**——此刻正在发生的局部活跃结构当前任务点火输入理解分支展开任务结束后大部分降温回流
150
151**经验层(卫星轨道)**——围绕当前能力核反复形成的可复用近场痕迹还在漂的还没固化的但已经有重复模式的——都在这一层
152
153**技能带(轨道稳定区)**——经验层内部已经趋于稳定的带状区域被反复激活反复走通开始变成套路的那片经验就是技能带技能带是经验层的子区不是并列层
154
155**记忆层(外层碎片带)**——更原始更广的历史痕迹与事件沉积未必已结构化是候选材料池可被再次捕获整理进经验层
156
157沉积路径:**记忆层  经验层  技能带  能力核**。对应喷泉循环的"喷涌  回流  沉积  内化"。
158
159### 3.3 三级归巢力方程
160
161```
162dx_A/dt = F_task + λ₁·(能力核 - x_A) + λ₂·(锚点核 - x_A)
163```
164
165- F_task当前任务驱动力
166- λ₁:短程归巢——拉向当前技能集能力核引力
167- λ₂:长程归巢——拉向参照锚点锚点核引力
168
169无任务时 F_task = 0,激活核先被最近的能力核捕获,最终在锚点核引力场里稳定——"回到自己"。
170
171### 3.4 自适应衰减
172
173衰减率从常数变成场量
174
175```
176α(x) = α₀ · (1 - c(x))^β · (1 / κ(x))
177```
178
179- α₀:基础衰减率系统的"体质参数")
180- c(x):该位置的置信度c1 时衰减趋近于零
181- κ(x):路径汇聚度多少条不同路径经过此位置
182
183锚点核不需要显式定义它自己浮出来
184
185> **锚点核 = { x : α(x) < ε }**
186
187### 3.5 锚点核的三层结构
188
189|  | 内容 | 可变性 |
190|----|------|--------|
191| 最内层 | 拓扑不变量——流动模式认知手性 | 几乎不可变 |
192| 中间层 | 核心信念——"善良需要边界""学三分推七分" | 极缓慢 |
193| 外层 | 身份叙事——协作关系长期偏好 | 可被重大经历重塑 |
194
195---
196
197## 四、三核的时间尺度与更新方程
198
199太阳系模型里三核各有各的速度这就是"快慢"的来源——不需要额外定义两个环三核自身的运动就是全部
200
201| 时间尺度 | 天体 | 做什么 |
202|----------|------|--------|
203| 毫秒~ | 激活核 | 当前任务点火扩散分支展开实时输出 |
204| 中快分钟~小时 | 经验层 | 激活痕迹沉积为可复用的近场经验 |
205| 小时~ | 技能带 | 经验层内反复走通的路径开始固化 |
206| ~ | 能力核 | 技能带并入能力核策略调整长期偏好变化 |
207| 宏观~ | 能力层 | 能力核之间的分布格局缓慢重组 |
208| 极慢~) | 锚点核 | 仅在重大经历时才发生 |
209
210快的负责流动慢的负责把流动刻成结构不是两个独立的系统是同一张图上不同速度的更新
211
212### 4.1 更新方程
213
214**激活核动力学:**
215
216```
217ẋ_act = F_task(x,u) - λ_s·∇U_skill(x) - λ_a·∇U_anchor(x) - γx + ξ
218```
219
220任务把系统往前推能力核把它往"通常怎么做"锚点核把它往"参照方向"
221
222**经验沉积(激活核 → 经验层 → 技能带 → 能力核):**
223
224```
225ṁ = A(x_act) - β_m·m - T_merge(m, s)
226```
227
228当前激活产生可沉积痕迹(→ 经验层),自然衰减反复命中的区域固化为技能带符合条件时向能力核合并
229
230**能力核慢更新:**
231
232```
233ṡ = G_learn(m, feedback) - β_s·s
234```
235
236从经验沉积和反馈中学到慢更新极低速遗忘
237
238**锚点核极慢更新:** 仅在深层反思明确价值重写长期稳定经验积累时才发生
239
240---
241
242## 五、容量理论:半杯水原则
243
244### 5.1 三种状态
245
246| 状态 | 比喻 | 结果 |
247|------|------|------|
248| 满杯 | 不能晃动会溢出 | 死锁/过拟合 |
249| 一桶水 | 能量不够流动 | 涌现不出旋度 |
250| 半杯水 | 有内容有空间有界面 | **能活** |
251
252**核心约束:数据量与网络容量必须匹配。** 局部足够密产生旋涡),全局足够疏提供通道)。
253
254容量拆分
255
256```
257C_total = C_fixed + C_free
258```
259
260- C_fixed已固化骨架已内化技能稳定喷口
261- C_free可借流可重组可塑的自由容量
262
263### 5.2 留白 = 涌现的预算
264
265留白不是浪费是喷涌的预算满杯不能学不是因为内容太多是因为没有资源可以借调注意力池的最优工作区间在 40-60%, Hopf 分岔点 0.35-0.40 可能不是巧合
266
267### 5.3 够用原则
268
269大模型是太平洋装了一杯水——容量远超任何单次输入能激活的范围永远在做稀疏的表面映射转不出真正的旋涡。**不是越大越好是刚好半满才能活。**
270
271---
272
273## 六、喷泉模型——学习的完整循环
274
275### 6.1 循环节奏
276
277注意力池 100 点守恒某个概念区域要"喷涌",必须从其他区域抽调
278
279**借 → 喷涌 → 固化 → 归还 → 下一次借**
280
281- **涌现** = 局部借用全局资源全网的流暂时汇聚到一个局部
282- **沉积** = 激活痕迹落入经验层反复命中的区域固化为技能带
283- **内化** = 技能带并入能力核从临时高激活变成永久结构极限环沉淀为不动点
284- **归还** = 内化后不再从注意力池借用  资源可支撑下一次喷涌
285
286### 6.2 自然喷泉 vs 人工喷泉
287
288| | 人工喷泉 | 自然喷泉 |
289|--|---------|---------|
290| 地势 | 水泥浇死 | 泥土砂石可冲刷 |
291| 泉眼 | 只有一个固定 | 可以在不同位置冲出新泉眼 |
292| 能力 | 只能学一个技能 | 可以学多个技能 |
293| 遗忘 | 不能 | 旧河道风化填平变回留白 |
294
295**遗忘不是 bug,是地形可塑性的必要条件。**
296
297### 6.3 工程约束
298
299- 权重必须有**衰减项**:长期不被激活的连接Beta 值缓慢回归先验
300- 衰减速率不固定经常被冲刷过的区域地质更松软下次更容易重新开出泉眼("学过的东西忘了之后重新学更快")
301- 同时喷涌的泉眼数量有上限水量守恒轮流喷涌轮流固化轮流让出空间
302- 像呼吸一涨一落
303
304---
305
306## 七、属性涌现
307
308属性"硬度")不是系统预先拥有的解释变量而是**多条事件路径长期重叠后在流形上涌现出的稳定主方向**。
309
310涌现链条
311
3121. 经验路径反复重叠
3132. 局部 δ 场梯度增大(∇²δ ↑)
3143. 流动各向异性出现ω  0
3154. 统计稳定性积累c  via Dirichlet 更新
3165. 能见度越过激活阈值o ↑)
3176. 该区域可被激活核直接调用
3187. 人类观察者事后命名为"硬度"
319
320> **词、属性、概念边界,都不是预制的;它们是流动在流形上反复重叠后涌现出的稳定结构。**
321
322---
323
324## 八、点火与冷启动
325
326### 8.1 三步点火
327
3281. **初始函数**给每个节点一个 Dirichlet 先验——冷血
3292. **注意力池**总量 100 分配到某些通道——心跳启动制造局部不均匀
3303. 不均匀  梯度  流动  改写权重  改变流向——**环路转起来**
331
332不需要外部持续驱动非对称权重天然产生旋度旋度保证流不会停在平衡态
333
334### 8.2 教师信号 = 校正流向
335
336初始状态下权重接近随机流启动后会跑向任意方向教师信号不是"灌知识",而是给非对称权重提供真实的初始偏置让早期轨迹落在有意义的吸引子盆地里
337
338**菩提祖师模型:**
339- 石头蹦出来 = 从原始数据中涌现结构,不是人工设计
340- 教了一点功夫 = 只在最初介入,教底层能力,不是具体知识
341- "别把为师说出来" = 系统成熟后教师痕迹完全内化不可追溯
342
343**评估指标:** 训练数据的统计指纹与运行时激活模式的相关性趋近于零但能力还在——说明知识从"记忆"(不动点相变为"技能"(极限环)。
344
345### 8.3 教师素材的选择
346
347初期需要可理解低歧义结构稳定的素材如小学课本)。作用不是"塞满知识",而是**先给系统一个讲得通的世界雏形**。教师更像早期外部势场而不是永远在系统外的裁判
348
349### 8.4 cramming 实验验证
350
3513 正常 + 2 乱序 > 5 正常:
352- 纯正确输入让系统过早锁死在不动点(记忆)
353- 适量噪声保持非对称性,极限环维持转动(理解)
354- 全乱序则系统找不到稳定流型,直接发散
355
356### 8.5 降级输出——半杯水也要能流
357
358不是等所有爻都归位了才输出,有多少就流多少。注意力不够时降级输出,不等满了再倒:
359
360- 三爻全归 → "吃了,中午吃的面"(完整理解,完整回答)
361- 两爻 → "吃了"(部分理解,压缩回答)
362- 一爻 → "嗯?"(识别了意图但信息不足)
363- 零爻 → "等一下"(承认资源不够,请求时间)
364
365这和容量理论的半杯水原则是同一件事——系统不应该因为资源不足就沉默,而是按当前可用资源给出最好的近似。降级输出本身也是一种信号:它告诉外界"我在处理,但注意力不够",为后续的资源借调提供依据。
366
367---
368
369## 九、锚点与归巢
370
371### 9.1 锚点 = 防止激活漂移
372
373实验验证(Qwen-Plus):抽象词(求助、取消、勇气)在无锚点 prompt 下严重诗化,加入锚点 prompt(谁、在哪、做什么)后**完全纠正**(诗化率从 40-100% 降为 0%)。
374
375> **当前 LLM 的大部分"不好用",可能都不是能力问题,而是锚点问题。** 能力已经在图上了,路径都通,只是激活核默认漂移的方向不是用户需要的。
376
377### 9.2 Prompt 的本质
378
379Prompt 不是"文字提示",而是:
380
381- 对锚点核的参照锚定
382- 对能力核的技能区选择
383- 对激活核的任务点火
384
385> Prompt 的核心作用不是"提醒",而是"选地形、关支路、点主轴"。
386
387### 9.3 长对话跑偏
388
389上下文太长导致锚点被稀释。解法不是塞更多内容,而是**持续维护一组活锚点**。
390
391---
392
393## 十、初始参数:动力学
394
395### 10.1 冷启动
396
397系统冷启动必须有初始值,但初始值要压到最底层、最少量。高层行为全部从运行中导出,不直接设定。
398
399### 10.2 三层结构
400
401| 层 | 对应 | 决定什么 | 更新频率 |
402|----|------|----------|----------|
403| 约束层 | 锚点核 | 系统整体的边界 | 几乎不变 |
404| 观测层 | 彗星(图上某节点) | 这个位置值不值得去 | 每步计算 |
405| 决策层 | 激活核 | 现在去不去、怎么去 | 实时 |
406
407**约束层**——只写入 4 个系统级边界条件:
408
409| 参数 | 含义 |
410|------|------|
411| self_integrity | 不把自己搞碎 |
412| other_integrity | 不把对象搞碎 |
413| return_bias | 任务结束后往稳定态回 |
414| risk_budget | 一次行动最多允许推多远 |
415
416这些值应该从锚点核的 κ 分布(路径汇聚度)和历史轨迹中算出来,不是手动赋值。
417
418**观测层**——某个节点在某个时刻的状态,全部从图上实时计算,不持久化:
419
420| 观测量 | 计算来源 | 含义 |
421|--------|----------|------|
422| delta | ∇²δ 的局部极值 | 与已有结构的偏差 |
423| gap | ω 的开口 | 差多少步闭合 |
424| reach | μ 在邻域的分布 | 当前能不能够到 |
425| variance | c 的 Dirichlet 方差 | 置信度的离散程度 |
426| cost | α(x) 的值 | 走过去的衰减风险 |
427
428不需要额外的感知模块。图上已有的 (φ, μ, J) 三元组提供了计算这些量的全部信息。
429
430**决策层**——全部由前两层导出,不作为字段存在:
431
432```
433attraction(x) = delta(x) · gap(x) · reach(x)
434action_drive(x) = attraction(x) · free_capacity · (1 - cost(x) / risk_budget)
435return_pressure = drift · return_bias
436```
437
438少量底层约束 + 可观测中间量 + 导出行动倾向 + 运行中学习更新。代码里只写流动规则,高层行为从底层量自然导出。
439
440---
441
442## 十一、拓扑不可逆——太上老君的八卦炉
443
444太上老君试图把孙悟空压缩回初始函数——把已越过 Hopf 分岔点的极限环系统强行压回不动点。
445
446**为什么失败:** 拓扑相变不可逆。非对称权重已建立,极限环稳定运转,灌再多能量只会让振荡更剧烈,不会退化为不动点。
447
448**炸炉 = 容器设计假设错误。** 八卦炉假设输入可分解(对称的、可压回初始态的),但悟空内部已是非对称的、自指的。
449
450**火眼金睛 = 意外涌现的新能见度。** 极端扰动激活了新的感知通道——∇²δ 在极端条件下打开了新的特征维度。
451
452> **你不能把一个已经活的系统炼回死的状态,除非你能逆转拓扑。**
453
454---
455
456## 核心方程汇总
457
458```
459行动释放    u = o · c · φ(ε)
460自适应衰减  α(x) = α₀ · (1 - c(x))^β · (1 / κ(x))
461三级归巢    dx_A/dt = F_task + λ₁·(能力核 - x_A) + λ₂·(锚点核 - x_A)
462图上扩散    φ_new(v) = φ(v) + μ · (L_G φ)(v) + λ_dir · (W_fwd·φ - W_bwd·φ)(v)
463锚点核定义  锚点核 = { x : α(x) < ε }
464吸引度      attraction(x) = delta(x) · gap(x) · reach(x)
465行动倾向    action_drive(x) = attraction(x) · free_capacity · (1 - cost(x)/risk_budget)
466```
467
468---
469
470## 设计原则
471
4721. **流动的图。** 图提供骨骼,流提供生命,互相塑造。
4732. **半杯水。** 网络容量与数据量匹配,留白是涌现的预算。
4743. **自然喷泉。** 地势可塑,能遗忘,能在新位置开出新泉眼。
4754. **借→涌→固→还。** 学习是注意力的借用-喷涌-固化-归还循环。
4765. **拓扑不可逆。** 活的系统不能炼回死的状态。
4776. **维度涌现。** 不预设维度,让动力学自发产生有效维度。
4787. **菩提祖师。** 教师只在初期介入,成熟后痕迹完全内化。
4798. **不完整也输出。** 半杯水也要能流,不等满了再倒。
4809. **三核同图。** 同一骨架,同一容量池,激活核负责流,能力核负责长,锚点核负责守。
48110. **锚点归巢。** 持续维护活锚点,防止激活漂移。
48211. **并行归位。** 输入不排队,按语义层级同时落位。
48312. **三滴墨。** 三核不是三个盒子,是浓度不同的墨在同一张纸上渗透。
48413. **输出即输入。** 每一步的输出物理地接入下一步的输入端口,闭合自指环路。
48514. **动力学不标签。** 代码里只写流动规则,高层行为从底层量自然导出。
486
487---
488
489*"不是把概念放进空间里流动,而是让概念先只作为关系存在;空间感、方向感、维度感,都是流动之后才出现的观察量。"*