SkyCetus 知识图谱 V2

一、演进路线

知识图谱不是一次性产物，是持续生长的研究基础设施。

Research Articles

Knowledge Tree

Knowledge Graph

Research Engine

Civilization Simulator

V1 → V2 的关键变化： 从"分类树"（一个节点只能有一个父节点）到"知识图"（一个节点可属于多个领域，跨域连接显式化）。

二、Graph Health Metrics

图谱的价值来自连接，不来自节点数量。

节点数 Nodes

边数 Edges

0.73

平均连接度

86%

证据覆盖率

跨域连接数

层数 Depth

冲突路径

孤立节点

指标优先级： 证据覆盖率 (P0) > 边密度 (P1) > 孤立节点比例 (P1) > 跨域连接数 (P2) > 冲突路径数 (P2) > 图谱深度 (P3)

三、Graph 结构（跨域互联）

不再是树形分类，而是多层有向图——每个节点可连接多个父节点，跨域关系显式可见。

四、Evidence Overlay（证据来源叠层）

每个节点的置信度来自证据组成。不是"0.61"这个数字本身，而是"为什么是0.61"。

N001 大禹治水 — 置信度 0.61

考古45%

文献30%

推断20%

神话映射5%

N003 夏代证据 — 置信度 0.68

考古55%

文献25%

推断15%

神话映射5%

N005 青铜技术 — 置信度 0.84

考古65%

文献20%

推断10%

神话映射5%

N201 墨家谱系 — 置信度 0.53

考古15%

文献40%

推断35%

神话映射10%

边界感原则： 用户需要知道为什么是0.61，不是只有0.61。

证据叠层让"分析边界"从口号变成可视化产品。

五、Contradiction Graph（冲突路径）

飞轮存在，但冲突不可见 = 飞轮不透明。V2 显式展示 SUPPORTS / CONTRADICTS / UNCERTAIN 关系。

冲突 1：夏代是否存在

二里头遗址A级考古

↗ SUPPORTS

夏代存在0.68

↗ CONTRADICTS

无夏代文字A级证据

冲突 2：启立世袭 vs 禅让传统

禅让传统（尧→舜→禹）B级文献

↘ CONTRADICTS

启立世袭+杀益B级文献

↗ SUPPORTS

权力来源断裂0.67

冲突 3：墨家是学派还是工匠行会

传统史学（哲学学派）B级文献

↘ CONTRADICTS

工匠传承（技术行会）C级推断

→ UNCERTAIN

墨家定位待判定

六、关键节点详情

N303 WAGI

L4 · Civilization OS · 置信度 0.90

认知基础设施。PAMOS身体+WAGI大脑+水木训练场。三元合一架构。

连接：Memory Routing (0.88), 飞轮 (0.90), Mythos (0.72)

N206 Memory Routing

L3 · Cognition · 置信度 0.81

信息压缩与检索。类脑分层记忆（L0-L5）。与墨家知识网络跨域同构。

连接：墨经 (0.53), WAGI (0.88), 工艺传播 (0.71)

N101 Supply Chain

L2 · Technology · 置信度 0.78

禹的完整链条：锡路→冶炼→青铜工具→交通→治水。共工vs蚩尤。

连接：大禹 (0.45), 资源调度 (0.78), 协作网络 (0.72)

N005 青铜技术

L1 · Evidence · 置信度 0.84

温度阶梯600→1000→1100°C。能源=温度=权力。考古证据最强。

连接：陶器 (0.82), 冶金 (0.84), 分工体系 (0.67)

七、动态权重更新

图谱是活的。新证据 → 边权重变化 → 模型变化 → 新预测 → 验证。

更新公式：

edge_weight(t+1) = edge_weight(t) + evidence_gain − contradiction

示例：新考古发现如何更新图谱

假设发现夏代文字遗址（A级证据）：

evidence-update

// 新证据输入
EVIDENCE E009 {
  level: "A",
  source: "夏代文字遗址",
  score: 0.95
}

// 自动更新
Node Xia.confidence = 0.68 + 0.95 × 0.35 = 0.68 + 0.33 = 1.01 → 1.0
Edge Xia -> Bronze.confidence += 0.15
Edge Bronze -> Metallurgy.confidence += 0.08

// 级联效应：相关路径置信度全部提升

八、DSL 映射（从网页到可运行系统）

图谱的终极形态是网页 → Graph JSON → DSL → API → Simulation。

网页展示

→

Graph JSON

→

DSL 解析

→

Graph API

→

Simulation

DSL 输出示例

graph-dsl-output

NODE Bronze {
  type: "Technology",
  confidence: 0.84,
  evidence_mix: {"arch": 0.65, "text": 0.20, "infer": 0.10, "myth": 0.05}
}

EDGE Bronze -> Organization {
  relation: "ENABLES",
  weight: 0.77,
  confidence: 0.76
}

CONTRADICTION C001 {
  node_a: "夏代存在",
  relation: "CONTRADICTS",
  node_b: "无夏代文字",
  status: "RESOLVED"
}

九、核心资产：研究过程数据

文章能复制，但图结构、边权更新、冲突记录、残差演化——这些才是不可复制的核心资产。

可复制的： 研究报告、HTML页面、文字内容

不可复制的：

图结构 — 节点之间的连接关系和权重
边权演化 — 从0.3→0.8的历史轨迹（记录了研究迭代过程）
冲突记录 — 哪些假设被证伪，哪些被确认
残差分析 — 模型预测 vs 现实观察的差距演化

V2 的核心不是证明结论，
而是管理不确定性。

图谱的边界感，
就是研究的可信度。