一、演进路线
知识图谱不是一次性产物,是持续生长的研究基础设施。
V0
Research Articles
V1
Knowledge Tree
V2
Knowledge Graph
V3
Research Engine
V4
Civilization Simulator
V1 → V2 的关键变化: 从"分类树"(一个节点只能有一个父节点)到"知识图"(一个节点可属于多个领域,跨域连接显式化)。
二、Graph Health Metrics
图谱的价值来自连接,不来自节点数量。
22
节点数 Nodes
16
边数 Edges
0.73
平均连接度
86%
证据覆盖率
4
跨域连接数
4
层数 Depth
3
冲突路径
9%
孤立节点
指标优先级: 证据覆盖率 (P0) > 边密度 (P1) > 孤立节点比例 (P1) > 跨域连接数 (P2) > 冲突路径数 (P2) > 图谱深度 (P3)
三、Graph 结构(跨域互联)
不再是树形分类,而是多层有向图——每个节点可连接多个父节点,跨域关系显式可见。
四、Evidence Overlay(证据来源叠层)
每个节点的置信度来自证据组成。不是"0.61"这个数字本身,而是"为什么是0.61"。
边界感原则: 用户需要知道为什么是0.61,不是只有0.61。
证据叠层让"分析边界"从口号变成可视化产品。
五、Contradiction Graph(冲突路径)
飞轮存在,但冲突不可见 = 飞轮不透明。V2 显式展示 SUPPORTS / CONTRADICTS / UNCERTAIN 关系。
冲突 1:夏代是否存在
二里头遗址A级考古
↗ SUPPORTS
夏代存在0.68
↗ CONTRADICTS
无夏代文字A级证据
冲突 2:启立世袭 vs 禅让传统
禅让传统(尧→舜→禹)B级文献
↘ CONTRADICTS
启立世袭+杀益B级文献
↗ SUPPORTS
权力来源断裂0.67
冲突 3:墨家是学派还是工匠行会
传统史学(哲学学派)B级文献
↘ CONTRADICTS
工匠传承(技术行会)C级推断
→ UNCERTAIN
墨家定位待判定
六、关键节点详情
N303 WAGI
L4 · Civilization OS · 置信度 0.90
认知基础设施。PAMOS身体+WAGI大脑+水木训练场。三元合一架构。
连接:Memory Routing (0.88), 飞轮 (0.90), Mythos (0.72)
N206 Memory Routing
L3 · Cognition · 置信度 0.81
信息压缩与检索。类脑分层记忆(L0-L5)。与墨家知识网络跨域同构。
连接:墨经 (0.53), WAGI (0.88), 工艺传播 (0.71)
N101 Supply Chain
L2 · Technology · 置信度 0.78
禹的完整链条:锡路→冶炼→青铜工具→交通→治水。共工vs蚩尤。
连接:大禹 (0.45), 资源调度 (0.78), 协作网络 (0.72)
N005 青铜技术
L1 · Evidence · 置信度 0.84
温度阶梯600→1000→1100°C。能源=温度=权力。考古证据最强。
连接:陶器 (0.82), 冶金 (0.84), 分工体系 (0.67)
七、动态权重更新
图谱是活的。新证据 → 边权重变化 → 模型变化 → 新预测 → 验证。
更新公式:
edge_weight(t+1) = edge_weight(t) + evidence_gain − contradiction
示例:新考古发现如何更新图谱
假设发现夏代文字遗址(A级证据):
evidence-update
// 新证据输入
EVIDENCE E009 {
level: "A",
source: "夏代文字遗址",
score: 0.95
}
// 自动更新
Node Xia.confidence = 0.68 + 0.95 × 0.35 = 0.68 + 0.33 = 1.01 → 1.0
Edge Xia -> Bronze.confidence += 0.15
Edge Bronze -> Metallurgy.confidence += 0.08
// 级联效应:相关路径置信度全部提升
EVIDENCE E009 {
level: "A",
source: "夏代文字遗址",
score: 0.95
}
// 自动更新
Node Xia.confidence = 0.68 + 0.95 × 0.35 = 0.68 + 0.33 = 1.01 → 1.0
Edge Xia -> Bronze.confidence += 0.15
Edge Bronze -> Metallurgy.confidence += 0.08
// 级联效应:相关路径置信度全部提升
八、DSL 映射(从网页到可运行系统)
图谱的终极形态是网页 → Graph JSON → DSL → API → Simulation。
网页展示
→
Graph JSON
→
DSL 解析
→
Graph API
→
Simulation
DSL 输出示例
graph-dsl-output
NODE Bronze {
type: "Technology",
confidence: 0.84,
evidence_mix: {"arch": 0.65, "text": 0.20, "infer": 0.10, "myth": 0.05}
}
EDGE Bronze -> Organization {
relation: "ENABLES",
weight: 0.77,
confidence: 0.76
}
CONTRADICTION C001 {
node_a: "夏代存在",
relation: "CONTRADICTS",
node_b: "无夏代文字",
status: "RESOLVED"
}
type: "Technology",
confidence: 0.84,
evidence_mix: {"arch": 0.65, "text": 0.20, "infer": 0.10, "myth": 0.05}
}
EDGE Bronze -> Organization {
relation: "ENABLES",
weight: 0.77,
confidence: 0.76
}
CONTRADICTION C001 {
node_a: "夏代存在",
relation: "CONTRADICTS",
node_b: "无夏代文字",
status: "RESOLVED"
}
九、核心资产:研究过程数据
文章能复制,但图结构、边权更新、冲突记录、残差演化——这些才是不可复制的核心资产。
可复制的: 研究报告、HTML页面、文字内容
不可复制的:
- 图结构 — 节点之间的连接关系和权重
- 边权演化 — 从0.3→0.8的历史轨迹(记录了研究迭代过程)
- 冲突记录 — 哪些假设被证伪,哪些被确认
- 残差分析 — 模型预测 vs 现实观察的差距演化
V2 的核心不是证明结论,
而是管理不确定性。
图谱的边界感,
就是研究的可信度。
而是管理不确定性。
图谱的边界感,
就是研究的可信度。