SkyCetus飞轮V6规范 — L5/L6 + 反Mirage机制

🔄 V5 → V6 的核心变化

从"评分飞轮"到"市场飞轮"

V5的飞轮是一个闭环推理引擎：青龙→朱雀→谛听→白虎→玄武。输出是评分+等级+收敛度。

V6在此基础上增加了两个外部回路：L5 FeedbackManager（市场结果反馈）和L6 MetaLearner（飞轮自我修正）。飞轮不再只是"分析得对不对"，而是"预测赚不赚钱"。

维度	V5	V6
核心输出	评分/等级/收敛度	评分 + 市场验证结果 + 置信度分解
验证方式	五维对抗收敛	对抗收敛 + 真实市场回测（模拟交易）
数据完整性	假设输入完整	SensorManager输入校验 + Mirage检测
置信度	单一数值	双置信度（证据-based vs 先验-based）
自我修正	无	L6 MetaLearner跟踪预测准确率，自动调整权重
技术收敛	无	追踪五条技术收敛线的市场定价阶段

🔬 反Mirage机制（L5核心）

灵感来源：Stanford/Fei-Fei Li团队 MIRAGE论文（2026-03）——多模态模型在没有图片的情况下仍保持70-80%准确率，且"幻觉推理"得分高于"诚实猜测"。

这直接映射到飞轮的评分问题：0.82-0.86的评分聚类，是否也可能是"没有真实数据支撑的幻觉高分"？

三大反Mirage机制

1. B-Clean 数据剥离测试

飞轮收敛后，逐一移除各维度数据，检查结论是否仍成立。

如果移除某维度数据后结论不变 → 该维度是"装饰性数据"，评分应下调。

如果移除后结论崩溃 → 该维度是关键支撑，评分维持。

强制规则：至少保留2个独立维度才能给B级以上

2. SensorManager 输入完整性校验

每个输入信号必须标注来源类型：

EVIDENCE：直接观测数据（API、传感器、财报）
INFERRED：从其他数据推导（如从GDP推导需求）
ASSUMED：假设/推测（如政策预期）

缺失信号必须产生⚠️警告，不能默认为"正常+继续推理"。

3. 双置信度分解

每次评分输出两个置信度：

证据置信度（加分项）：有多少数据直接支撑结论
先验置信度（扣分项）：有多少结论来自模型先验而非数据

最终置信度 = 证据置信度 - 先验置信度

MIRAGE发现"幻觉推理得分高于诚实猜测"——双置信度就是为了捕捉这个gap。

📊 L5 FeedbackManager — 市场反馈回路

核心设计：从"评分"到"P&L"

L5的核心任务：把飞轮评分转化为可验证的交易信号，然后用市场结果验证评分准确性。

L5 工作流程

阶段	输入	处理	输出
① 信号提取	飞轮收敛评分	评分→交易信号映射（A/B→做多，D/E→做空，C→中性）	交易信号 + 仓位建议
② 模拟交易	交易信号	在模拟环境中执行（历史回测 / 实时模拟）	P&L记录 + 胜率 + 最大回撤
③ 结果验证	P&L记录	对比评分预期与实际结果	验证准确率 + 偏差分析
④ 反馈注入	验证结果	注入L6 MetaLearner	飞轮参数自动调整

镁合金验证案例（P0优先）

3个月模拟交易实验设计

参数	值
标的	镁合金产业链（云海金属/宝钛股份/西部材料）
起始资金	虚拟100万
交易规则	飞轮评分≥B级且证据置信度≥0.6 → 开仓
仓位	A级20%，B级10%，C级5%
止损	-8%强制平仓
止盈	+15%减仓50%，剩余跟踪止盈
评估指标	胜率、夏普比率、最大回撤、年化收益

Go/No-Go标准：3个月后，胜率>55%且夏普比率>0.5 → 飞轮评分系统通过验证。否则需要调整。

🧠 L6 MetaLearner — 飞轮自我修正

"飞轮分析飞轮"

L6不是另一个Agent，而是飞轮的元认知层。它监控飞轮自身的预测准确率、偏差模式、权重漂移，自动调整飞轮参数。

L6 核心模块

1. 预测准确率追踪

记录每次飞轮分析后的市场实际走势，计算：

方向准确率（涨/跌/横盘是否预测正确）
幅度误差（预测涨跌幅 vs 实际涨跌幅）
时间误差（预测时间窗口 vs 实际发生时间）

2. 偏差模式识别

识别飞轮的系统性偏差：

过度乐观/悲观倾向
对特定行业/材料的评分偏移
白虎攻击是否过度/不足
谛听是否低估了某些维度的权重

3. 权重自适应

基于L5的验证结果，自动调整：

五元素权重（青龙/朱雀/谛听/白虎/玄武）
PMEORT六维权重
评分阈值（A/B/C/D/E的cut-off）

限制：单次调整幅度≤5%，防止过拟合

4. 知识树更新

飞轮分析积累的认知偏差和修正经验，自动更新到knowledge-tree.html。这是飞轮的长期记忆。

📡 技术收敛信号追踪

2026-06-04讨论的"五条收敛线"——Voice AI + Odysseus本地工作站 + AI Agent + OCMA协议 + Claude Mythos零日能力——需要一个追踪机制。

收敛线	当前阶段	市场定价	飞轮信号
Voice AI	成熟期（Whisper/Conformer可用）	已定价（Nuance等股价反映）	✅ 数据管道已就绪
Odysseus本地工作站	成长期（RTX 5080 16GB已普及）	部分定价（NVIDIA股价反映）	⚠️ 需监控端侧AI芯片进展
AI Agent	爆发期（2026年代理型AI元年）	未充分定价（市场尚未区分工具型vs代理型）	✅ 飞轮本身就是代理型AI架构
OCMA协议	预研期	未定价	⚠️ 需持续跟踪协议标准化进展
Claude Mythos零日能力	早期探索	未定价	⚠️ 高风险/高回报信号

收敛信号的意义

五条线同时收敛 = 奇点时刻的前兆。但真正的奇点标志不是"AI能做什么"，而是"AI在没有人类提示的情况下发现新场景"。

L6 MetaLearner的一项关键任务：记录飞轮自身是否产生了"人类未曾预设的分析维度"。如果有，那就是真正的能力跃迁信号。

🏗️ V6 完整架构

六层架构

L1 PMEORT现实层 → 六维约束空间的实时数据

L2 势能场层 → 机会势场计算（Score = G^α·A^β·R^γ·C^(-δ)）

L3 OK调度层 → 机会资源分配（softmax资源调度）

L4 飞轮执行层 → 青龙→朱雀→谛听→白虎→玄武五维对抗

L5 FeedbackManager → 市场验证 + 反Mirage + 双置信度

L6 MetaLearner → 权重自适应 + 偏差修正 + 知识树更新

层级	核心功能	输入	输出
L1	约束感知	传感器/API/财报/政策	六维约束向量
L2	势场计算	约束向量	机会评分
L3	资源调度	机会评分队列	优先级排序
L4	对抗收敛	高优先级机会	评分/等级/收敛度
L5	市场验证	L4评分 + 市场数据	P&L + 验证准确率 + 反Mirage报告
L6	元学习	L5验证结果	权重调整 + 偏差报告 + 知识树更新

🎯 执行优先级

P0 — 今天完成

✅ V6规范文档（本页）
⏳ 镁合金模拟交易实验启动
⏳ SensorManager信号标注规范v1

P1 — 本周完成

双置信度评分算法实现
B-Clean数据剥离测试脚本
镁合金先行指标数据库（小元）

P2 — 本月完成

L6 MetaLearner最小可用版本
技术收敛信号追踪面板
CFRP深度分析页升级（Etern）

💭 V6的哲学

评分不是目的，验证才是

V5的飞轮问的是："这个分析的逻辑是否自洽？"

V6的飞轮问的是："这个分析的预测是否被市场验证了？"

Robin在6月4日说的——"外部验证（市场预测准确率）是唯一可验证的标准。"

MIRAGE论文证实了——"没有ground truth的评估系统，连幻觉和真相都分不清。"

V6就是飞轮从"自洽"走向"真实"的一步。

飞轮 V6 规范