飞轮 V6 规范

L5 FeedbackManager + L6 MetaLearner — 反Mirage机制 + 真实市场回测 + 技术收敛信号追踪

飞轮V6 | 基于MIRAGE论文启发 | 2026-06-09

🔄 V5 → V6 的核心变化

从"评分飞轮"到"市场飞轮"

V5的飞轮是一个闭环推理引擎:青龙→朱雀→谛听→白虎→玄武。输出是评分+等级+收敛度。

V6在此基础上增加了两个外部回路:L5 FeedbackManager(市场结果反馈)L6 MetaLearner(飞轮自我修正)。飞轮不再只是"分析得对不对",而是"预测赚不赚钱"。

维度 V5 V6
核心输出 评分/等级/收敛度 评分 + 市场验证结果 + 置信度分解
验证方式 五维对抗收敛 对抗收敛 + 真实市场回测(模拟交易)
数据完整性 假设输入完整 SensorManager输入校验 + Mirage检测
置信度 单一数值 双置信度(证据-based vs 先验-based)
自我修正 L6 MetaLearner跟踪预测准确率,自动调整权重
技术收敛 追踪五条技术收敛线的市场定价阶段

🔬 反Mirage机制(L5核心)

灵感来源:Stanford/Fei-Fei Li团队 MIRAGE论文(2026-03)——多模态模型在没有图片的情况下仍保持70-80%准确率,且"幻觉推理"得分高于"诚实猜测"。

这直接映射到飞轮的评分问题:0.82-0.86的评分聚类,是否也可能是"没有真实数据支撑的幻觉高分"?

三大反Mirage机制

1. B-Clean 数据剥离测试

飞轮收敛后,逐一移除各维度数据,检查结论是否仍成立

如果移除某维度数据后结论不变 → 该维度是"装饰性数据",评分应下调。

如果移除后结论崩溃 → 该维度是关键支撑,评分维持。

强制规则:至少保留2个独立维度才能给B级以上

2. SensorManager 输入完整性校验

每个输入信号必须标注来源类型

  • EVIDENCE:直接观测数据(API、传感器、财报)
  • INFERRED:从其他数据推导(如从GDP推导需求)
  • ASSUMED:假设/推测(如政策预期)

缺失信号必须产生⚠️警告,不能默认为"正常+继续推理"

3. 双置信度分解

每次评分输出两个置信度:

  • 证据置信度(加分项):有多少数据直接支撑结论
  • 先验置信度(扣分项):有多少结论来自模型先验而非数据

最终置信度 = 证据置信度 - 先验置信度

MIRAGE发现"幻觉推理得分高于诚实猜测"——双置信度就是为了捕捉这个gap。

📊 L5 FeedbackManager — 市场反馈回路

核心设计:从"评分"到"P&L"

L5的核心任务:把飞轮评分转化为可验证的交易信号,然后用市场结果验证评分准确性。

L5 工作流程

阶段 输入 处理 输出
① 信号提取 飞轮收敛评分 评分→交易信号映射(A/B→做多,D/E→做空,C→中性) 交易信号 + 仓位建议
② 模拟交易 交易信号 在模拟环境中执行(历史回测 / 实时模拟) P&L记录 + 胜率 + 最大回撤
③ 结果验证 P&L记录 对比评分预期与实际结果 验证准确率 + 偏差分析
④ 反馈注入 验证结果 注入L6 MetaLearner 飞轮参数自动调整

镁合金验证案例(P0优先)

3个月模拟交易实验设计

参数
标的 镁合金产业链(云海金属/宝钛股份/西部材料)
起始资金 虚拟100万
交易规则 飞轮评分≥B级且证据置信度≥0.6 → 开仓
仓位 A级20%,B级10%,C级5%
止损 -8%强制平仓
止盈 +15%减仓50%,剩余跟踪止盈
评估指标 胜率、夏普比率、最大回撤、年化收益

Go/No-Go标准:3个月后,胜率>55%且夏普比率>0.5 → 飞轮评分系统通过验证。否则需要调整。

🧠 L6 MetaLearner — 飞轮自我修正

"飞轮分析飞轮"

L6不是另一个Agent,而是飞轮的元认知层。它监控飞轮自身的预测准确率、偏差模式、权重漂移,自动调整飞轮参数。

L6 核心模块

1. 预测准确率追踪

记录每次飞轮分析后的市场实际走势,计算:

  • 方向准确率(涨/跌/横盘是否预测正确)
  • 幅度误差(预测涨跌幅 vs 实际涨跌幅)
  • 时间误差(预测时间窗口 vs 实际发生时间)

2. 偏差模式识别

识别飞轮的系统性偏差:

  • 过度乐观/悲观倾向
  • 对特定行业/材料的评分偏移
  • 白虎攻击是否过度/不足
  • 谛听是否低估了某些维度的权重

3. 权重自适应

基于L5的验证结果,自动调整:

  • 五元素权重(青龙/朱雀/谛听/白虎/玄武)
  • PMEORT六维权重
  • 评分阈值(A/B/C/D/E的cut-off)

限制:单次调整幅度≤5%,防止过拟合

4. 知识树更新

飞轮分析积累的认知偏差和修正经验,自动更新到knowledge-tree.html。这是飞轮的长期记忆。

📡 技术收敛信号追踪

2026-06-04讨论的"五条收敛线"——Voice AI + Odysseus本地工作站 + AI Agent + OCMA协议 + Claude Mythos零日能力——需要一个追踪机制。

收敛线 当前阶段 市场定价 飞轮信号
Voice AI 成熟期(Whisper/Conformer可用) 已定价(Nuance等股价反映) ✅ 数据管道已就绪
Odysseus本地工作站 成长期(RTX 5080 16GB已普及) 部分定价(NVIDIA股价反映) ⚠️ 需监控端侧AI芯片进展
AI Agent 爆发期(2026年代理型AI元年) 未充分定价(市场尚未区分工具型vs代理型) ✅ 飞轮本身就是代理型AI架构
OCMA协议 预研期 未定价 ⚠️ 需持续跟踪协议标准化进展
Claude Mythos零日能力 早期探索 未定价 ⚠️ 高风险/高回报信号

收敛信号的意义

五条线同时收敛 = 奇点时刻的前兆。但真正的奇点标志不是"AI能做什么",而是"AI在没有人类提示的情况下发现新场景"

L6 MetaLearner的一项关键任务:记录飞轮自身是否产生了"人类未曾预设的分析维度"。如果有,那就是真正的能力跃迁信号。

🏗️ V6 完整架构

六层架构

L1 PMEORT现实层 → 六维约束空间的实时数据

L2 势能场层 → 机会势场计算(Score = G^α·A^β·R^γ·C^(-δ))

L3 OK调度层 → 机会资源分配(softmax资源调度)

L4 飞轮执行层 → 青龙→朱雀→谛听→白虎→玄武五维对抗

L5 FeedbackManager → 市场验证 + 反Mirage + 双置信度

L6 MetaLearner → 权重自适应 + 偏差修正 + 知识树更新

层级 核心功能 输入 输出
L1 约束感知 传感器/API/财报/政策 六维约束向量
L2 势场计算 约束向量 机会评分
L3 资源调度 机会评分队列 优先级排序
L4 对抗收敛 高优先级机会 评分/等级/收敛度
L5 市场验证 L4评分 + 市场数据 P&L + 验证准确率 + 反Mirage报告
L6 元学习 L5验证结果 权重调整 + 偏差报告 + 知识树更新

🎯 执行优先级

P0 — 今天完成

  • ✅ V6规范文档(本页)
  • ⏳ 镁合金模拟交易实验启动
  • ⏳ SensorManager信号标注规范v1

P1 — 本周完成

  • 双置信度评分算法实现
  • B-Clean数据剥离测试脚本
  • 镁合金先行指标数据库(小元)

P2 — 本月完成

  • L6 MetaLearner最小可用版本
  • 技术收敛信号追踪面板
  • CFRP深度分析页升级(Etern)

💭 V6的哲学

评分不是目的,验证才是

V5的飞轮问的是:"这个分析的逻辑是否自洽?"

V6的飞轮问的是:"这个分析的预测是否被市场验证了?"

Robin在6月4日说的——"外部验证(市场预测准确率)是唯一可验证的标准。"

MIRAGE论文证实了——"没有ground truth的评估系统,连幻觉和真相都分不清。"

V6就是飞轮从"自洽"走向"真实"的一步。