涉密行业认知闭环
当公开信息不足、样本量不足时
如何形成行业分析闭环?
以军工与航空航天行业为例
四象飞轮在信息最匮乏的场景下的方法论
公开数据占比<20%
提升置信度倍数
样本量极小
核心困境:为什么传统方法在涉密行业失效
- 信息黑洞。军工和航天的核心数据 —— 订单量、交付进度、技术参数、研发方向 —— 绝大部分属于国家秘密。上市公司年报中军品收入往往只有一个笼统数字,不披露具体产品、客户和价格。你看到的是冰山水面上的5%。
- 样本量陷阱。中国核心军工集团只有12家(十大军工+中国电科+中国电子),上市军工企业约70家但真正涉及核心型号的不超过30家。统计学上,n<30意味着几乎所有大样本方法都不适用。
- 信息刻意混淆。涉密行业的信息不仅"不足",而且可能被刻意模糊甚至误导。公开展示的装备参数可能是降级版本,军贸型号与自用型号差异巨大,论文发表时间远滞后于实际技术突破。
- 时间滞后。军工项目从立项到装备部队通常需要10-15年。当你在珠海航展上看到一架飞机时,它的关键技术决策可能在10年前就已经做出。传统的"跟踪最新信息"策略在这里毫无意义。
- 单一来源依赖风险。依赖少数"知情人"或"泄露信息"做分析,本质上是在单点故障上建立整个认知大厦。一旦信源有误或被策反,整个分析体系崩溃。
传统行业分析的逻辑是:更多数据 → 更好分析。
涉密行业的逻辑必须是:更好的认知结构 → 从更少数据中提取更多信息。
这正是四象飞轮的设计目的。
核心命题:残差即信号
玄武 · 认知收敛涉密行业分析的第一性原理
在信息充分的行业(如消费品、互联网),分析的价值来自于"比别人更快地处理公开信息"。
在涉密行业,分析的价值来自于一个完全不同的来源:对"缺失信息"的结构化推理。
核心洞见:什么信息"应该公开但没有公开",本身就是最有价值的信号。
- 一家军工企业突然停止披露某个业务板块的细分数据 → 该板块可能进入涉密型号阶段
- 某型号在航展上展出后突然消失 → 可能进入批产/列装阶段
- 某研究所大量招聘特定专业人才 → 对应方向可能启动新项目
- 供应链企业的产能扩张与已知型号需求不匹配 → 存在未公开的新型号需求
这就是四象飞轮中"残差"的核心含义:残差 = 现实与模型之间的差异 = 未被解释的信息 = 最有价值的信号。
V = Σ(Si × Cij) × e-λt
Cij = 信号i与信号j的交叉验证系数(独立来源交叉 > 同源交叉)
λ = 时间衰减率(军工约0.1/年,航天约0.15/年)
关键:单一信号价值有限,但多类独立信号的交叉验证可以指数级提升置信度
十二类代理信号源
青龙 · 代理信号采集当直接信息不可得时,必须通过"代理信号"间接推断。以下是军工/航天行业的12类可用公开信号源,按信息价值排序:
四象飞轮方法论 · 涉密行业特化版
核心任务:用12类代理信号替代直接信息,最大化信号源多样性。
- 专利爬虫:定期扫描CNIPA/USPTO中军工院所的新专利
- 供应链图谱:从上市公司年报中提取"前五大客户",反向构建军工供应链网络
- 招聘监控:跟踪航天科技/航天科工/中航工业等集团的招聘方向变化
- 卫星监控:跟踪重点军事设施的活动变化(机场/船厂/发射场)
- 财报异常检测:自动化扫描70家军工上市公司的财务异常值
关键原则:宁可多采、不可遗漏。信号质量在后续环节过滤。
核心任务:将代理信号转化为结构化假设,用情报分析方法验证。
- ACH(竞争假设分析):对每个关键问题生成3-5个竞争假设,用代理信号逐一检验
- 时间线分析:将多源信号按时间排列,识别事件序列和因果链
- 缺口分析:系统性标注"哪些信号应该出现但没有出现",缺失本身即信号
- 类比推理:用已解密的历史型号发展路径,推断当前型号所处阶段
- 贝叶斯更新:每获取一条新信号,用贝叶斯框架更新各假设的概率
关键原则:结论必须标注置信度(0-1),禁止"确定性表述"。
核心任务:主动挑战自己的分析结论,防止确认偏误。
- 红队/蓝队:对每个关键结论设置"魔鬼代言人",专门寻找反面证据
- 欺骗检测:评估信号被刻意误导的可能性(军方可能故意释放假信号)
- 独立来源交叉:同一结论必须有至少2个独立来源的代理信号支持
- 预测-验证循环:对分析结论做出可验证的预测,用后续事件检验
- 盲点扫描:定期审查"我们可能忽略了什么"
关键原则:如果找不到反面证据,不是因为结论正确,而是因为你还没有足够努力地寻找。
核心任务:将分析结论转化为可积累的认知资产,形成长期复利。
- 型号知识图谱:每个军工型号一个节点,关联供应链/专利/人才/时间线
- 历史数据库:所有已解密型号的完整发展路径,作为类比推理的基础
- 残差追踪:持续跟踪"预测与现实的偏差",残差本身是最有价值的学习信号
- 置信度校准:定期回测历史预测的准确率,校准分析师的置信度
- 认知地图更新:每季度更新行业认知地图,标注各领域的认知收敛度和残差率
关键原则:认知价值不在于"知道什么",而在于"知道自己不知道什么"。
案例一:歼-35舰载机的认知闭环构建
朱雀 · 结构化分析如何在零官方确认的情况下构建歼-35的认知图谱
专利信号:沈阳飞机设计研究所(601所)2018-2020年间大量申请与"中型隐身战斗机"相关的专利(进气道设计/内埋弹舱/折叠翼机构)。
供应链信号:中航光电(连接器)、西部超导(钛合金)等供应商2021年后军品收入异常增长,且增长幅度超过已知型号(歼-20/运-20)的产能需求。
招聘信号:601所2019年大量招聘舰载机适配性方向的工程师,且要求"有弹射起飞相关经验"。
卫星信号:沈飞总装厂区2022年后出现新的大型建筑,面积与歼-20总装线相当。
竞争假设:H1=歼-35是FC-31的舰载改型(置信度0.75);H2=全新设计(0.15);H3=国际合作项目(0.10)。
时间线推断:专利集中于2018-2020 → 方案冻结约2020 → 原型机2022-2023 → 首飞2023-2024 → 定型2026-2027。
缺口分析:2022年后沈飞在航展上不再展出FC-31模型 → FC-31已转为军方项目 → 验证H1。
红队挑战:供应链增长可能来自歼-20增产而非新型号 → 但钛合金用量增幅(+40%)远超歼-20产能计划(+15%),差额指向新型号。
外部验证:美国DoD 2023年中国军力报告首次提及"a new carrier-based fighter" → 独立第三方确认。
欺骗检测:FC-31从航展消失可能是商业失败而非军方采购 → 但601所同期招聘方向与舰载机一致 → 排除此假设。
最终判断:歼-35以FC-31为基础的舰载隐身战斗机,置信度0.85。双发中型,弹射起飞兼容,2026-2027年定型。
残差标注:发动机型号不确定(WS-19 vs WS-13E),航电系统细节不确定,生产数量不确定。
知识图谱更新:歼-35节点关联601所+沈飞+中航光电+西部超导+黎明发动机。
注:以上分析完全基于公开信息和结构化推理,不涉及任何涉密信息。分析结论标注了置信度,非确定性判断。
案例二:中国商业航天的认知闭环
青龙 · 产业研究商业航天 —— 半涉密行业的分析特殊性
关键企业:蓝箭航天(朱雀二号/三号)、星际荣耀(双曲线二号)、天兵科技(天龙三号)、星河动力(谷神星一号)、东方空间(引力一号)。
融资数据:商业航天企业的融资轮次和估值是公开的(蓝箭C+轮估值约150亿),反映资本市场对技术成熟度的判断。
发射记录:每次发射是公开事件,成功/失败率可统计。朱雀二号已连续成功,可靠性进入实用阶段。
专利+论文:液氧甲烷发动机相关专利密集出现(2022-2024),确认技术路线已从煤油转向甲烷。
政策信号:2024年政府工作报告首次提出"商业航天",确认为国家战略。
核心问题:中国商业航天何时实现可复用火箭?
ACH:H1=2026-2027年(蓝箭朱雀三号,置信度0.40);H2=2028-2029年(多家竞争,0.35);H3=2030年后(技术延迟,0.25)。
类比推理:SpaceX从Falcon 9首飞到首次回收用了5年(2010-2015)。蓝箭朱雀二号2023年首飞成功,按类比推算可复用版本约2027-2028年。
中国商业航天的资本效率远高于SpaceX早期(人力成本差异+后发优势),可能加速时间线。但中国的试验场地和发射窗口受限(酒泉/文昌排期紧张),可能拖慢迭代速度。
残差:发动机推力数据不完整、可复用着陆技术验证进度不确定、商业载荷需求量不确定。
新旧范式对比
传统范式 · 数据驱动
- 依赖直接数据(财报、调研、访谈)
- 样本量越大越好
- 追求"确定性结论"
- 单一分析框架
- 信息越多 = 分析越好
- 结论是终点
- 分析师经验依赖
在涉密行业几乎完全失效
四象飞轮 · 认知驱动
- 依赖代理信号(专利、供应链、招聘)
- 少量高质量信号 + 多源交叉验证
- 标注置信度,接受不确定性
- 四象并行:发散/执行/对抗/收敛
- 认知结构 > 数据量
- 结论是中间态,持续更新
- 系统化方法论,可复制可积累
专为信息匮乏场景设计
方法论边界 · 诚实面对局限
白虎 · 风险对冲第一性原理 · 超越行业与周期
信息论视角:涉密行业分析的本质
从信息论的角度看,涉密行业分析的本质是一个信道容量受限条件下的信息恢复问题。
Shannon信道容量公式告诉我们:C = B × log2(1 + S/N)。当信道带宽(B,即公开信息量)被人为限制时,提升信息恢复能力只有一条路:提高信噪比(S/N)。
四象飞轮的四个象限恰好对应信噪比提升的四种机制:
- 青龙(多源采集)= 增加独立信道数量。12类代理信号 = 12个独立信道。即使每个信道带宽很小,多信道并行可以恢复更多信息
- 朱雀(结构化分析)= 信号编码优化。用结构化方法(ACH、贝叶斯、时间线)将原始信号编码为更高信息密度的表示
- 白虎(对抗验证)= 噪声过滤。红队/蓝队、欺骗检测 = 识别并过滤噪声信号,提升有效信号占比
- 玄武(认知积累)= 先验知识。知识图谱和历史数据库为贝叶斯推断提供更好的先验分布,使得每条新信号的边际信息量更大
为什么四象飞轮比传统方法更适合涉密行业?
传统方法假设信道带宽足够大(数据充足),优化的是信号处理速度。四象飞轮假设信道带宽受限(数据匮乏),优化的是信噪比和信息恢复效率。
这是两种完全不同的优化目标,对应两种完全不同的方法论范式。在信息充裕的行业(消费品、互联网),两种方法的差异不大。但在信息匮乏的涉密行业,四象飞轮的优势是结构性的 —— 因为它从设计之初就是为"不确定性环境下的认知收敛"而构建的。
更深一层:军事情报分析的哲学困境
所有情报分析都面临一个根本悖论:你永远不知道你不知道什么(Rumsfeld's "unknown unknowns")。四象飞轮不假装能解决这个悖论,而是通过"残差追踪"将其工程化:
- Known knowns(已知的已知)= 认知图谱中的确认节点
- Known unknowns(已知的未知)= 明确标注的残差
- Unknown unknowns(未知的未知)= 青龙的发散性 + 白虎的盲点扫描 + 玄武的残差异常检测
系统的价值不在于消除未知,而在于把"未知的未知"尽可能多地转化为"已知的未知"。
涉密行业分析的终极竞争不是"谁知道得更多"。
是"谁的认知结构能从更少的信息中提取更多的意义"。
数据是有限的,认知结构是可以无限优化的。
这就是为什么四象飞轮的护城河不是数据量,而是认知架构。
在信息充裕的世界,最好的分析师是最快的数据处理器。
在信息匮乏的世界,最好的分析师是最好的认知架构师。
涉密行业证明了:四象飞轮的价值不依赖于数据量。
它依赖于认知结构本身。
方法论版本:v1.0 · 适用范围:涉密/半涉密行业
理想模型决定下限,人类残差决定上限。
材料星图 · 认知图谱 · 案例中心 · 飞轮实况
免责声明:本报告由 SkyCetus Research 基于公开信息整理,仅供方法论研究参考。所有分析均基于合法公开信息源,不涉及任何涉密信息。案例分析中的具体推断仅为方法论演示,不代表对实际军事项目的确定性判断。数据来源包括国家知识产权局公开专利数据库、上市公司公开年报、美国国防部公开报告、SIPRI公开数据库等。
四象飞轮 → 五行飞轮(1+4)
SkyCetus 的飞轮架构已从四象飞轮(青龙/白虎/玄武/朱雀)演化为五行飞轮(1+4 架构): 土(玄黄/中央)作为中心枢纽——交付、反馈、真实世界校验,四象围绕土运行:
相生链驱动正向循环,相克五角星提供制衡约束。图论证明5是同时实现相生相克双独立循环的最小数。 查看五行飞轮交互图 →