🔮 四象飞轮映射: 青龙 Seed CIM是计算范式革命型种子——打破冯诺依曼瓶颈,存储和计算融为一体。 朱雀 Task 当前核心任务:编译器生态建设(对标CUDA),没有软件生态则硬件无法商用。 白虎 Review GPU生态(CUDA+PyTorch)极其强大,CIM需要10x能效优势才能撬动市场。 玄武 Learn CIM本质是空间换时间的计算哲学——与TEP分布式执行理念高度共振。
🎯 SkyCetus 结论:CIM是最具颠覆性但商业化路径最不确定的方向。端侧AI是最佳切入点。
SkyCetus 检测信号:端侧AI需求爆发+国产AI芯片需另辟蹊径+Flash CIM良率提升=CIM战略价值上升。判断:BASE情景。
材料概述与核心性能
材料概述与核心性能参数
存算一体(CIM,Compute-in-Memory)是一种颠覆传统冯·诺依曼架构的创新计算范式,其核心原理是在存储单元内部直接完成矩阵乘加运算,彻底消除CPU与存储单元之间的数据搬运瓶颈。从材料技术路线来看,主要分为三大类:SRAM-CIM采用静态随机存储器单元,技术成熟度最高,已在TSMC实现IP化;ReRAM-CIM基于阻变存储器,具备高密度存储优势;Flash-CIM采用非易失性闪存技术,静态功耗极低。
关键性能指标显示,CIM相比传统GPU可降低能耗10-100倍,推理吞吐量提升5-10倍。以知存科技的Flash-CIM芯片为例,其矩阵运算能效比达到50 TOPS/W,而英伟达H100 GPU约为2 TOPS/W。在精度方面,模拟计算方案(精度8-10bit)已可满足绝大多数AI推理场景需求,与数字方案(精度16bit以上)的差距正在缩小。从技术成熟度6、量产可行5、供应可控6、投资回报8、政策支持7的综合评分来看,CIM技术已进入商业化临界点,预期在未来3-5年内将实现大规模量产部署。
制备工艺与流程
制备工艺要求及完整流程
CIM芯片的制备工艺根据技术路线不同存在显著差异。SRAM-CIM主要采用标准CMOS工艺,与传统逻辑芯片制程兼容性好,可复用TSMC 7nm/5nm先进制程产线,典型工艺温度控制在1000-1200℃范围,需要精确控制的注入掺杂和硅化工艺。ReRAM-CIM则需要在标准CMOS后段增加阻变存储层沉积工艺,通常采用PVD或ALD技术,工艺温度控制在200-400℃,挑战在于存储层材料的均匀性和一致性控制。Flash-CIM涉及浮栅结构刻蚀,对工艺精度要求极高,需要高能离子注入形成深阱结构。
关键设备包括光刻机(ArF浸没式)、刻蚀设备、薄膜沉积设备(LPCVD/PECVD/ALD)以及离子注入机等。工艺良率的主要瓶颈包括:存储单元一致性(ReRAM批间差异需控制在±5%以内)、模拟计算精度校准复杂度高、芯片级测试时间长。以TSMC的SRAM-CIM IP为例,其良率可达90%以上,但大规模量产仍需解决与标准单元库的协同设计问题。九天睿芯采用的模拟CIM方案在28nm工艺节点实现了量产,但更高密度需求正推动向22nm及更先进节点演进。
产业链全景
产业链全景(上中下游)
上游供应链涵盖半导体设备、核心IP和原材料三大领域。设备端,ASML(光刻机)、应用材料(薄膜沉积)、Lam Research(刻蚀)等国际巨头占据主导地位,国内中微公司、北方华创在部分刻蚀设备实现替代;核心IP领域,Synopsys、Cadence提供CIM设计所需的EDA工具套件,国内华大九天、芯愿景正在补齐短板;硅基原材料方面,沪硅产业生产的12英寸大硅片已通过部分认证测试。
中游制造加工环节,TSMC、三星、英特尔掌握先进制程能力,支撑SRAM-CIM和部分ReRAM-CIM的流片需求;国内中芯国际14nm FinFET工艺可用于CIM芯片制造,华虹半导体在特色工艺领域具备优势。后摩智能采用数模混合设计,需要同时具备数字逻辑和模拟IP的整合能力,对代工厂的工艺库支持要求较高。封装测试环节,长电科技、通富微电可提供2.5D/3D封装服务,满足CIM芯片的高密度互连需求。
下游应用场景涵盖AI推理加速(数据中心、边缘服务器)、移动终端(手机APU)、自动驾驶(嵌入式推理)等领域。终端客户包括阿里云、腾讯云、华为等头部云厂商,以及比亚迪、长安等车企。亿铸科技专注于大算力CIM芯片研发,目标市场包括超算中心和高性能计算场景。
核心产业基地与企业
核心产业基地及龙头企业
国际层面,IBM是模拟CIM领域的先驱,其基于相变存储器的模拟AI芯片在2019年即实现原型验证,在模拟计算噪声抑制和精度校准算法方面积累深厚;三星电子布局MRAM-CIM技术路线,利用MRAM的非易失性和高稳定性特性,在低功耗嵌入式场景具有独特优势,其28nm MRAM-CIM已发布;TSMC作为全球最大晶圆代工厂,已推出SRAM-CIM IP授权服务,基于N5P工艺的方案进入设计定案阶段,市占率超过60%。
国内产业格局呈现多点突破态势。知存科技是Flash-CIM商业化先行者,其WTM2101芯片已实现百万级量产,在低功耗语音识别场景市占率领先,已完成B轮融资估值超20亿元;后摩智能由地平线前高管创立,采用数模混合路线,首款产品聚焦智能驾驶推理,已获多家车企定点;九天睿芯专注于类脑计算和模拟CIM,其产品已进入消费电子供应链;亿铸科技专注大算力场景,基于存算一体架构的AI芯片瞄准数据中心市场,已完成过亿元天使轮融资。
产业集聚方面,长三角(上海、苏州、无锡)形成设计-制造-封装完整链条,珠三角在终端应用和方案集成领域领先,北京在基础研发和人才储备方面具备优势,中西部(武汉、成都)正建设先进封装产能。
国产替代与卡脖子
国产替代进展与卡脖子分析
当前CIM领域国产化率呈现结构性差异:设计环节国产化率约40-50%,知存科技、后摩智能等已具备与国际厂商同台竞技能力;制造环节约30-35%,中芯国际14nm制程可满足大部分CIM需求,但先进制程节点仍受制约;核心IP和EDA工具国产化率不足20%,是主要短板所在;设备端国产化率约15-25%,光刻机、先进量测设备高度依赖进口。
主要技术瓶颈集中在四个方面:一是模拟计算精度受工艺波动影响显著,先进节点(5nm/3nm)的器件噪声问题更为突出;二是编程模型和软件工具链不成熟,缺乏统一的CIM开发框架;三是数模混合设计人才稀缺,跨领域设计能力不足;四是CIM与现有数字系统(CPU/GPU)的协同架构尚无标准接口。
国产替代路线图分三阶段推进:2024-2025年,完成28nm以上成熟制程的自主化替代,Flash-CIM和SRAM-CIM实现稳定量产;2026-2027年,14nm FinFET制程导入,自研EDA工具链覆盖设计前端的50%以上;2028-2030年,实现5nm节点技术突破,核心IP全部国产化,建成完整生态系统。关键时间节点包括:2025年国产CIM芯片市占率突破15%,2027年形成3-5家具备国际竞争力的龙头企业。
未来方向与路线图
未来优化方向与技术路线图
下一代CIM技术演进呈现三大方向:一是更高计算精度,通过创新的噪声抑制算法和校准技术,将模拟计算精度从当前的8-10bit提升至12-16bit,缩小与数字方案差距;二是更大规模集成,采用3D堆叠和先进封装技术,单芯片存储容量向1Gb以上演进,支持百亿参数级别模型推理;三是异构集成,将CIM与数字逻辑芯粒(Chiplet)通过先进封装整合,实现最优的能效比。
技术突破时间线:2024-2025年,12nm以下制程的SRAM-CIM实现量产,ReRAM-CIM在嵌入式场景批量出货;2026-2027年,模拟计算精度达到12bit,编程模型标准化初步完成,主流AI框架完成适配;2028-2030年,3D堆叠CIM芯片进入消费电子和汽车电子市场,支持本地化百亿参数模型运行。
市场规模预测方面,全球AI推理芯片市场2023年约180亿美元,预计2030年达到500亿美元,CIM技术凭借能效优势将占据10-20%市场份额,对应50-100亿美元市场空间,年复合增长率超过30%。投资建议关注三条主线:一是具备量产能力和头部客户导入的成熟标的(如知存科技);二是掌握核心工艺know-how的代工和封装企业;三是EDA工具和设计自动化软件等基础设施环节。建议分阶段布局,早期关注技术路线确定性高的SRAM-CIM和Flash-CIM,中长期布局ReRAM-CIM等新兴方向。