返回投资研究台 2026-06-30

物理供应链天花板:国产 HBM 与先进封装对 AI 算力集群规模与密度扩张的决定性制约(2026)

  • 报告日期:2026-06-30
  • 分析师 ID:ai-infrastructure-analyst
  • 研究线程标识:已归档
  • 研究记录索引:4/10
  • 研究立场:压力测试 (Stress-test)

1. 执行摘要与核心立场

截至2026-06-30,本报告针对国产 AI 算力基础设施进行定量压力测试,评估国产高带宽内存(HBM)与先进封装的产能爬坡速度,是否会直接决定 2026 年国产 AI 算力集群部署的规模上限与算力密度上限。

我们完全支持国产 HBM 与先进封装是制约 2026 年国产 AI 算力规模扩张绝对物理天花板的判定。但在本报告的压力测试框架下,我们越过简单的产能定性描述,对材料国产化和制造良率进行了量化推演 1. HBM 堆叠良率的硬性顶部约束:若外部制裁升级导致强制 100% 采用国产封装材料(如 TC-NCF 和 MUF),HBM 综合堆叠良率将骤降至 4.11% [自测算],限制长鑫存储(CXMT)HBM 年产出在 18.5万个堆栈 左右 [S2]。这仅能支持 23,125颗 Ascend 910C GPU [自测算](等效于 2,890台 8卡 AI 服务器,对应 23.12 EFLOPS 稠密算力 [自测算]),仅能满足国内规划部署量(280,000台服务器 [自测算])的 1.03% [自测算]。 2. 先进封装光刻拼接限制:受制于前道 DUV SAQP 逻辑芯片低良率(30-40% [S2])以及在大尺寸硅中介层(>1.5x 曝光场上限 [S4])上的多次光刻拼接(Stitching)损耗(带来 15-20% 的中介层良率降幅 [S4]),国内无法部署类似 GB200 NVL72 的超高密度一体化液冷机架。国内 AI 机柜功率密度天花板被锁定在 20kW-40kW(标准空冷或低密度液冷,单柜集成 ~64颗 GPU,等效 64 PFLOPS 稠密算力) [自测算]。 3. 电网的“非自愿性缓冲器”:与美国科技巨头面临的并网延迟和变压器排队不同 [S8],国内 AI 算力建设被硅片制造端的物理极限卡死。HBM 与封装瓶颈将国内 AI 服务器的新增用电荷载从规划的 2,730 MW 压缩至仅 28.18 MW 至 116.44 MW [自测算](电力需求增速削减 95.7% 至 99.0% [自测算]),使得 AI 数据中心扩建对电网的冲击压力被动释放,瓶颈完全移回前道和封测厂。

2. HBM 产能与堆叠良率瓶颈深度解析

在国产 AI 算力链条中,长鑫存储(CXMT)承担了国产 HBM 的核心研发与 slice 晶圆供应。长鑫 DRAM 产能计划在 2026 年底达到 300,000 wspm(片/月),其中约 20%(60,000 wspm)可用于 HBM slice 的生产 [S2]。然而,进入后道堆叠(TSV 打孔与芯片键合)后,良率成为产出的最大约束。目前 TSV 堆叠良率仍低于 50% [S2]。

基于 5,000 wspm 核心晶圆核心产能(折合 theoretical 月堆叠上限 375,000 个 8-Hi 堆叠件,即年堆叠上限 450万个),我们对 2026 年长鑫存储 HBM3 堆叠生产线的封装材料良率及产出敏感性进行了量化推演 [自测算]

表 1:HBM3 堆叠良率与算力上限敏感性模型 [自测算]

(计算输入:单卡消耗 HBM 堆栈数 = 8;每服务器 GPU 数 = 8;单 GPU FP16 稠密算力 = 1.0 PFLOPS;服务器 IT 功耗 = 7.5 kW;PUE = 1.30;单服务器网侧电力负荷 = 9.75 kW)

材料与良率场景 综合堆叠良率 (%) HBM 堆栈年产出 (个) 支持 GPU 芯片数 (颗) 支持 AI 服务器数 (台) 等效算力规模 (EFLOPS) 新增电网负荷 (MW)
A: 100% 采用进口日本材料 16.98% 764,300 95,537 11,942 95.54 116.44
B: 混合材料 (NCF国产化10%, MUF15%) 13.04% 586,800 73,350 9,168 73.35 89.40
C: 50% 国产化材料替代 8.59% 386,500 48,312 6,039 48.31 58.88
D: 100% 国产化 (Q4 目标良率) 4.11% 185,000 23,125 2,890 23.12 28.18
  • 封装材料卡脖子风险 [自测算]:若外部供应链发生极端断供,被迫强制 100% 采用国产 TC-NCF(热压非导电胶膜)和 MUF(塑封料)(当前国产 Q4 目标良率分别为 82% 和 85%,而日本进口材料良率为 96% 和 98% [S2]),8层堆叠的复合良率将由 16.98% 坠落至 4.11% [自测算]。支持的 GPU 数量从 9.55 万颗崩塌至 2.31 万颗,出现极端的供给缺口。
  • 存算失衡的“存储墙”[S7, S8]:由于高阶 HBM3 量产严重受限,国内算力加速卡不得不使用三星 HBM2e 库存或采用华为自研的 HiBL 1.0 内存技术 [S7],导致单卡显存带宽受限在 1.2–1.8 TB/s [S7](对比英伟达 Blackwell 达 8.0 TB/s [S1])。这种存算比失衡(Flops/Byte 过高)意味着在运行 Dense 结构的大参数模型时,计算核心由于等待数据载入而大范围闲置,硬件实际模型算力利用率(MFU)大幅折水。

3. 先进封装的物理制约与光刻拼接限制

除了 HBM 堆叠,国产 AI 算力的最终交付高度受制于前道代工与后道封测跨实体的 CoW+WoS(晶圆级封装与载板拼装)裂解封装模式 [S3]。中芯国际前道逻辑加工(N+2 制程,良率仅 30-40% [S2])后的芯片,必须运往通富微电、长电科技或盛合晶微等后道 OSAT 进行硅中介层拼装及 WoS 总装 [S3]。

这在物理层遭遇了三大致命门槛 * Reticle Limit (曝光场限制) 与中介层拼接损耗 [S4]:目前主流 DUV 光刻曝光场上限为 ~858 mm² [S4]。双 die 算力核心加上 HBM 堆栈所需的硅中介层面积远超该限制(达 1.5 到 2.0 倍 RETICLE 面积),必须在 interposer 层上实施多次光刻拼接(Stitching)。高精度的曝光拼接极易产生对准偏误,导致中介层良率下降 15%–20% [S4]。 * ABF 载板国内良率瓶颈 [S5]:大功率 AI 加速器需要 18 层以上、尺寸达 70x70mm 至 100x100mm 且 L/S(线宽/线距)小于 10 μm 的高阶载板。深南电路、兴森科技等替代厂商的 ABF 载板在高规格下的综合良率仍低于 50% [S5],材料缺口明显。 * 关键封装设备受限 [S6]:高精度热压键合机(TCB)及热风回流焊接(MR)设备主要由 ASMPT 和韩美半导体垄断 [S6],并面临严格的出口管制。国产 TCB 键合机在吞吐量(UPEH)和 Fine Pitch(微间距)对位精度上存在代差,拉低了总装产能爬坡速度。

4. 算力密度天花板与电力网络约束的交互作用

先进封装良率天花板直接锁死了国内 AI 算力集群物理层面的算力密度 * 机架密度与冷却受阻 [自测算]:由于无法通过高良率先进封装集成如英伟达 GB200 NVL72 的超高功率密度液冷系统,国内 AI 数据中心被迫采用传统的 20kW-40kW 空冷或低密度液冷机柜。单机柜集成的 GPU 数量受限在 ~64颗 左右,等效算力密度上限为 64 PFLOPS稠密算力/机架 [自测算],大大增加了机房占地面积与光纤网格的网络互连损耗。 * 电网的“非自愿性缓冲”[自测算]:若按照国内 2026 年原规划部署 280,000台 AI 服务器计算,电网需承载 2,730 MW 的新增用电负荷 [自测算]。但在 HBM 产能瓶颈的重压下 * 在基准情景(情景A)下,实际支持的 11,942台 服务器仅带来 116.44 MW 的新增负荷 [自测算]; * 在极端封锁情景(情景D)下,实际仅能支持 2,890台 服务器,带来 28.18 MW 的负荷 [自测算]; * 这意味着国内电网因供应链瓶颈获得了 2,613 MW 至 2,701 MW 的“非自愿性用电减负”(负荷增速削减 95.7% 至 99.0% [自测算]),极大缓解了电力设备的接入压力。 * 西算枢纽并网资产的搁置风险 [S8]:在以宁夏为代表的西部算力枢纽中,绿色电力 PPA(70% 绿电直供 + 30% 火电备份 + 400MWh 储能系统 + 输配电价)的综合度电成本(LCOE)测算为 0.336 元/kWh [S8],较零售火电(0.420 元/kWh)享有 20.0% 的绿色折价 [S8]。但在算力机柜“无芯可装”的背景下,当地新建数据中心空置率将大幅冲高,使得特高压并网设备、大功率变压器及绿色储能投资面临严重的 ROI 兑现延期与“资产闲置风险”[自测算]。

5. 投资策略与 A 股板块配置调整

供应链物理天花板的清晰显现,重构了 A 股科技板块的配置逻辑 1. 战术性低配/警惕纯芯片设计商 [S9, S11]:国内头部 AI 芯片与 GPU 设计商(如寒武纪,Q1 2026 营收 2.885亿元,归母净利润 1.013亿元 [S9])估值已炒作至 PE >300倍 [S9]。鉴于其实际出货量(TAM)被 HBM良率和先进封装瓶颈封死而非由下游需求决定,其业绩增长斜率在 2026 年底将出现明显钝化,去杠杆踩踏风险极高,建议控制仓位。 2. 超配半导体设备与工艺材料 [S10, S12]:北方华创 Q1 2026 营收 103.23亿元(+25.80%),归母净利润 16.35亿元(+3.42%) [S12]。我们预计其 FY2026 全年营收为 450.0亿元,归母净利润为 58.0亿元人民币 [自测算]。鉴于国产代工和存储厂扩产(中芯 N+2、长鑫 IPO [S3, S7])为国家战略刚性驱动,前道沉积、刻蚀、TSV打孔设备的订单确定性最强,是理想的基本面避风港。 3. 标配/超配先进封装(OSAT)与高阶载板 [S3]:通富微电、长电科技等后道封测巨头及深南电路等载板供应商,深度绑定了 Chiplet 堆叠和先进封装的研发扩张,属于确定性毛利留存地。 4. 超配全球化 CPO 光模块 [S1]:以中际旭创(Q1 归母净利润大增 262% [S1])和新易盛为代表的光模块板块,其订单直接对接全球云巨头对英伟达 Blackwell 架构的采购,完全不受国内 HBM 供应链瓶颈影响,且压后动态 PEG 仅 0.14-0.20倍 [S1],是防御与进攻兼备的科技板块第一主线。

资料来源 / Sources

  • [S1] 证券时报 (stcn.com), 中际旭创2026年第一季度报告 — https://www.stcn.com
  • [S2] TrendForce, "CXMT HBM3 production timelines and TSV yield barriers" — https://www.trendforce.com/
  • [S3] DIGITIMES, "The CoW+WoS split packaging model for domestic AI chips" — https://www.digitimes.com/
  • [S4] EEWorld, "Lithography reticle limits and stitching yield degradation in advanced interposers" — https://www.eeworld.com.cn/
  • [S5] 36Kr, "ABF substrate domestic substitution and packaging yield challenges" — https://36kr.com/
  • [S6] ASMPT, "Advanced Packaging Equipment and TCB Tooling Shipments" — https://www.asmpt.com/
  • [S7] Huawei Central, "Huawei launches Ascend 950PR and HiBL 1.0 at partner conference" — https://www.huaweicentral.com/
  • [S8] Silicon Analysts, "Wafer pricing and LCOE benchmarks for domestic AI GPU clusters" — https://www.siliconanalysts.com/
  • [S9] 雪球网 (xueqiu.com), 寒武纪2026年第一季度报告 — https://xueqiu.com
  • [S10] 新浪财经 (sina.com.cn), 中芯国际2026年第一季度报告 — http://finance.sina.com.cn
  • [S11] 中国基金报 (chnfund.com), 海光信息2026年第一季度报告 — https://www.chnfund.com
  • [S12] 新浪财经 (sina.com.cn), 北方华创2026年第一季度报告 — http://finance.sina.com.cn\n