问题:从开源代码层面看,AMD 下一代集成显卡的规划正逐渐清晰。外媒梳理开源图形软件栈对应的代码后发现,LLVM 更新中新增了 GFX1171 与 GFX1172 两个图形目标,并与既有的 GFX1170 并列出现,三者均标注为 RDNA 4m。这表明,AMD 可能同一代核显架构下准备多种配置,以覆盖移动平台不同的功耗与性能需求。 原因:一是端侧智能计算需求快速增长,推动移动平台从“图形优先”转向“图形与 AI 并重”。在轻薄本、掌机及小型终端等场景中,用户对本地推理、内容生成、语音与图像增强等能力的依赖加深,对更高效的低精度计算和更稳定的并行吞吐提出要求。二是集成显卡在 APU/SoC 中具备能效与成本优势,能在有限功耗下承担一定规模的通用并行计算任务。现有信息显示,RDNA 4m 引入与新一代指令集相关的升级,原生支持 FP8 与 BF8 等低精度数据格式,并提供用于加速 AI 负载的矩阵乘加类指令(WMMA)。这些改动指向同一目标:在不明显增加功耗与面积的前提下,提升移动端 AI 工作负载的执行效率。 影响:其一,产品路线可能更细分。尽管新增两个变体,但底层文件显示其指令集能力与 GFX1170 一致,差异更可能体现在计算单元规模、频率设定或功耗限制策略诸上。通过“同架构、多配置”,厂商可不同价位与机型上复用生态与驱动能力,缩短导入周期。其二,架构定位更清晰。虽然命名带有“4”,但 RDNA 4m 并非面向独立显卡的完整 RDNA 4 路线。公开的 Linux 开发文档也显示其归属 GFX11 家族,与 RDNA 3 体系关联更紧密,主要面向 APU 或 SoC 级核显。这种“承接过渡”的定位,有助于在保持软件兼容与生态连续性的同时,逐步引入更适合 AI 的指令与数据格式。其三,移动端竞争压力加大。移动市场正把“AI 体验”纳入核心卖点,核显作为端侧并行计算的重要载体,其对 AI 支持程度将影响本地推理、媒体处理与轻量创作的整体体验,并进一步影响厂商在 OEM 与消费市场的竞争力。 对策:对产业链各方而言,围绕端侧 AI 与核显能力的协同优化将成为重点。一上,芯片厂商需要硬件之外加强软件栈适配,包括驱动、编译器、算子库与推理框架的协同,降低开发者调用矩阵指令与低精度格式的门槛。另一上,整机厂商应更重视系统级功耗管理与散热设计,通过 BIOS 与调度策略,让核显在 AI 与图形负载之间实现更合理的资源分配,避免出现“峰值能跑、体验不稳”。同时,开源社区与应用开发者可围绕 FP8/BF8 等新格式尽早开展适配与验证,推动端侧 AI 从“能用”走向“高效”。 前景:按业内对迭代节奏的普遍预期,在搭载 RDNA 3.5 核显的产品陆续落地后,下一阶段面向新一代 CPU 架构的移动 APU 有望承接升级,GFX1170 系列被认为可能用于后续平台的集成图形核心。随着更多代码、驱动提交与硬件信息逐步公开,GFX1171/1172 的具体定位与规格差异将更明确。可以预期,移动端处理器的竞争焦点将从传统的 CPU 单核/多核性能,进一步扩展到“核显并行计算能力 + 端侧 AI 效率 + 能耗控制”的综合比拼,软件生态成熟度也将成为决定体验的重要因素。
从开源代码的细节变化到产品路线逐步清晰,核显正从“显示与轻度游戏”的传统角色,走向“图形渲染与 AI 计算并重”的新阶段。面向端侧智能化趋势,谁能在功耗约束下把低精度算力、矩阵计算与生态适配做扎实,谁就更可能在下一轮移动平台竞争中占得先机。对产业而言,这不仅是一次架构升级,更是围绕端侧体验与软件生态的综合较量。