北大团队研发高能效专用计算芯片：以新型模拟架构破解智能算力速度与能耗瓶颈

如今，个性化推荐、图像分析、信息聚类等智能服务已深度融入互联网应用，成为人们日常使用的重要功能。这类服务依赖计算系统对海量数据进行快速处理与分析，但支撑它们的传统数字芯片正承受越来越大的压力。随着数据规模持续扩张、实时性要求不断提高，计算速度与能耗之间的矛盾愈发突出，逐渐成为智能应用深入发展的瓶颈。众多计算任务中，非负矩阵分解是机器学习中的关键算法之一。它能够从用户行为数据、图像像素信息等复杂数据中提取潜在模式与特征，广泛用于推荐系统、图像处理等场景。但该算法需要同步求解两个矩阵，包含大量迭代计算；传统数字芯片以串行计算为主，难以满足实时处理需求，成为实时智能服务落地的一大障碍。面对此问题，孙仲团队将研究重点转向模拟计算这一新方向。与数字计算不同，模拟计算通过物理电路直接完成求解，具备天然的并行优势。团队基于阻变存储器阵列设计了紧凑的模拟电路结构，并引入电导补偿技术，使非负矩阵分解的核心计算步骤实现“一步求解”，显著改善了芯片的面积与能耗表现。该思路相当于为特定复杂任务打造专用工具，而不是继续依赖通用计算方案。为验证方案效果，团队在实验室搭建原型系统并开展多组测试。在彩色图像分解任务中，系统实现了高质量分解，信噪比损失很小；在电影推荐数据集训练中，模型精度与先进数字芯片基本一致。更关键的是，在网飞规模数据集的推荐系统训练任务中，该模拟求解器的计算速度较先进数字芯片提升约12倍，能效比提升超过228倍。也就是说，在完成相同计算任务时，新芯片的能耗仅相当于传统方案的极小一部分。这一进展具有直接的应用价值。进入人工智能时代，算力需求快速增长，而能耗正成为产业进一步扩张的现实约束。高能效的专用计算芯片有望提升个性化推荐的实时响应能力，并为生成式人工智能训练提供更节能、更高效的算力支撑，从而降低数据中心运营成本，推动绿色计算与可持续发展。从技术角度看，这项工作为非负矩阵分解等约束优化问题的实时求解提供了新的路径，也展示了模拟计算在处理复杂现实数据上的潜力。随着研究推进与产业化加速，类似的高能效专用计算架构有望在图像识别、自然语言处理、科学计算等领域拓展应用，为我国参与下一代智能计算技术竞争提供支撑。

在数字经济时代，算力已成为国家竞争力的重要指标。北京大学科研团队的此成果，既回应了现实技术瓶颈，也指向了未来智能计算的可能方向。它表明，只要聚焦关键核心技术、坚持原始创新，我国在全球科技前沿领域实现跨越式提升具备坚实基础。