多语种识别、合成与编解码齐发力:江苏省语言计算及应用实验室成果入选ICASSP 2026

记者从江苏省语言计算及应用重点实验室获悉,该实验室多篇学术论文近日被国际声学、语音与信号处理会议2026年会议接收。

这一国际顶级学术会议长期被业界视为声学、语音与信号处理领域最具影响力的学术平台,其录用成果代表着相关技术领域的前沿发展方向。

江苏省语言计算及应用重点实验室由思必驰科技股份有限公司牵头,联合上海交通大学、苏州大学共同建设,是江苏省在通用人工智能领域的重要战略科技力量。

实验室依托思必驰的产业平台优势,整合上海交通大学、苏州大学的优质科研资源,构建起产学研用深度融合的创新体系,围绕语言计算核心技术开展从基础理论到产业应用的全链条攻关。

此次获得会议接收的研究成果主要集中在三个前沿方向。

在多语种语音识别领域,实验室提出的简单适配器混合结构方案,针对低资源语言数据不足和跨语言建模难题,通过多专家协同机制实现知识共享与特征分工。

实验数据显示,该方案在训练参数量仅为基准模型六成的情况下,平均词错误率下降13.3%,为多语种识别系统的规模化部署提供了可行路径。

在语音合成技术方面,实验室研发的动态分块预测策略有效解决了传统逐词元预测在长序列建模中的效率瓶颈。

该技术通过动态调整预测跨度,在保持合成质量的同时,将可懂度提升最高达72.27%,推理速度提升至2.61倍,为实时语音交互应用奠定了技术基础。

在低码率神经语音编解码方向,实验室的研究成果优化了低码率环境下的语音传输质量,降低了端侧设备的资源消耗,为智能家居等场景中的低功耗部署和弱网络环境下的稳定交互提供了技术支撑。

这些技术突破直接支撑了相关产业应用的升级。

在车载座舱场景中,多语种识别能力的增强提升了多音区交互和跨区域语音服务水平;在办公会议领域,高效语音合成技术改善了助手反馈的自然度和响应速度;在智能家居终端,低码率编解码技术提高了设备的能效比和网络适应性。

业内专家认为,该实验室的研究成果体现了产学研协同创新的优势。

企业的产业化需求与高校的基础研究能力相结合,既保证了研究方向的前瞻性,又确保了成果的实用价值。

这种创新模式为我国在语音语言技术领域缩小与国际先进水平差距、实现关键技术自主可控提供了有益探索。

从技术发展趋势看,语音语言技术正朝着多模态融合、低资源高效能、跨语言泛化等方向演进。

实验室在多语种识别、高效合成、低码率传输等方向的布局,契合了行业发展的主流趋势,也反映出我国科研机构对技术演进规律的准确把握。

此次国际顶会的成果集中亮相,标志着我国在智能语音领域已从技术跟跑转向并跑阶段。

随着全球数字化进程加速,语言计算技术将成为人机交互的核心基础设施。

江苏实验室的实践表明,只有将学术前沿探索与产业实际需求紧密结合,才能实现关键技术的快速迭代与价值转化,为数字经济高质量发展注入持续动能。