这次AI大模型的SuperCLUE测评,把国内的豆包Doubao-pro推到了全球第一梯队,和国际顶级的GPT、GPT-4正面比拼。小米研发的MiMo大模型这次也加入了榜单,让业界看到了手机厂商在自研大模型方面的实力。这次测评中,国内模型在中文理解、常识推理还有逻辑能力上进步不小,豆包不仅对话能力强,处理复杂任务和长文本时也表现得很稳定。百度文心一言、阿里通义千问这些老牌选手也在前面。小米的MiMo能上榜,说明端侧AI和云端大模型结合的路已经走通了。 现在中文大模型的竞争不只是比谁的参数多了,更讲究在具体场景上的表现。豆包利用字节跳动的流量优势,在内容创作和社交互动上做得不错;小米的MiMo则在系统调度和多设备配合上有一手。专家们觉得,现在大家的模型能力都差不多了,未来谁赢谁输就得看谁能解决行业里的实际难题,还要看谁能提供更低延迟、更划算的算力服务。