日本乐天涉嫌剽窃中国开源AI技术 政府补贴项目陷版权争议

日本乐天集团日前宣布推出自主研发的AI模型,声称参数规模达7000亿,在日语基准测试上超越国际先进水平,并获得了政府上亿日元的研发补贴;然而,技术社区随后发现,该模型的核心架构和权重文件均源自中国开源项目DeepSeek V3。该发现随即引发了关于企业诚信和开源生态规范的深刻反思。 问题的症结在于乐天集团在项目申报和宣传中的表述存在严重误导。根据社区开发者的调查,该模型的配置文件中明确标注了"deepseek-v3"的原始模型名称,但在后续发布过程中被修改为乐天自有品牌,同时删除了涉及的的开源许可证文件。这种做法违反了开源协议的基本要求,即使用开源代码或模型必须保留原始作者的署名和许可信息。 从产业背景看,这一事件反映出当前AI领域的竞争态势。DeepSeek V3由中国团队于2023年底开源发布,采用先进的Transformer架构,训练数据包含海量中英文内容,开源发布后全球下载量突破百万。此项目代表了中国在开源AI领域的领先地位,为全球开发者提供了高质量的基础模型。相比之下,日本本土AI产业虽然致力于自给自足,但在芯片、云计算基础设施等关键环节仍存在依赖,产业链闭环能力相对较弱。 乐天集团之所以采取这种做法,根本原因在于AI模型开发的高成本与政府补贴政策的激励机制之间的矛盾。DeepSeek V3的训练消耗了数万张高端GPU芯片,成本估算在10亿人民币级别。通过基于成熟开源模型进行微调,乐天可以大幅降低研发成本,同时通过声称自主研发来获取政府补贴,形成了"低成本获取、高补贴兑现"的不当利益链条。 不容忽视的是,乐天的做法并非完全没有技术合理性。开源模型的微调和本地化优化是产业实践中的常见做法。将通用模型针对日语环境进行优化,增强对日本文化、俚语和本地场景的理解能力,这本身是有价值的技术工作。但关键区别在于是否遵守开源协议、是否透明标注来源。正确的做法应该是在项目申报和产品发布中清晰注明基础模型来源,说明自身的微调贡献,而不是隐瞒事实、删除版权信息。 该事件的影响是多维度的。首先,它损害了乐天集团的企业信誉和品牌形象。在信息公开的时代,技术细节难以隐瞒,虚假宣传最终必然被揭露,代价是公众信任的丧失和舆论的批评。其次,事件暴露了政府补贴政策执行中的监管漏洞。如果申报单位可以通过隐瞒事实获取补贴,这将导致公共资源的浪费和不公平竞争。再次,这反映出国际开源社区对知识产权的保护需要深入加强,特别是在商业应用中。 从更广阔的视角看,该事件也触及了全球AI产业竞争中的深层问题。中国开源项目的高质量和开放态度为全球开发者提供了宝贵资源,但这也可能被某些企业不当利用。日本作为技术强国,应当通过自身的创新能力和诚信态度来参与国际竞争,而非采取投机取巧的方式。同时,开源社区需要更有效的机制来确保其贡献得到尊重和保护。 对此,业界和政策制定者都应采取行动。企业层面,应当建立更严格的合规审查机制,确保所有技术声明都经过充分验证。政府层面,补贴申报应当要求详细的技术来源说明,并进行第三方评估。开源社区层面,可以考虑采用更强有力的技术手段来追踪模型的使用和修改情况。

开源不是捷径的代名词,而是规则明确的合作契约。在大模型竞速的当下,更需要以事实为基础、以合规为底线、以可验证为标准,让创新回归工程与治理本身。唯有把"尊重规则"和"提升能力"同步推进,技术进步才能转化为长期竞争力,公共投入也才能获得应有的信任回报。