日本乐天涉嫌剽窃中国开源AI技术政府补贴项目陷版权争议

日本乐天集团日前宣布推出自主研发的AI模型，声称参数规模达7000亿，在日语基准测试上超越国际先进水平，并获得了政府上亿日元的研发补贴；然而，技术社区随后发现，该模型的核心架构和权重文件均源自中国开源项目DeepSeek V3。该发现随即引发了关于企业诚信和开源生态规范的深刻反思。问题的症结在于乐天集团在项目申报和宣传中的表述存在严重误导。根据社区开发者的调查，该模型的配置文件中明确标注了"deepseek-v3"的原始模型名称，但在后续发布过程中被修改为乐天自有品牌，同时删除了涉及的的开源许可证文件。这种做法违反了开源协议的基本要求，即使用开源代码或模型必须保留原始作者的署名和许可信息。从产业背景看，这一事件反映出当前AI领域的竞争态势。DeepSeek V3由中国团队于2023年底开源发布，采用先进的Transformer架构，训练数据包含海量中英文内容，开源发布后全球下载量突破百万。此项目代表了中国在开源AI领域的领先地位，为全球开发者提供了高质量的基础模型。相比之下，日本本土AI产业虽然致力于自给自足，但在芯片、云计算基础设施等关键环节仍存在依赖，产业链闭环能力相对较弱。乐天集团之所以采取这种做法，根本原因在于AI模型开发的高成本与政府补贴政策的激励机制之间的矛盾。DeepSeek V3的训练消耗了数万张高端GPU芯片，成本估算在10亿人民币级别。通过基于成熟开源模型进行微调，乐天可以大幅降低研发成本，同时通过声称自主研发来获取政府补贴，形成了"低成本获取、高补贴兑现"的不当利益链条。不容忽视的是，乐天的做法并非完全没有技术合理性。开源模型的微调和本地化优化是产业实践中的常见做法。将通用模型针对日语环境进行优化，增强对日本文化、俚语和本地场景的理解能力，这本身是有价值的技术工作。但关键区别在于是否遵守开源协议、是否透明标注来源。正确的做法应该是在项目申报和产品发布中清晰注明基础模型来源，说明自身的微调贡献，而不是隐瞒事实、删除版权信息。该事件的影响是多维度的。首先，它损害了乐天集团的企业信誉和品牌形象。在信息公开的时代，技术细节难以隐瞒，虚假宣传最终必然被揭露，代价是公众信任的丧失和舆论的批评。其次，事件暴露了政府补贴政策执行中的监管漏洞。如果申报单位可以通过隐瞒事实获取补贴，这将导致公共资源的浪费和不公平竞争。再次，这反映出国际开源社区对知识产权的保护需要深入加强，特别是在商业应用中。从更广阔的视角看，该事件也触及了全球AI产业竞争中的深层问题。中国开源项目的高质量和开放态度为全球开发者提供了宝贵资源，但这也可能被某些企业不当利用。日本作为技术强国，应当通过自身的创新能力和诚信态度来参与国际竞争，而非采取投机取巧的方式。同时，开源社区需要更有效的机制来确保其贡献得到尊重和保护。对此，业界和政策制定者都应采取行动。企业层面，应当建立更严格的合规审查机制，确保所有技术声明都经过充分验证。政府层面，补贴申报应当要求详细的技术来源说明，并进行第三方评估。开源社区层面，可以考虑采用更强有力的技术手段来追踪模型的使用和修改情况。

开源不是捷径的代名词，而是规则明确的合作契约。在大模型竞速的当下，更需要以事实为基础、以合规为底线、以可验证为标准，让创新回归工程与治理本身。唯有把"尊重规则"和"提升能力"同步推进，技术进步才能转化为长期竞争力，公共投入也才能获得应有的信任回报。

日本乐天涉嫌剽窃中国开源AI技术 政府补贴项目陷版权争议

日本乐天涉嫌剽窃中国开源AI技术政府补贴项目陷版权争议