经过一天的行业广泛讨论,华为的人工智能大型模型研发团队现已正式对盘古开源模型涉嫌模仿他人作品的问题作出回应。
7月5日午后,华为公司下属的AI大型语言模型盘古Pro MoE的技术研发团队“诺亚方舟实验室”对外公布了一则公告,指出盘古Pro MoE开源版本是在昇腾硬件平台上进行开发与训练的大型基础模型,并非通过其他厂商的模型进行增量训练所得。
我们留意到最近在开源社区和网络平台上,大家对盘古大模型开源代码的讨论十分热烈。盘古Pro MoE开源模型,系依托昇腾硬件平台进行开发与训练的大型模型,非源自其他厂商模型的增量训练。它在架构设计和技术特性上实现了关键性的创新。作为全球首个专为昇腾硬件平台量身打造的同规格混合专家模型,该模型创新性地引入了分组混合专家模型(MoGE)架构。这一架构有效地解决了大规模分布式训练中的负载均衡难题,显著提高了训练效率。关于其他技术特性的创新之处,请查阅昇腾生态竞争力系列技术报告中公开的信息。华为盘古团队如是说明。
盘古团队强调,"盘古Pro MoE开源模型在构建过程中,其部分基础组件的代码编制借鉴了业界的开源经验,并使用了其他开源大型模型的部分开源代码。我们严格遵守开源许可证的规定,在开源代码文件中明确标示了开源代码的版权信息。这一做法不仅是开源社区的普遍行为,而且也体现了业界推崇的开源合作理念。"
盘古Pro MoE的技术研发团队明确指出,他们一贯秉持着开放和创新的姿态,对第三方的知识产权表示尊重,并且大力倡导包容、公平、开放、团结以及可持续发展的开源精神。对于全球的开发者和合作伙伴对盘古大模型的关注与支持,团队表示衷心的感谢,并且对开源社区提出的建设性意见给予了高度重视。期望借助盘古大模型的开源,携手志趣相投的同行,共同挖掘并持续提升模型效能,从而加快技术革新与产业应用的步伐。
据了解,华为公司于2012年成立了名为诺亚方舟的人工智能研究机构,并聘请了来自全球的科研人员开展基础性研究。该实验室依托迁移学习等技术创新手段,为盘古大模型等关键项目提供了核心算法的支撑。目前,诺亚方舟实验室的主要职责是负责华为盘古大语言模型(LLM)系列产品的研发任务。
2021年,华为云推出了盘古系列预训练的大型模型,这些模型涵盖了自然语言处理(NLP)领域、计算机视觉(CV)领域以及科学计算领域。
今年6月21日,华为云推出了盘古大模型5.0版本,该版本涵盖了多种参数配置的模型。其中,拥有十亿级参数的Pangu E系列模型,能够支持手机、PC等终端设备的智能应用;百亿级参数的Pangu P系列模型,适合低延迟、低成本的计算场景;此外,还有千亿级参数的Pangu U系列和万亿级参数的Pangu S系列超级大模型。这些模型旨在帮助企业更有效地在各个场景中应用人工智能技术。
6月30日,华为正式对外透露,其开源了包含70亿参数的盘古稠密模型、720亿参数的盘古Pro MoE混合专家模型,以及昇腾架构下的模型推理技术,并同步发布了相关的研究论文。华为强调,这一行动是公司贯彻落实昇腾生态战略的重要步骤,旨在促进大模型技术的深入研究与创新进步,同时加快人工智能技术在各行各业中的应用推广和价值实现。
然而,华为推出的盘古Pro MoE模型遭到了质疑,人们认为它可能模仿了阿里云的通义千问Qwen-2.5 14B模型。
7月4日,GitHub上发布的一项研究显示,华为的盘古Pro MoE模型(拥有720亿参数)运用了LLM-Fingerprint技术,其注意力参数分布与阿里通义千问Qwen-2.5 14B模型呈现出极高的相似度,平均相关系数高达0.927,几乎与完全一致的1.0相媲美,这一数值明显超出了模型之间应有的正常差异,暗示着“非独立开发”的嫌疑。
作者声称自己是来自哥斯达黎加大学的韩国籍学生。他提到,在盘古开源代码文件中,有标注显示“版权所有2024年,Qwen团队,阿里巴巴集团”,这引发了对其在涉嫌复制阿里代码时未移除版权声明的质疑。

截至发稿前,上述GitHub库已经删除。
华为诺亚方舟实验室在最新发布的声明中明确否认了抄袭的指控,强调这是对开源组件的合理引用,并且已经按照规定进行了合规的标注,完全符合开源协议的相关要求。
该事件在短短一日内受到了广泛关注,社交平台上涌现出众多讨论。在知乎上,众多帖文指出,该GitHub作者将大语言模型中每个transformer层的QKVO参数的标准差进行整合,构建成特征向量。作者将此模型命名为“指纹”,并据此计算不同大语言模型之间的距离,将其作为相似度的衡量标准。这种逻辑途径无法评估模型的相似程度,同时,仅凭参数标准差来做出判断,本身并不是一种科学的手段。
发稿截止之时,阿里Qwen尚未作出任何官方表态。然而,据我所知,众多知名企业的AI研究小组正密切监视这一事件的动态。
抄袭事件再次揭示了AI大型模型在开源方面的定义不明确、协议规则和法律界限存在一定程度的模糊性,以及开源模型和代码协议的混乱状况。
通常来说,开源并不意味着版权不存在,第三方在使用时必须遵守相应的开源许可条款。若企业打算将开源代码用于商业目的,就必须获得开源项目的授权或许支付相应费用。从法律角度讲,大模型的所有者能够通过申请专利、注册商标或版权等手段来维护自身的大模型知识产权。
开源领域的众多资深专家曾向笔者透露,在使用开源项目时,需特别注意以下两点:首先,必须明确指出原作者的身份,所使用的是哪个具体项目,并严格遵守该项目的开源协议和作者的相关声明,不得擅自修改或删除内容;其次,要关注项目的商业化边界,有的项目适合用于商业用途,而另一些则明确禁止商业化使用或二次开发,这要求开发者进行必要的沟通与评估。
在此阶段,有关零一万物开源大模型Yi-34B涉嫌采用Meta LIama开源模型架构的质疑之声不绝于耳,同时,斯坦福大学的Llama3-V项目被指模仿了面壁智能研发的MiniCPM-Llama3-V 2.5等案例,这些事件都引起了开发者群体的广泛关注。
William Wong,作为未知资本的常务董事,曾指出众多初创企业仅通过将GPT接入后台,并设计一个简单的UI界面便在苹果商店上架,宣称自己从事生成式AI的创业。他坚信这类生成式AI项目缺乏技术门槛和商业策略,不过是借势炒作。
随着DeepSeek-R1/V3这一开源AI模型在全球范围内广受欢迎,自研的大模型技术因其高昂成本而备受关注,众多AI模型与应用背后均可见DeepSeek的踪迹。因此,未来如何明确开源AI模型的边界,确保开源技术的健康发展与有序推进,已成为业界亟需解决的关键问题。
华为云透露,在过去的一年里,盘古大模型已成功应用于超过30个行业和400多个具体场景,其在政府服务、金融业、制造业、医药研发、煤矿开采、钢铁生产、铁路运输、自动驾驶技术、工业产品设计、建筑设计以及气象预报等多个领域展现出了显著的作用和价值。(本文在钛媒体App首次发布,作者为林志佳,编辑为盖虹达。)
Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40
地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com
Powered by PHPYun.