划重点:
HonestAGI团队推出了一项研究,这项研究名为“模型指纹”,旨在揭示华为的盘古大模型涉嫌抄袭阿里的Qwen模型。然而,该研究的方法过于直接且缺乏细致,加之团队与参考文献存在造假之嫌,其真实性遭到了广泛的质疑。
华为诺亚方舟实验室官方已作出回应,随后,一位自称为内部员工的人士撰写了一篇名为《盘古之殇》的长篇文字,其中揭示了华为的盘古大模型涉嫌模仿、延续训练、清除水印等行为,这一事件再次引发了关于抄袭的激烈讨论。
面对技术飞速更新的时代,我们亟待构建一个更为科学、透明的模型评估体系;同时,如何在竞争激烈的环境中坚守技术诚信,以及在开源合作与商业利益之间寻求恰当的平衡,这些问题都是行业亟需认真思考的课题。
整个周末,关于“华为大模型涉嫌抄袭”的讨论不断涌现,频繁地出现在公众的视线中。
华为在6月30日公开发布了盘古大模型(Pangu Pro MoE),成为事件的焦点;而触发这一事件的导火索,是HonestyAGI在GitHub上发布的一项研究,该研究以论文形式进行了推理,指出盘古大模型涉嫌抄袭了阿里巴巴的通义千问Qwen-2.5 14B模型。
在研究中,HonestAGI提出了一种识别“模型指纹”(LLM-Fingerprint)的新方法,即通过分析模型注意力参数的标准差模式。该方法被用于对华为Pangu Pro MoE模型的来源进行深入分析。
研究揭示了核心成果,华为Pangu Pro MoE模型与Qwen-2.5 14B在标准差模式上展现出紧密的相关性,具体数值高达0.927,这一发现暗示了该模型或许并非从零开始训练,而是基于Qwen-2.5进行了优化升级。
除此之外,HonestAGI揭露了盘古大模型官方在GitCode平台发布的代码中,竟然意外地加入了Qwen 2024的授权协议。这一行为意在强调,盘古大模型开发过程中所使用的“transformers”组件的知识产权,归属于Qwen团队、阿里巴巴集团以及HuggingFace团队。
该研究公布后,立即招致了广泛讨论,一部分人坚信其提供的多角度证据足以证明盘古大模型对Qwen的抄袭行为;然而,另一方面,也有人对于“指纹”分析技术的专业性表示怀疑,并在项目的问题区域中引发了激烈的争论。
那么,这项研究的可靠性究竟如何,盘古大模型团队是否涉嫌抄袭,这些问题在重点君梳理完整个事件的始末后,仅从技术层面来看,便发现HonestAGI的研究中确实存在不少令人疑虑之处。接下来,我们将带领大家深入探究。
具体指出了哪些证据?
HonestyAGI开发的“指纹”模型,作为一种识别与区分模型的技术手段,致力于赋予模型独一无二的标识,以应对模型知识产权的维护、来源的追踪以及相似性分析等挑战。不同的“指纹”识别方法在实施途径和应用领域上存在各自的特点和区别。
团队专门针对大型语言模型,通过深入剖析各层注意力参数(如Q、K、V、O的投影矩阵)的标准差(σ),构建出一套独特的“指纹”识别系统。他们针对每个Transformer层提取关键矩阵,计算其标准差,并在此基础上进行跨层归一化处理,最终生成特征签名。此方法有效用于辨别模型的家族谱系。其特征涵盖:
·鲁棒性:能在大量持续训练后保留。
·内在性:由模型架构自然产生。

·简单性:仅需对参数矩阵使用torch.std()计算。
QKV偏置分析结果如下图所示:
观察结果表明,Pangu与Qwen2.5-14B在Q、K、V的投影偏差模式上几乎一致,早期层呈现出明显的特征峰值并随之趋于平稳,这一设计特点是Qwen 1-2.5代所独有的,而大多数开源模型(例如Qwen3)已经不再采用这种设计。
经过对注意力层归一化权重的深入分析,我们进一步证实了这些权重之间存在的高度相似性。在盘古和Qwen2.5-14B模型中,各层的性能表现呈现出高度的一致性,它们采用了相似的初始化策略,并经历了类似的收敛阶段。这一特点使得它们在行为模式上与Qwen2-57B-A14B和Qwen3-30A3B等模型有显著的不同。
此外,团队正致力于探究各层激活值的差异。为此,HonestAGI从The Pile测试集中随机选取了1000个样本批次(链接:https://pile.eleuther.ai/),并针对每一层计算了激活范数。在此过程中,团队还实施了统一的归一化策略。每个样本批次由8条序列组成,序列长度为1024。初步结果现已揭晓,结果显示盘古模型与文心模型的表现仍旧相近,这表明二者在计算方法上存在着诸多共同点。
为了检验“模型指纹”是否存在偶然性,HonestAGI对Qwen与混元A13B进行了对比分析。结果显示,两者在各个层级的表现存在显著差异,这表明它们的架构设计以及所获取的知识表示方式均存在本质区别。显而易见,HonestAGI提供这组对比数据,旨在证实其测试方法的可靠性。
然而,正如重点君在此前所提及的,众多人士对于HonestAGI团队所提出的“模型指纹”技术方法,在技术层面提出了各自的疑虑。
有人觉得这种方法过于简单直接,可能存在挑选数据样本的倾向,而且用参数的标准差来评估模型的相似性并不合理。在深度学习的领域中,模型结构的创新更为关键,而模型的参数则更多地依赖于计算能力和数据资源。华为具备足够的计算能力来重新训练大型模型,因此没有必要照搬Qwen的参数设置。
模型指纹存在不少问题,比如公开的模型对比样本数量有限,缺少大规模的基准测试;在相同参数量下,MoE 模型可能由于架构限制而呈现出相似的曲线,仅凭曲线相似性无法断定是否存在抄袭;此外,论文中的核心假设缺少权威文献的支撑。
对此,“模型指纹”研究团队也遭到了网友的诸多疑问。该论文的作者除了这篇论文之外,并无其他科研成果可供查阅。五位联名的作者既未留下邮箱地址,在Google Scholar上也未能找到任何相关信息。此外,作者声称自己是韩国学生,却使用outlook邮箱,且言谈间带有中式英语的痕迹,这让人对其身份的真实性产生了怀疑。
更有甚者,在所引用的文献资料中,竟然发现不少内容失实,这甚至导致部分读者怀疑整篇文章可能是通过人工智能技术所撰写而成。
Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40
地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com
Powered by PHPYun.