盤古大模型被指抄襲通義千問,HonestAGI團隊提出了哪些證據?
Answer
HonestAGI 團隊指控盤古大模型抄襲通義千問的證據
華為旗下的盤古大模型近日被匿名研究團隊 HonestAGI 指控抄襲阿里巴巴的通義千問模型,引發中國 AI 業界的廣泛關注。HonestAGI 團隊於 2025 年 7 月 4 日在 GitHub 上發布了一份技術報告,詳細闡述了其指控的依據。報告中,HonestAGI 團隊採用「模型指紋」技術,分析了華為盤古 Pro MoE 模型與阿里巴巴通義千問 Qwen-2.5 14B 模型的相似度。研究結果顯示,這兩個模型在注意力參數分佈上的平均相關性高達 0.927,遠遠超過了業界普遍認為正常的 0.7 閾值。
模型指紋技術與注意力參數分析
HonestAGI 團隊提出的「模型指紋」技術,通過分析各層注意力參數(Q、K、V、O 投影矩陣)的標準差,形成獨特的特徵簽名。該技術具有穩健性、內在性和簡單性三大特點。穩健性確保了特徵簽名在大量持續訓練後仍能保留;內在性意味著特徵簽名由模型架構自然產生;而簡單性則體現在只需對參數矩陣使用 torch.std() 進行計算。通過這種方法,HonestAGI 團隊發現盤古模型與 Qwen2.5-14B 在 QKV 偏置分析中呈現幾乎相同的模式,早期層出現特徵性峰值後收斂,而這個設計被認為是 Qwen 1-2.5 代獨有的特色。
版權聲明與內部爆料
更令人質疑的是,HonestAGI 團隊在盤古模型的開源代碼中發現了標注「Copyright 2024 The Qwen team, Alibaba Group」的版權聲明。此外,還有華為內部員工匿名爆料,揭露了模型開發過程中存在的「套殼」行為,並發布了「不自殺聲明」,使得這場爭議更加引人關注。這些證據共同指向了盤古大模型可能存在抄襲通義千問的行為,促使華為「諾亞方舟實驗室」迅速發布聲明,強調盤古 Pro MoE 開源模型是基於昇騰硬體平台開發、訓練的基礎大模型,並非基於其他廠商模型增量訓練而來。
爭議的後續發展
這起抄襲事件不僅引發了技術層面的激烈辯論,更引發了對於中國 AI 產業發展模式的深層次思考。無論最終結果如何,這場爭議都將對華為以及整個中國 AI 產業產生深遠的影響。