閱讀紀錄

隱藏 →
此記錄會在頁面關閉後消失

盤古大模型被指抄襲通義千問,HonestAGI團隊提出了哪些證據?

Answer

HonestAGI 團隊指控盤古大模型抄襲通義千問的證據

華為旗下的盤古大模型近日被匿名研究團隊 HonestAGI 指控抄襲阿里巴巴的通義千問模型,引發中國 AI 業界的廣泛關注。HonestAGI 團隊於 2025 年 7 月 4 日在 GitHub 上發布了一份技術報告,詳細闡述了其指控的依據。報告中,HonestAGI 團隊採用「模型指紋」技術,分析了華為盤古 Pro MoE 模型與阿里巴巴通義千問 Qwen-2.5 14B 模型的相似度。研究結果顯示,這兩個模型在注意力參數分佈上的平均相關性高達 0.927,遠遠超過了業界普遍認為正常的 0.7 閾值。

模型指紋技術與注意力參數分析

HonestAGI 團隊提出的「模型指紋」技術,通過分析各層注意力參數(Q、K、V、O 投影矩陣)的標準差,形成獨特的特徵簽名。該技術具有穩健性、內在性和簡單性三大特點。穩健性確保了特徵簽名在大量持續訓練後仍能保留;內在性意味著特徵簽名由模型架構自然產生;而簡單性則體現在只需對參數矩陣使用 torch.std() 進行計算。通過這種方法,HonestAGI 團隊發現盤古模型與 Qwen2.5-14B 在 QKV 偏置分析中呈現幾乎相同的模式,早期層出現特徵性峰值後收斂,而這個設計被認為是 Qwen 1-2.5 代獨有的特色。

版權聲明與內部爆料

更令人質疑的是,HonestAGI 團隊在盤古模型的開源代碼中發現了標注「Copyright 2024 The Qwen team, Alibaba Group」的版權聲明。此外,還有華為內部員工匿名爆料,揭露了模型開發過程中存在的「套殼」行為,並發布了「不自殺聲明」,使得這場爭議更加引人關注。這些證據共同指向了盤古大模型可能存在抄襲通義千問的行為,促使華為「諾亞方舟實驗室」迅速發布聲明,強調盤古 Pro MoE 開源模型是基於昇騰硬體平台開發、訓練的基礎大模型,並非基於其他廠商模型增量訓練而來。

爭議的後續發展

這起抄襲事件不僅引發了技術層面的激烈辯論,更引發了對於中國 AI 產業發展模式的深層次思考。無論最終結果如何,這場爭議都將對華為以及整個中國 AI 產業產生深遠的影響。

你想知道哪些?AI來解答

HonestAGI團隊如何使用「模型指紋」技術來分析盤古大模型與通義千問的相似度?

more

「模型指紋」技術的穩健性、內在性和簡單性如何確保其有效性?

more

華為盤古大模型的開源代碼中為何會出現阿里巴巴通義千問團隊的版權聲明?

more

華為內部員工爆料的「套殼」行為對盤古大模型的抄襲指控有何影響?

more

華為「諾亞方舟實驗室」如何回應盤古 Pro MoE 模型抄襲通義千問的指控?

more

你覺得這篇文章有幫助嗎?

likelike
有幫助
unlikeunlike
沒幫助
reportreport
回報問題
view
2
like
0
unlike
0
分享給好友
line facebook link