勤業眾信澳洲AI報告中,具體出現了哪些「AI幻覺」的錯誤案例?
Answer
勤業眾信澳洲AI報告中「AI幻覺」的具體錯誤案例
勤業眾信澳洲分公司在為澳洲就業與工作場所關係部門 (DEWR) 製作的福利津貼支付審查報告中,由於使用了生成式AI語言模型 Azure OpenAI GPT-4o 協助撰寫,出現了多項「AI幻覺」的具體錯誤,導致報告內容失實。
AI 幻覺的錯誤類型
報告中出現了以下幾種主要的「AI幻覺」錯誤:
- 捏造聯邦法院判決引文: 報告中虛構了一個名為「Amato 控訴聯邦政府」的案件,但實際上並不存在此案件。
- 引用不存在的學術研究論文: 報告中引用了多篇虛假的學術研究論文,這些論文實際上並不存在,相關的參考資料均為捏造。
- 錯誤引用聯邦法官言論: 報告中錯誤地引用了超過 10 位聯邦法官的言論,聲稱這些言論出自相關法官之口,但實際上並非如此。
事件後續與警示
勤業眾信澳洲分公司承認報告中存在「部分註腳和參考資料不正確」的問題,並發布了修訂版本,將所有錯誤引用的內容移除。同時,他們也坦承使用了生成式 AI 語言模型輔助撰寫報告。作為補償,勤業眾信同意部分退還之前收取的 44 萬澳元報告費用。此事件突顯了 AI 技術在提高效率的同時,也存在產生不準確內容的風險,提醒業界在擁抱 AI 轉型時,必須謹慎應對 AI 技術不成熟帶來的挑戰,並加強人工查核的重要性,以避免對信譽造成嚴重損害。