Andrej Karpathy 開源的 AutoResearch 工具,其核心的 630 行 Python 程式碼,是如何實現讓 AI 自主生成、執行與優化實驗的? | 數位時代

AutoResearch 的運作方式

AutoResearch 透過一個循環迭代的過程,讓 AI 能夠自主生成、執行與優化實驗。首先,研究人員提供一個目標,例如提高語言預測的準確性,並設定一個衡量標準,例如預測錯誤率。AI 接收到目標後,會開始自主迭代,包括生成假設、執行實驗、評估結果,並進行下一輪迭代。

AI 自主迭代的步驟

在生成假設階段,AI 會修改程式碼,例如調整模型的層數或學習速率。接著,AI 會在電腦上執行訓練,測試不同組合的效果。完成實驗後,AI 會根據預設的指標來評估結果,決定哪些修改有效,哪些需要捨棄。最後,AI 會保留有效的修改,並生成新的假設,繼續測試,形成一個「生成→測試→評估→優化→再生成」的循環。

AutoResearch 的優勢與應用

AutoResearch 的強大之處在於它不僅僅是自動化,而是展現了 AI 自主迭代的潛力。透過規範訓練時間,讓各個實驗的結果可以公平比較,降低硬體門檻,讓預算有限的個人研究者也能使用。卡帕西利用 AutoResearch 在兩天內對 nanochat 進行了約 700 次實驗,發現了 20 項可以改善的要點。Shopify 執行長也使用 AutoResearch 優化了核心模板引擎 Liquid,獲得了顯著的效能提升與記憶體優化。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容