閱讀紀錄

隱藏 →
此記錄會在頁面關閉後消失

DeepSeek-OCR 的「記憶刻度」機制,如何模擬人類遺忘來處理長文件與對話歷史,並節省算力?

Answer

DeepSeek-OCR 的「記憶刻度」機制:模擬人類遺忘以處理長文件並節省算力

DeepSeek-OCR 是由中國 AI 公司 DeepSeek 於 2025 年 10 月 21 日推出的一款光學文字辨識系統。該系統的核心技術在於將文字文件視為「影像」進行高效率壓縮,再交由語言模型處理。透過這種「影像壓縮 + 少量 token」的策略,DeepSeek-OCR 能夠在處理長文件、跨頁表格、圖形理解以及跨語言文件抽取方面展現出優勢。

「光學壓縮」技術與「記憶刻度」概念

DeepSeek-OCR 的核心在於其「光學壓縮」技術,該技術可以將寫滿文字的圖片壓縮高達 10 倍,同時保留約 97% 的資訊。此外,DeepSeek-OCR 還引入了「記憶刻度」的概念,模擬人類的遺忘機制。系統會將較舊的聊天內容以低解析度保存,如同人類記憶隨時間衰退一般,資料越久、越遠,解析度越低,呈現也越模糊。

技術細節與效能

DeepSeek-OCR 在技術上將文件視為圖片處理,並使用兩個擅長不同工作的模型分工合作,再透過一個「16 倍壓縮器」大幅減少需要計算的資料量。在效能方面,DeepSeek-OCR 宣稱單顆 Nvidia A100 GPU 每日可處理約 20 萬頁資料;若以 20 台伺服器、每台 8 顆 A100 組成叢集,日處理量可達 3,300 萬頁。此外,DeepSeek 官方還開放了程式碼與模型權重,讓生態系可以驗證與擴充此技術。

你想知道哪些?AI來解答

DeepSeek-OCR 的「記憶刻度」機制是什麼?

more

DeepSeek-OCR 的「光學壓縮」技術如何實現高效率的文件處理?

more

「記憶刻度」機制如何模擬人類遺忘來優化長文件處理?

more

DeepSeek-OCR 在長文件、跨頁表格和圖形理解方面有哪些優勢?

more

DeepSeek-OCR 的效能表現如何?每日可處理多少頁資料?

more

你覺得這篇文章有幫助嗎?

likelike
有幫助
unlikeunlike
沒幫助
reportreport
回報問題
view
1
like
0
unlike
0
分享給好友
line facebook link