DeepSeek-OCR 如何利用兩個不同專長的模型來處理文件影像,並透過「16 倍壓縮器」達成效率提升?
Answer
DeepSeek-OCR 如何運用雙模型與 16 倍壓縮器提升效率
DeepSeek-OCR 採用獨特的光學壓縮技術,將文件視為影像進行處理,有效提升文件處理效率。此技術透過雙模型分工合作,並利用 16 倍壓縮器大幅減少需要運算的資料量。光學壓縮能將文件圖片壓縮高達 10 倍,同時保留約 97% 的資訊,有效處理長文件、跨頁表格以及多語言文件。
雙模型分工與光學壓縮技術
DeepSeek-OCR 的核心在於其將文件視為圖片處理的方式。透過光學壓縮技術,系統能將文件影像壓縮,減少資料處理量。此外,DeepSeek-OCR 採用了兩個各有所長的模型,分工合作處理文件影像,優化整體效能。接著,16 倍壓縮器則進一步減少需要計算的資料量,提升處理速度。
記憶刻度機制與效能表現
為更有效管理資訊,DeepSeek-OCR 引入「記憶刻度」機制,模仿人類記憶的遺忘曲線。系統會降低舊有內容的解析度,將運算資源集中於重要資訊上。根據官方數據,DeepSeek-OCR 在單顆 Nvidia A100 GPU 上每日可處理約 20 萬頁資料,若使用包含多台伺服器的叢集,日處理量更可達 3,300 萬頁。DeepSeek 亦開放程式碼與模型權重,有助於技術驗證和擴充。