深度分析 PixelRAG 透過視覺檢索取代文字解析:架構、訓練與實驗成果 研究指出傳統文字解析在企業RAG中損失關鍵訊號,PixelRAG直接以螢幕擷取圖像作檢索,提升準確度最高18%。此法亦大幅降低代幣成本。研究團隊來自加州大學柏克萊、普林斯頓與EPFL,測試30億截圖覆蓋全維基,六項基準皆優於文字RAG。顯示視覺檢索的潛力。