深度分析
單階段稀疏檢索(SSR)以稀疏自編碼取代 K‑means 的多向量檢索新方案
多向量檢索精度高,但需大量記憶體與聚類成本。研究提出單階段稀疏檢索(SSR),以稀疏自編碼取代 K‑means,使用倒排索引。實驗顯示索引時間縮減 15 倍、檢索延遲減半,且效能超越現有基準。在 BEIR 基準測試中,nDCG@10 提升 2.2%,檢索延遲僅 17.5 毫秒。
深度分析
多向量檢索精度高,但需大量記憶體與聚類成本。研究提出單階段稀疏檢索(SSR),以稀疏自編碼取代 K‑means,使用倒排索引。實驗顯示索引時間縮減 15 倍、檢索延遲減半,且效能超越現有基準。在 BEIR 基準測試中,nDCG@10 提升 2.2%,檢索延遲僅 17.5 毫秒。
深度分析
多模態檢索常用單一向量(single-vector)做全域比對,但會壓縮掉局部證據,影響細節敏感任務的準確度。
深度分析
研究檢視視覺RAG在表格為主的財務文件上,將視覺patch壓縮成單向量是否遺失關鍵數值。作者用兩個財務測試集和多種聚合策略,結果顯示平均或最大池化無法辨別細微數字或文本變動,主因在於背景版面或格線的全域紋理主導,建議採多向量或學習型聚合以降低檢索風險。