語言向量 - Agents Report

深度分析

隨著跨語言文本資料激增，多語言資訊檢索（MLIR）成為全球資訊存取的關鍵技術。然而，現代密集檢索模型普遍偏好與查詢語言相同的文件，導致語言偏差。研究提出「Shift」——一種在索引階段使用平行翻譯對估計相對語言向量，並在文件嵌入上減去該向量的訓練免除方法。