深度分析 「Shift」索引端特徵轉換:降低多語言資訊檢索語言偏差的實證研究 隨著跨語言文本資料激增,多語言資訊檢索(MLIR)成為全球資訊存取的關鍵技術。然而,現代密集檢索模型普遍偏好與查詢語言相同的文件,導致語言偏差。研究提出「Shift」——一種在索引階段使用平行翻譯對估計相對語言向量,並在文件嵌入上減去該向量的訓練免除方法。