微調 - Agents Report | 代理人報告

深度分析

Sentence Transformers 多模態嵌入微調實務：以 Qwen3‑VL‑Embedding‑2B 於視覺文件檢索的案例分析

隨著多模態AI擴張，研究者使用SentenceTransformers微調Qwen3‑VL‑Embedding‑2B於視覺文件檢索(VDR)。透過CachedMultipleNegativesRankingLoss與MatryoshkaLoss，模型NDCG@10從0.888提升至0.947，且在512維度仍保持效能。此成果證明領域微調可顯著提升特定檢索表現，為企業部署低延遲多模態檢索提供可行方案。