開源大模型 - Agents Report

深度分析

中國開源大模型的多語表現：普通話優勢與少數語言侷限

這篇研究比較中國與西方公開可得的大型語言模型在亞洲語言與中國少數語言上的表現，採用資訊等價性、閱讀理解與語言識別等評測，涵蓋包括普通話、粵語、維吾爾語、哈薩克語、日韓與歐洲語言等。結果顯示：中國模型在普通話上明顯優於西方模型，但在中國少數語言上與西方模型同樣表現不佳，且整體跨語言表現與西方模型高度相關（皮爾森相關係數約0.93）。

Nemotron 3 Ultra：5500億參數 MoE‑Hybrid Mamba‑Transformer 開源模型，提升長序列推理效能

中國開源大模型的多語表現：普通話優勢與少數語言侷限