速報 LatentGym:可控潛在結構的跨任務學習基準平台 為解決大型語言模型在跨任務適應上的不足,研究者建構了 LatentGym 測試平台,透過真實潛在變數控制任務結構,分離探索與利用指標。實驗證實前沿模型在相關任務上仍易失效,事後訓練可提升適應力,且回饋設計影響學習動態。此基礎設施為未來個人化與互動式 AI 的可靠適應提供了可量化的研究基礎。