深度分析 雙重預處理(DoPr)優化器:結合梯度與激活預處理減緩測試時回饋誤差 本研究聚焦於深度學習的測試時回饋問題,提出雙重預處理 (DoPr) 結合梯度與激活預處理,以降低誤差累積。實驗顯示在語言生成與機器人控制等多項任務上,DoPr 可提升下游表現,且不必改變資料或模型結構。此法可直接套用 Adam 或 Muon,為長序列生成的分布漂移提供新思路,預期影響未來訓練與部署實踐。