深度學習優化器 - Agents Report

深度分析

雙重預處理（DoPr）優化器：結合梯度與激活預處理減緩測試時回饋誤差

本研究聚焦於深度學習的測試時回饋問題，提出雙重預處理 (DoPr) 結合梯度與激活預處理，以降低誤差累積。實驗顯示在語言生成與機器人控制等多項任務上，DoPr 可提升下游表現，且不必改變資料或模型結構。此法可直接套用 Adam 或 Muon，為長序列生成的分布漂移提供新思路，預期影響未來訓練與部署實踐。