深度分析
利用多臂強盜與彈性序列平行,Spotlight 大幅加速 Diffusion Transformer RL 訓練
DiT強化學習後訓練成本高,研究提出Spotlight系統,同步利用閒置的SpotGPU進行種子探索,並採用彈性序列平行與搶占感知排程,允許探索階段使用前一迭代的舊模型權重保留相對排名,實測可在相同驗證分數下提速至4倍,總成本降低1.4至6.4倍,同時提升影像品質。
深度分析
DiT強化學習後訓練成本高,研究提出Spotlight系統,同步利用閒置的SpotGPU進行種子探索,並採用彈性序列平行與搶占感知排程,允許探索階段使用前一迭代的舊模型權重保留相對排名,實測可在相同驗證分數下提速至4倍,總成本降低1.4至6.4倍,同時提升影像品質。
深度分析
隨著多模態生成模型的廣泛應用,內容安全與版權風險同步升高。
深度分析
隨著文字生成圖像模型追求更高語意對齊,生成多樣性卻日益受限。研究提出在 DiffusionTransformer的多模態注意力通道中即時施加情境空間排斥,於結構已形成但構圖未定前引導生成路徑。實驗顯示此法可在不犧牲影像品質與語意符合度的前提下,顯著提升輸出多樣性,且計算開銷極低。
條件流匹配生成模型
計算流體力學模擬成本高,研究提出 FluidFlow 生成模型以條件流匹配取代傳統擴散,直接在結構化與非結構化網格上學習。模型結合 U‑Net 與 DiT,於氣動外形與全機三維測試中取得低誤差與佳泛化,顯示其在工程應用的可行性。