深度分析
安全向量驅動的生成式 AI 跨模型控制:降低 30%~50% 攻擊成功率
隨著生成式模型的安全需求提升,研究探討安全向量能否跨模型搬移。提出以安全/不安全提示學得的方向,透過僅安全資料的對齊映射,移植至不同影像與影片生成器。實驗顯示在多模型間可顯著降低攻擊成功率,同時維持圖像品質。此外,研究還提出多向量擴展以捕捉類別特定的安全行為,驗證了安全表示的模組化特性。
深度分析
隨著生成式模型的安全需求提升,研究探討安全向量能否跨模型搬移。提出以安全/不安全提示學得的方向,透過僅安全資料的對齊映射,移植至不同影像與影片生成器。實驗顯示在多模型間可顯著降低攻擊成功率,同時維持圖像品質。此外,研究還提出多向量擴展以捕捉類別特定的安全行為,驗證了安全表示的模組化特性。
深度分析
文字到影像的擴散模型雖生成力強,卻對提示語句極為敏感。研究者利用基因演算法直接演化 CLIP 代幣向量,並以美學預測與 CLIPScore 結合的適應度函數進行優化。實驗在 36 個 Parti Prompt 上較基線方法提升最高 23.93%,證明此方法在提示自動化上具潛力。