深度分析 Proto-LeakNet:結合訊號洩漏與時間注意力的生成式人臉影像來源辨識框架 隨著生成式模型日益逼真,辨識來源成關鍵挑戰。Proto‑LeakNet透過擷取擴散模型潛在空間的訊號洩漏,結合時間注意力與原型頭,實現閉集分類與開集密度評估。實驗顯示其在後處理下仍維持高達98%的MacroAUC,提升了對未知生成器的可解釋追蹤能力。
速報 指令向量導向大規模音頻語言模型:提升時間注意力與事件定位 研究者提出「指令向量導向」技術,透過比較不同指令提示下的模型激活,於固定音訊中生成導向向量,顯著改變大型音頻語言模型(LALM)的時間注意力分布,使其聚焦於聲音相關區段。