推理痕跡

深度分析

在內容審查等價值導向任務中，傳統多代理系統僅以投票求共識，忽視了推理痕跡的差異。研究提出將推理痕跡抽象為四種符號化爭議狀態，並以可撤銷的路由規則決定自動、說明、索取上下文或升級。實驗顯示此框架在六項VQA基準與內容審查測試中提升了可靠性與可解釋性。

速報

研究針對語言模型產出的長推理痕跡是否過度冗長。作者提出「最小核心」概念，透過壓縮比、冗餘質量等指標，抽出保存答案或預測分布的最少步驟。結果顯示平均可刪除46%步驟且86%情況保留原答案，核心三步貢獻65%必要性。此外最小核心在區分正誤痕跡、降維與跨模型移轉上也有明顯改善。