深度分析
多代理系統的爭議感知路由:以推理痕跡作為知識表徵的四種狀態分析
在內容審查等價值導向任務中,傳統多代理系統僅以投票求共識,忽視了推理痕跡的差異。研究提出將推理痕跡抽象為四種符號化爭議狀態,並以可撤銷的路由規則決定自動、說明、索取上下文或升級。實驗顯示此框架在六項VQA基準與內容審查測試中提升了可靠性與可解釋性。
深度分析
在內容審查等價值導向任務中,傳統多代理系統僅以投票求共識,忽視了推理痕跡的差異。研究提出將推理痕跡抽象為四種符號化爭議狀態,並以可撤銷的路由規則決定自動、說明、索取上下文或升級。實驗顯示此框架在六項VQA基準與內容審查測試中提升了可靠性與可解釋性。
速報
研究針對語言模型產出的長推理痕跡是否過度冗長。作者提出「最小核心」概念,透過壓縮比、冗餘質量等指標,抽出保存答案或預測分布的最少步驟。結果顯示平均可刪除46%步驟且86%情況保留原答案,核心三步貢獻65%必要性。此外最小核心在區分正誤痕跡、降維與跨模型移轉上也有明顯改善。