深度分析
Rasa 稀疏關係感知注意力:突破 Transformer 多跳推理瓶頸
Transformer 在多跳關係推理上受限於電路複雜度,需要 Ω(k) 層深度。研究提出 Rasa(Relation‑Aware Sparse Attention)加入稀疏鄰接遮罩與關係類型偏置,將注意力搜尋空間從 2^{n^2} 縮減至 2^{m}。在 MetaQA 3‑跳問題上達到 97.7% 正確率,較 EmbedKGQA 提升近 3 個百分點。
深度分析
Transformer 在多跳關係推理上受限於電路複雜度,需要 Ω(k) 層深度。研究提出 Rasa(Relation‑Aware Sparse Attention)加入稀疏鄰接遮罩與關係類型偏置,將注意力搜尋空間從 2^{n^2} 縮減至 2^{m}。在 MetaQA 3‑跳問題上達到 97.7% 正確率,較 EmbedKGQA 提升近 3 個百分點。
深度分析
Transformer在語言與多模態任務上表現卓越,但面對需要沿著圖結構連續追溯關係的多跳推理仍有架構性限制。論文從電路複雜度角度指出,標準Transformer屬於TC0類別,常數深度無法解決圖連通性,因而需要隨跳數成長的層數。