注意力滾動 - Agents Report

深度分析

隨著大型轉換器語音辨識模型精度提升，可解釋性仍不足。研究提出LEAF‑X，透過熵導向注意力加權與多層滾動，產生稀疏且時間定位精準的token‑to‑frame解釋，實驗顯示在Faithfulness、Locality與Stability上較既有方法提升30%以上。