深度分析 LEAF‑X:以熵導向注意力提升 Transformer 語音辨識的可解釋性與時間定位精準度 隨著大型轉換器語音辨識模型精度提升,可解釋性仍不足。研究提出LEAF‑X,透過熵導向注意力加權與多層滾動,產生稀疏且時間定位精準的token‑to‑frame解釋,實驗顯示在Faithfulness、Locality與Stability上較既有方法提升30%以上。