Template Constrained Decoding (TeCoD):提升 Text-to-SQL 準確度與效能的新框架

大型語言模型在 Text‑to‑SQL 上雖已顯著進步,但面對未見過的資料庫結構仍易產生錯誤。研究者推出 TeCoD,將歷史 NL‑SQL 配對轉為可重用模板,並以微調的自然語言推理模型快速匹配查詢,接著以文法限制的分割解碼確保 SQL 合法。實驗顯示,TeCoD 在正確率上較傳統方法提升最高 36%,執行延遲降低至 2.2 倍。

TeCoD提升SQL效能

背景說明

大型語言模型(LLM)已讓使用者能以自然語言查詢結構化資料,然而在實際部署時,尤其是面對複雜或未見過的資料庫結構,模型的正確率仍不穩定,且常產生無效的 SQL。

核心技術:Template Constrained Decoding (TeCoD)

TeCoD 透過兩大步驟提升 Text‑to‑SQL 的可靠性:

  1. 模板化處理:將過往的自然語言‑SQL 配對抽象為可重用的查詢模板,形成一套結構化的模式庫。
  2. 模板選擇與限制解碼:使用微調的自然語言推理模型(NLI)快速比對輸入查詢與模板,若不符合則直接拒絕。選定模板後,系統在生成 SQL 時套用文法限制的分割解碼策略,確保產出符合語法且執行效率高。

效能評估

在與標準 in‑context learning(ICL)比較的實驗中,TeCoD 在匹配查詢上達到最高 36% 的執行正確率提升,且平均延遲下降至原本的 2.2 倍,顯示出顯著的效能與可靠性優勢。

結論與未來方向

透過模板化與文法限制的結合,TeCoD 為 Text‑to‑SQL 系統在實務環境中的部署提供了更穩定且高效的解決方案。未來可進一步擴充模板庫,並探討跨領域資料庫的通用性。

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more