LLM 多步推理 - Agents Report

深度分析

隨著大型語言模型在複雜推理上仍受限，研究提出 ReTreVal 結合思考樹、批判式自我精煉與反思記憶，動態調整樹深度並雙重驗證每個節點。實驗顯示在500題數學與創意寫作測試中，平均分數分別提升至6.92與7.88，顯著超過 ReAct、Reflexion 與 Self‑Refine。