深度分析 ReTreVal:以思考樹與批判式驗證提升 LLM 多步推理效能 隨著大型語言模型在複雜推理上仍受限,研究提出 ReTreVal 結合思考樹、批判式自我精煉與反思記憶,動態調整樹深度並雙重驗證每個節點。實驗顯示在500題數學與創意寫作測試中,平均分數分別提升至6.92與7.88,顯著超過 ReAct、Reflexion 與 Self‑Refine。