推理效能

大型模型推理效能提升

速報

前沿大型模型無思考鏈推理效能翻倍　GPT‑5.5 兩分鐘內完成 50% 任務

研究測試前沿 AI 模型在不使用思考鏈（CoT）下的推理表現，涵蓋數學、程式、謎題等 43 項基準。結果顯示，模型的 50% 任務完成時間每年翻倍，GPT‑5.5 已超過 3 分鐘且需 1,500 以上推理 token。此趨勢若持續，預估 2028 年完成時間將超過 7 分鐘，對安全監控構成挑戰。

Chain-in-Tree 分支必要性 LLM

深度分析

Chain-in-Tree：以分支必要性提升 LLM 樹搜尋效能的框架

研究聚焦於大型語言模型在樹搜尋推理的效率問題，提出Chain-in-Tree框架以輕量BN評估決定分支時機，實驗在GSM8K與Math500上削減75%至85%運算成本且精度保持，顯示此技術可顯著提升AI推理效能。