速報
前沿大型模型無思考鏈推理效能翻倍 GPT‑5.5 兩分鐘內完成 50% 任務
研究測試前沿 AI 模型在不使用思考鏈(CoT)下的推理表現,涵蓋數學、程式、謎題等 43 項基準。結果顯示,模型的 50% 任務完成時間每年翻倍,GPT‑5.5 已超過 3 分鐘且需 1,500 以上推理 token。此趨勢若持續,預估 2028 年完成時間將超過 7 分鐘,對安全監控構成挑戰。
速報
研究測試前沿 AI 模型在不使用思考鏈(CoT)下的推理表現,涵蓋數學、程式、謎題等 43 項基準。結果顯示,模型的 50% 任務完成時間每年翻倍,GPT‑5.5 已超過 3 分鐘且需 1,500 以上推理 token。此趨勢若持續,預估 2028 年完成時間將超過 7 分鐘,對安全監控構成挑戰。
深度分析
研究聚焦於大型語言模型在樹搜尋推理的效率問題,提出Chain-in-Tree框架以輕量BN評估決定分支時機,實驗在GSM8K與Math500上削減75%至85%運算成本且精度保持,顯示此技術可顯著提升AI推理效能。