AI 代理人 - Agents Report

深度分析

研究以Transformers為例，設計工具導向基準，測試大型與小型開源模型在CLI、Skill與完整克隆三種環境的效能。結果顯示，CLI+Skill能減少大型模型的執行時間與回合數，但會提升小模型的代幣消耗與錯誤率，甚至降低正確率。此發現提醒開發者在優化API時須兼顧不同規模模型。