深度分析 Agentic AI 時代:Transformers 開源模型工具效能基準與大型/小型模型比較 研究以Transformers為例,設計工具導向基準,測試大型與小型開源模型在CLI、Skill與完整克隆三種環境的效能。結果顯示,CLI+Skill能減少大型模型的執行時間與回合數,但會提升小模型的代幣消耗與錯誤率,甚至降低正確率。此發現提醒開發者在優化API時須兼顧不同規模模型。