速報多代理系統企業 AI DAG 計畫 ReAct

企業級 AI 多代理系統：DAG 計畫與 ReAct 的規模效能比較

企業 AI 需要持續監控與自動化。研究比較 DAG Plan and Execute 與 ReAct 兩種多代理架構，測試 208 個情境跨小至全企業規模。結果顯示規模是主要瓶頸，DAG 在小規模精度高，ReAct 更具彈性；任務管理器可大幅降低延遲並提升事件正確率。

19 Jun 2026 — 2 min read

研究背景與目標

企業級人工智慧正朝向持續事件監控、偵測與自動化行動發展，然而現有的多代理系統多假設離散的請求—回應流程，缺乏在大規模企業環境下的實證。

本次實驗比較兩種架構：

共使用 208 個來源於真實生產環境的企業情境，分為 Persona（少於 10 個代理）、Department（20~80 個）與 Enterprise（約 200 個）三個規模層級。

為了支援持續運作，我們加入一個任務管理器，負責優先順序推論、相關事件合併與搶占機制。

結果顯示，系統規模而非任務複雜度主導協調效能。小規模下兩種架構皆表現良好；但在企業規模時，代理發現的噪聲成為主要瓶頸，且簡單任務的效能下降幅度大於複雜任務。

DAG Plan and Execute 在小規模提供較高精度與結構化平行化，但其較高的運算開銷在大規模時加劇效能衰退。ReAct 則因能逐步處理失敗而顯得更具韌性。

引入任務管理器後，高優先序佇列的延遲降低 14% 至 75%，相關事件的正確率提升超過 20 個百分點，顯著改善企業級 AI 系統的即時反應能力。

原始來源：ArXiv AI

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

在客戶服務領域，工具呼叫代理人常因隱性任務狀態導致決策錯誤。研究提出LedgerAgent，於推論時以結構化分類帳保存工具回傳，並在執行環境變更前以策略門檻檢查。實驗顯示在四個服務領域與多模型測試中，Pass^k提升顯著，特別在多回合一致性上表現最佳。

FP4 訓練因成本壓力受矚目，E2M1 格式固有收縮偏差導致層間信號衰減，RHT 進一步放大此問題。UFP4 以均勻 E1M2/INT4 網格結合全域 RHT，僅在 dY 上使用隨機捨入，顯著降低 BF16 相對損失，建議未來硬體支援均勻 4 位元作為第一類訓練原語。

在動態雲端與邊緣環境中，成本最小化常受效能約束限制。MAMO以兩層多代理架構，分別學習任務執行與獎勵權重自適應，使系統可在無人工調整下平衡成本與QoS。實驗於FaaS邊緣縮放情境證明，MAMO能自動調整權重，顯著降低違約率，同時維持低資源開銷。

目前機器學習模型大多以預測精度作為唯一評估標準，卻忽略了模型輸出是否遵守既定的邏輯或領域規則。研究團隊提出 Rule Violation Score（RVS）作為補充指標，能獨立於預測準確度量測模型對硬性規則與軟性規則的遵守程度。