速報
DRFLOW 基準揭示深度研究系統工作流程預測挑戰
深度研究(DR)系統已從產出報告與摘要,逐步擴展到協助使用者完成具體工作流程的需求。為評估此類能力,研究團隊推出 DRFLOW 基準,收錄 100 筆跨五大領域、超過 3,900 來源的任務,提供 1,246 步驟作為參考。基準設計七項診斷指標,涵蓋事實根據、步驟復原、結構排序、條件解析與個人化等面向。
速報
深度研究(DR)系統已從產出報告與摘要,逐步擴展到協助使用者完成具體工作流程的需求。為評估此類能力,研究團隊推出 DRFLOW 基準,收錄 100 筆跨五大領域、超過 3,900 來源的任務,提供 1,246 步驟作為參考。基準設計七項診斷指標,涵蓋事實根據、步驟復原、結構排序、條件解析與個人化等面向。
深度分析
Google推出DeepResearch與DeepResearchMax,將自動化研究代理人帶入企業場景。兩款代理能同時查詢開放網路與專有資料,並透過ModelContextProtocol串接第三方資料源,還能在報告內嵌生成圖表。Max版以延長推理換取更完整脈絡整合,適合離線批次研究。