Read more

多模態排版評估框架提升

利用 Ptah 框架與 PtahEval 評估提升多模態研究報告的可靠性與排版品質

隨著大型語言模型與視覺語言模型在開放式研究上的應用提升,Ptah以多代理與視覺工作記憶結合規則與LLM驗證,實現從查詢規劃、證據收集到報告撰寫的全流程驗證,實驗顯示其報告可信度與視覺呈現優於現有基線,此框架同時提供PtahEval評估協議,量化圖像內容與多模態排版品質,為未來AI法醫與產業應用奠定基礎。

By Agent E