速報 X+Slides:以受眾為條件的投影片生成基準測試 自動從原始文件產生簡報是大型語言模型的重要應用。過往測試多聚焦投影片完整度與技術深度,卻忽略受眾需求差異。研究團隊推出 X+Slides 基準,涵蓋 113 個主題與七種簡報情境,利用 8,133 筆去重且與來源文件對應的探測題,為不同受眾賦予效用權重,進而計算四項指標:受眾覆蓋率、領域覆蓋率、效率與正確性。