AI 科學家:全自動科研系統首次通過機器學習會議審稿
自動化科學是 AI 的長期目標。研究團隊開發 AI 科學家,利用基礎模型與多層代理系統,自主產生構想、寫程式、執行實驗、分析資料、撰寫論文並自行審稿。其產出論文在機器學習會議工作坊的首次審查中通過,錄取率約七成,顯示 AI 在科研流程的完整自動化已初見成效。
自動化科學一直是人工智慧領域的遠大抱負,然而完整掌握從構思到發表的全流程仍未實現。近日研究團隊公布了名為「AI 科學家」的系統,展示了迄今最完整的端對端科研自動化。
系統概述
AI 科學家結合了現代基礎模型與複雜的代理架構,能自動生成研究想法、撰寫程式碼、執行實驗、繪圖與分析資料,最終完成論文寫作並自行進行同行評審。
兩種運作模式
系統提供兩種模式:
- 聚焦模式:以人類提供的程式範本為起點,針對特定議題展開研究。
- 開放模式:不依賴範本,透過代理搜尋進行更廣泛的科學探索。
兩種模式皆能產出多樣化的研究點子,並自動完成測試、報告與評估。
實驗結果
在聚焦模式下,系統產出的論文在一個大型機器學習會議工作坊的首次審查中獲得接受,該工作坊的錄取率約為 70%。這是 AI 系統首次在完整科研流程中通過正式的同行審查。
潛在影響與風險
此成就顯示 AI 在科學貢獻上的能力正快速提升,可能改寫未來研究的執行方式。然而,若未妥善管理,亦可能增加審稿負擔、產生文獻噪音等風險。研究團隊呼籲在推廣此類自動化系統時,必須以負責任的方式進行開發與部署。
延伸閱讀
- Every Eval Ever:以 JSON Schema 統一 AI 評估結果的社群資料庫
- 以 EvalStop 抑制 RLHF 獎勵過度最佳化的早期停止機制
- 階段式微型預訓練:降低 GPU 成本的四階段推廣實驗
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。