Anthropic 研究顯示 Claude Sonnet 4.5 具備功能性情緒表徵
Anthropic 的新研究探討大型語言模型 Claude Sonnet 4.5 是否具備情緒。研究發現模型內部出現離散的情緒表徵,部分支持情境感知功能;但與人類情緒的變異性神經特徵不符,且缺乏跨系統的動態重組。結論指出,要讓模型真正具備情緒仍有多項技術門檻。
Anthropic 最近在 arXiv 上發表論文,聲稱其大型語言模型 Claude Sonnet 4.5 內部出現了情緒概念的表徵,並將其描述為「功能性情緒」。研究團隊以情緒在生物系統的兩大核心功能作為評估基礎:一是情境敏感的解讀,二是根據解讀結果在多個系統間重新組織處理。
情境感知的部分支持
論文指出,Claude 在處理特定情境時會激活相對固定的情緒向量,顯示模型能夠以情緒概念來區分情境,這與情緒作為情境解讀工具的功能相呼應。
與神經科學發現的落差
然而,情緒向量在模型中呈現為一致且離散的形式,與神經科學研究顯示的人類情緒神經簽名具高度變異性的特徵不符。人類情緒往往在腦部激活模式上呈現分散與可塑性,Claude 的表徵缺乏此類變化。
缺乏跨系統動態重組
在情緒的第二核心功能——跨系統的動態重組方面,Claude 的表現亦不完整。模型的情緒表徵會影響最終文字輸出,但未見注意力分配、決策速度或動機狀態等層面的即時調整,與生物情緒所帶來的全方位處理變化仍有差距。
未來方向
作者最後提出,要讓語言模型真正具備情緒,需在以下幾點取得突破:1)建立變異且情境依賴的情緒表徵;2)實現跨模組的即時資源重新分配;3)融合動機驅動的決策機制。這些挑戰顯示,功能性情緒仍是人工智慧研究的前沿課題。
延伸閱讀
- AI-native 資產情報:以情境感知評分驅動資安優先排序
- 多代理網路中的記憶繼承:LLM代理的攻擊路徑與防禦設計
- LLM 驅動 HBEE 模擬:具適應性的惡意內部者降低同儕懷疑頻率,UEBA 排名不變
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。