內在動機 - Agents Report

深度分析

自律人工智慧：嵌入式代理與資源驅動目標生成新框架

本研究探討人工智慧自行產生目標的自我驅動機制，提出以內在動機、資源導向先驗與因果介入三大路徑構建自律目標空間，並指出嵌入式代理的自我界定是核心挑戰。結果顯示，若能將目標與自我相對化，將改變AI的學習與安全框架。此概念亦可能重新塑造開發者的目標設計流程，促進更具彈性的系統架構。

深度分析

封閉審計框架中的簽名壓縮進步：理論證明與實驗驗證

研究指出，若以固定封閉審計損失作為壓縮進步的簽名獎勵，累積獎勵會精確等於審計損失的端點下降，因而在有限審計樣本下仍保有2Δₙ的容錯上限。此結果證明壓縮進步在適當測量框架下具備Goodhart抗性。相較於預測誤差好奇心，此法避免噪聲電視問題，提供可靠的持續學習度量，預期影響AI自我改進與安全設計方向。

深度分析

可控資訊生成（CIP）：以Kolmogorov–Sinai熵與最優控制重構內在動機

研究以內在動機為出發點提出可控資訊生成CIP，主張從控制論與Kolmogorov‑Sinai熵出發衡量動態系統可被操控的資訊產出。CIP比較開環與閉環熵率差異，獎勵尋找可被回饋抑制的混沌來源，實驗顯示在經典擺系能兼顧探索與穩定。具潛在理論與實務意義。