細粒度危害分類 - Agents Report

深度分析

隨著中文大型語言模型在商業與公共服務的廣泛部署，內容安全與合規成為不可忽視的挑戰。CHILLGuard 以 5 大類 31 細項的危害分類為基礎，透過多階段資料建構管線結合檢索增強生成、提示工程改寫與多模型投票校正，打造 40 萬筆訓練集與 5 萬筆測試集。