深度分析 CHILLGuard:細粒度中文大型語言模型安全防護與 MDPO 優化技術 隨著中文大型語言模型在商業與公共服務的廣泛部署,內容安全與合規成為不可忽視的挑戰。CHILLGuard 以 5 大類 31 細項的危害分類為基礎,透過多階段資料建構管線結合檢索增強生成、提示工程改寫與多模型投票校正,打造 40 萬筆訓練集與 5 萬筆測試集。