深度分析
「SopriBench」與「Argus」:多模態跨貼文隱私洩漏基準與溯因推理框架解析
研究顯示社群貼文中微弱線索會累積暴露使用者住家或工作地點,作者提出SopriBench基準與PES評分,並開發訓練無需的Argus框架,提升跨貼文隱私推斷25%效能。此研究提供首個可公開的使用者層級多模態隱私洩漏基準,並以PES衡量暴露嚴重度,Argus在跨貼文推斷上比最佳基線提升0.11分。
深度分析
研究顯示社群貼文中微弱線索會累積暴露使用者住家或工作地點,作者提出SopriBench基準與PES評分,並開發訓練無需的Argus框架,提升跨貼文隱私推斷25%效能。此研究提供首個可公開的使用者層級多模態隱私洩漏基準,並以PES衡量暴露嚴重度,Argus在跨貼文推斷上比最佳基線提升0.11分。
SymptomWise
針對生成式 AI 在醫療診斷中易產生幻覺的痛點,SymptomWise 框架將語言理解與診斷推理分開,利用決定論推理層來確保診斷結果的可追溯性與可靠性。在小兒神經科測試中,正確診斷出現在前五名的機率為 88%,有效降低了 AI 幻覺並提升了醫療 AI 的可靠性。