溯因推理

SopriBench 跨貼文隱私

深度分析

「SopriBench」與「Argus」：多模態跨貼文隱私洩漏基準與溯因推理框架解析

研究顯示社群貼文中微弱線索會累積暴露使用者住家或工作地點，作者提出SopriBench基準與PES評分，並開發訓練無需的Argus框架，提升跨貼文隱私推斷25%效能。此研究提供首個可公開的使用者層級多模態隱私洩漏基準，並以PES衡量暴露嚴重度，Argus在跨貼文推斷上比最佳基線提升0.11分。

SymptomWise：透過決定論推理層解決醫療 AI 幻覺，提升診斷可靠性

SymptomWise

SymptomWise：透過決定論推理層解決醫療 AI 幻覺，提升診斷可靠性

針對生成式 AI 在醫療診斷中易產生幻覺的痛點，SymptomWise 框架將語言理解與診斷推理分開，利用決定論推理層來確保診斷結果的可追溯性與可靠性。在小兒神經科測試中，正確診斷出現在前五名的機率為 88%，有效降低了 AI 幻覺並提升了醫療 AI 的可靠性。