深度分析
全域平均池化即多實例學習:從密集讀出解析影像分類器
本研究指出,使用全局平均池化的影像分類器等同於平均聚合的多實例學習模型,透過在特徵格上直接套用線性分類頭即可恢復空間類別分數。實驗在ImageNet、ImageNet‑A與MS‑COCO上證實,即使整體預測失誤,目標類別仍能在局部格子中被找回,顯示GAP的聚合方式是失誤的主要來源。
深度分析
本研究指出,使用全局平均池化的影像分類器等同於平均聚合的多實例學習模型,透過在特徵格上直接套用線性分類頭即可恢復空間類別分數。實驗在ImageNet、ImageNet‑A與MS‑COCO上證實,即使整體預測失誤,目標類別仍能在局部格子中被找回,顯示GAP的聚合方式是失誤的主要來源。
深度分析
機器去學習旨在不重新訓練模型即刪除特定訓練資料影響。研究推出 SUPREME 框架,支援多 GPU 分散訓練、去學習與評估,並以 Pins 臉部辨識資料集測試十種種子。結果顯示跨種子變異顯著,此框架採用 PyTorch Lightning Fabric,兼容 DDP、FSDP 與 DeepSpeed ZeRO,提升評估效率。