細粒度圖像分類上Vision Transformer的發展綜述
計算機工程與應用
頁數: 17 2023-12-12
摘要: 細粒度圖像分類(fine-grained image classification,FGIC)一直是計算機視覺領域中的重要問題。與傳統圖像分類任務相比,FGIC的挑戰在于類間對象極其相似,使任務難度進一步增加。隨著深度學習的發展,Vision Transformer(ViT)模型在視覺領域掀起熱潮,并被引入到FGIC任務中。介紹了FGIC任務所面臨的挑戰,分析了ViT模型及其特...