月: 2024年1月

Pyramid ViTとSpatial Reduction Attention

投稿日: 2024-01-092024-01-10 投稿者: lib-arts

Transformerを用いてセグメンテーション(Segmentation)やObject DetectionのようなDense Predictionタスクを学習させるには解像度を高くする必要がある一方で、ViTでは解像…

全文を読む

【SimCLR】対照学習(Contrastive Learning)に基づくベクトル表現の取得①

投稿日: 2024-01-062024-01-19 投稿者: lib-arts

SimCLR(Simple Framework for Contrastive Learning of Visual Representations)は対照学習(Contrastive Learning)を用いて画像のベ…

全文を読む

Swin Transformer: 階層型Vision Transformer まとめ

投稿日: 2024-01-022024-01-10 投稿者: lib-arts

Transformerの画像処理への応用にあたってはViT(Vision Transformer)などが有名である一方で、画像の局所特徴量の抽出の観点からは少々処理が非効率です。当記事では階層型のAttentionを用い…

全文を読む