投稿者: lib-arts

GIoU(Generalized IoU)の数式と指標の解釈

投稿日: 2024-01-172024-02-07 投稿者: lib-arts

Object Detectionタスクなどにおけるバウンディングボックスの予測にあたっては予測結果とground truthとの当てはまりの指標が必要でこの際にIoU(Intersection over Union)が一…

投稿日: 2024-01-152024-02-21 投稿者: lib-arts

局所的な特徴量の抽出に適したCNNに対して、大域的な特徴量の抽出に適したTransformerはViT以降、多くのComputer Visionのタスクに用いられます。当記事ではTransformerを用いてシンプルかつ…

投稿日: 2024-01-142024-02-07 投稿者: lib-arts

Object Detectionタスクには従来VGGNetやResNetなどのCNNをbackboneに持つネットワークを用いることが主流であった一方で、近年Transformerの導入も行われています。当記事ではObj…

投稿日: 2024-01-132024-01-13 投稿者: lib-arts

PointNet++を用いた点群の処理はPointNetに階層型のプーリングを導入することで改良にはなったものの、局所領域における点間の相関を取り扱えないなどの課題があります。当記事ではこの課題の解決にあたって点群の処理…

投稿日: 2024-01-112024-01-12 投稿者: lib-arts

点群にDeepLearningを導入したPointNetは有力な手法である一方で、max poolingを一度しか行わないことで局所的な構造をなかなか抽出できないという課題があります。当記事ではこの解決にあたって階層化グ…

投稿日: 2024-01-102024-01-10 投稿者: lib-arts

Transformerは元々機械翻訳タスクに対して考案された一方で、大域的な特徴量を取り扱うことのできる強力なモジュールであることから様々なタスクに応用されます。当記事ではTransformerを画像処理に応用した初期の…

投稿日: 2024-01-102024-01-10 投稿者: lib-arts

PointNetは点群(point clouds)の分類(classification)や点単位のセグメンテーション(segmentation)にMLP(Multi Layer Perceptron)を導入した研究です。…

投稿日: 2024-01-092024-01-10 投稿者: lib-arts

ViTなどのComputer Vision分野へのTransformerの導入は強力なアプローチである一方で、Transformerをそのまま用いる場合は局所相関を生かせないなどの課題があります。当記事ではViTに畳み込…

投稿日: 2024-01-092024-01-10 投稿者: lib-arts

Transformerを用いてセグメンテーション(Segmentation)やObject DetectionのようなDense Predictionタスクを学習させるには解像度を高くする必要がある一方で、ViTでは解像…

投稿日: 2024-01-062024-01-19 投稿者: lib-arts

SimCLR(Simple Framework for Contrastive Learning of Visual Representations)は対照学習(Contrastive Learning)を用いて画像のベ…