1. 比较好的总结文章
Visual Transformer:
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了 (qq.com)
搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二) (qq.com)
Transformer在CV领域有可能替代CNN吗?还有哪些应用前景? (qq.com)
2.工程代码
1)原始Transformer的pytorch工程:jadore801120/attention-is-all-you-need-pytorch: A PyTorch implementation of the Transformer model in "Attention is All You Need". (github.com)
2)目标跟踪:
DETR:facebookresearch/detr: End-to-End Object Detection with Transformers (github.com)
Deformable DETR:https://github.com/fundamentalvision/Deformable-DETR
计算机视觉"新"范式: Transformer
3.总结感想
高层的视觉语义信息往往更关注这些要素之间如何关联在一起进而构成一个物体,以及物体与物体之间的空间位置关系如何构成一个场景,这些是我们更加关心的。目前来看,transformer在处理这些要素之间的关系上更自然也更有效。