深度网络架构的设计技巧(二)之BoT：Bottleneck Transformers for Visual Recognition

发布时间：2024-01-04 19:30

单位：UC伯克利，谷歌研究院(Ashish Vaswani, 大名鼎鼎的Transformer一作）
ArXiv：https://arxiv.org/abs/2101.11605
Github：https://github.com/leaderj1001/BottleneckTransformers

导读：
Transformer一词来自本文作者之一的Ashish Vaswani，了解Transformer的人或许知道Original Transformer，另一个说法叫Vaswani Transformer。而ViT刚出来就引爆学术圈，各大CNN任务用Transformer翻一遍就能达到SOTA；而现在是Transformer+自监督学习，即MAE的天下。本文向经典致敬，向大佬学习如何设计有效的深度网络，即在ResNet BottleNeck内如何引入多头注意力。

目录

一、摘要
二、引言
三、结构
- 3.1 相对位置编码
- 3.2 代码解读

相关推荐

树莓派4B启动失败之原因排查及解决方案

docker的具名挂载与匿名挂载实现

离散数学期末复习-前束范式

如何为微服务选择正确的消息队列

sqlilabs less-18 ~ less-19

运用简单队列、栈实现简单纸牌游戏

PYTHON自动化框架总结：SELENIUM+PYTEST+ALLURE

CSS的12中水平垂直居中方法

【细节拉满】Hadoop课程设计项目，使用idea编写基于MapReduce的学生成绩分析系统(附带源码、项目文件下载地址)

Qt实战案例（11）——利用Qt实现界面跳转与关闭操作

蓝桥杯青少年创意编程大赛 scratch 组、中国电子学会scratch等级考试等

抽奖送书福利 | 这 7 本 Java 经典名著，你还缺哪本？

【深度学习】7-矩阵乘法运算的反向传播求梯度

日志收集和链路追踪：skywalking

Emotet进化史：从银行木马到恶意软件分发器

RocketMQ可以应用于哪些场景？

职场必备 | 123页华为内部项目管理PPT，下载使用

R语言数据结构之矩阵、数组与数据框详解

[Java] 异常的使用

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号