深度学习—— Spatial Transformer Layer

发布时间:2022-08-19 12:50

先说结论:在CNN中,没有放缩旋转的功能。

1. 什么是Spatial Transformer Layer

因为有pooling层的原因,所以有一点translation的功能。在下图中,通常情况下左右两个对于CNN来说是不一样的。
深度学习—— Spatial Transformer Layer_第1张图片
那么,Spatial Transformer Layer的功能是,想要学习一个层,能够对左图中的图片进行旋转和缩放
深度学习—— Spatial Transformer Layer_第2张图片

2. How to work?

学习过程中,平移本质上来说就是调整权重的过程。
深度学习—— Spatial Transformer Layer_第3张图片
上图中,权重相同的颜色代表相同的权值。其目标是进行向下平移,具体公式如下:
深度学习—— Spatial Transformer Layer_第4张图片
举个栗子:
深度学习—— Spatial Transformer Layer_第5张图片

  • 向下平移:把 a l 3 l − 1 a_{l3}^{l-1} al3l1移动到 a l 23 a_{l}^{23} al23的位置,此时, a l 23 a_{l}^{23} al23 a l 3 l − 1 a_{l3}^{l-1} al3l1相对应, a l 23 a_{l}^{23} al23与左图中其他位置的连接权重均为0
  • 向右旋转:把 a l 3 l − 1 a_{l3}^{l-1} al3l1移动到 a l 33 a_{l}^{33} al33的位置,此时, a l 33 a_{l}^{33} al33 a l 3 l − 1 a_{l3}^{l-1} al3l1相对应, a l 33 a_{l}^{33} al33与左图中其他位置的连接权重均为0

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号