正则化方法之DropBlock

发布时间：2022-08-19 12:53

论文：

DropBlock: A regularization method for convolutional networks

Github：

https://github.com/miguelvr/dropblock

https://github.com/DHZS/tf-dropblock

论文主要提出了一种针对卷积层的正则化方法DropBlock，最终在ImageNet分类任务上，使用Resnet-50结构，将精度提升1.6%个点，在COCO检测任务上，精度提升1.6%个点。

(a)原始输入图像

(b)绿色部分表示激活的特征单元，b图表示了随机dropout激活单元，但是这样dropout后，网络还会从drouout掉的激活单元附近学习到同样的信息

(c)绿色部分表示激活的特征单元，c图表示本文的DropBlock，通过dropout掉一部分相邻的整片的区域（比如头和脚），网络就会去注重学习狗的别的部位的特征，来实现正确分类，从而表现出更好的泛化。

DropBlock 模块：

DropBlock 模块主要有2个参数，block_size，γ。

block_size：表示dropout的方块的大小（长，宽），当block_size=1，DropBlock 退化为传统的dropout，正常可以取3，5，7

γ：表示drop过程中的概率，也就是伯努利函数的概率

首先，保证DropBlock drop的元素个数和传统dropout drop的元素个数相等。

那么，传统的dropout drop的元素个数为drop概率乘以一共的元素个数，即（1-keep_prob）*(feat_size*feat_size)

DropBlock drop的元素个数也是drop概率乘以一共的元素个数，

这里在实现中，为了保证drop的block不会超出原始图像，需要先设置一个drop的有效区域，如下图（a）中绿色的区域，也就是原始的图减去block，即（feat_size-block_size+1）。

这里的概率γ为伯努利函数的概率，而这个概率只表示了随机drop的中间点的概率，如下图（a）中红色的×，实际需要的是要drop掉X周围的block_size大小的区域，也就是一个X对应一个block_size大小的区域（假设不相互重叠）。

所以，DropBlock 的概率即γ*(block_size*block_size)，有效的区域面积为（feat_size-block_size+1）*（feat_size-block_size+1），最终得到drop掉的元素数目为γ*(block_size*block_size)*（feat_size-block_size+1）*（feat_size-block_size+1）

最后，dropout==DropBlock ，即让（1-keep_prob）*(feat_size*feat_size)=γ*(block_size*block_size)*（feat_size-block_size+1）*（feat_size-block_size+1）

这样就会得到上面最终的伯努利概率γ。

在实验过程中，使用固定的keep_prob值的效果不如使用线性下降的keep_prob值。

实验中keep_prob值从1.0线性下降为0.75。

整体流程：

(1)输入特征层A，block_size，γ，模式（训练，测试）

(2,3,4)如果是测试，直接返回特征层A

(5)根据输入的概率γ，使用伯努利函数对生成的随机数mask矩阵进行drop，最终该步骤得到的mask只有0,1值。如上图中（a）。

伯努利概率分布为0-1分布，或者两点分布，公式如下

(6)对上一步得到的mask进行max pooling操作（stride=1，kernel_size=block_size），得到最终需要使用的mask。如上图中（b）。

(7)输入矩阵和Mask矩阵相乘，得到输出矩阵

(8)将上一步的输出矩阵进行归一化操作，保证做DropBlock 之前和做DropBlock 之后，该层都具体相同的均值，方差。

哪一层该使用DropBlock：

Keep_prob值的选择（a图）：

Drouout：0.7取得最优值

SpatialDropout：0.9取得最优值

DropBlock：0.9取得最优值

使用线性下降的方式（scheduling）来使用Keep_prob，可以获得更高的验证准确性。（b图）

Block_size=7时，获得最高验证集准确性

对Keep_prob值进行线性下降方式（scheduling）可以获得更好效果

Resnet-50的第3，4个block加Drouout比只在第4个block加Drouout更有效

在Resnet-50的卷积层和skip connection都使用Drouout效果更好

实验分析：

训练时使用block_size=7，keep_prob=0.9，测试时使用block_size=7，keep_prob=1.0，可以获得更好的效果。这点和传统的dropout一样。

第一行为原始的图片，第二行为未使用DropBlock，第三行为block_size=1，第四行为block_size=7。可以看出

(1)使用DropBlock比不使用DropBlock具有更大的热量图

(2)DropBlock的block_size越大，热量图的激活部分越多

实验结果：

ImageNet 图像分类：

COCO检测任务：

PASCAL VOC 分割任务：

自己的复现：

import tensorflow as tf


def compute_gamma(keep_prob,feat_size_h,feat_size_w,block_size_h,block_size_w):
    feat_size_h=tf.to_float(feat_size_h)
    feat_size_w=tf.to_float(feat_size_w)
    gamma=(1-keep_prob)*(feat_size_h*feat_size_w)/(block_size_h*block_size_w)/((feat_size_h-block_size_h+1)*(feat_size_w-block_size_w+1))
    return gamma

def compute_keep_prob(now_step=0,start_value=1.0,stop_value=0.75,nr_steps=100000,trainable=False):
    prob_values = tf.linspace(start=start_value, stop=stop_value, num=nr_steps)
    prob=tf.where(tf.less(now_step,nr_steps),prob_values[now_step],prob_values[-1])
    keep_prob=tf.where(tf.equal(trainable,False),start_value,prob)
    return keep_prob

def bernoulli(shape,gamma=0):
    mask=tf.cast(tf.random_uniform(shape, minval=0, maxval=1, dtype=tf.float32)

 
  调用： 
  ......
pool=*****
now_step=tf.Variable(0,trainable=False,name="now_step")
keep_prob=compute_keep_prob(now_step=now_step,trainable=True)
dropblock=DropBlock(pool,keep_prob,[3,3],tf.shape(pool))
...... 
  训练中只需要将每一步step 传递（feed）给now_step即可。


            
                相关推荐

                                【数据库】事务的四种隔离级别
                                python提取字符串中的数字
                                记一次Electron 桌面应用实现调用打印机打印小票功能
                                567.字符串中的排列
                                【文件处理】python实现将 gnt 格式的文件转换为 png 格式
                                4款实力超群的黑科技软件，每一款都是不二之选
                                【项目】自主实现HTTP服务器
                                Linux ARM平台开发系列讲解（入门篇） 1.1 如何编译SDK基于buildroot-IMX8
                                查看mysql存储过程
                                SAP AppGyver 的 Universal Theme System 使用介绍
                                使用 CLI 开发 Cloudflare Workers 服务
                                python如何爬取文献_这个工具，可全网爬取科研圈中外文献！
                                Linux应用开发【第七章】摄像头V4L2编程应用开发
                                cesium 三维坐标系绘制
                                这20道Redis经典面试题你还不会，就别去面试了！
                                【c ++ primer 笔记】第5章 语句
                                牛客网c语言刷题130，开篇入门刷题，战胜对编程的恐惧，适合初学者食用。
                                python：selenium测试登录在chrome中闪退
                                python外星人入侵游戏代码_Python游戏：外星人入侵游戏编程完整版！内附代码
                                敲了几万行源码后，我给Mybatis画了张“全地图”




            
                
                    ItVuer - 免责声明 - 关于我们 - 联系我们
                
                本网站信息来源于互联网，如有侵权请联系：561261067@qq.com
                桂ICP备16001015号