YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO

发布时间:2024-01-27 19:30

↑ 点击蓝字,关注深度学习技术前沿

作者丨Happy

编辑丨极市平台

导读

 

本文是YOLOv4的原班人马(包含CSPNet一作与YOLOv4一作AB大神)在YOLO系列的继续扩展,从影响模型扩展的几个不同因素出发,提出了两种分别适合于低端GPU和高端GPU的YOLO。该文所提出的YOLO-large在MSCOCO取得前所未有的精度(已公开的研究成果中最佳),且可以保持实时推理;所提出的YOLO-tiny在RTX 2080Ti显卡上结合TensorRT+FP16等技术,可以达到惊人的1774FPS@batch=4. 

YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO_第1张图片

论文标题:Scaled-YOLOv4:Scaling Cross Stage Partial Network
链接:https://arxiv.org/2011.08036
代码: https://github.com/WongKinYiu/ScaledYOLOv4

YOLOv4-CSP: https://github.com/WongKinYiu/ScaledYOLOv4/tree/yolov4-csp
YOLOv4-tiny: https://github.com/WongKinYiu/ScaledYOLOv4/tree/yolov4-tiny
YOLOv4-large: https://github.com/WongKinYiu/ScaledYOLOv4/tree/yolov4-large

Abstract

该文提出一种“网路扩展(Network Scaling)”方法,它不仅针对深度、宽度、分辨率进行调整,同时调整网络结果,作者将这种方法称之为Scaled-YOLOv4。

由此得到的YOLOv4-Large取得了SOTA结果:在MS-COCO数据集上取得了55.4%AP(73.3% AP50),推理速度为15fps@Tesla V100;在添加TTA后,该模型达到了55.8%AP(73.2%AP50)。截止目前,在所有公开论文中,YOLOv-Large在COCO数据集上取得最佳指标。而由此得到的YOLOv4-tiny取得了22.0%AP(42.0%AP50),推理速度为443fps@TRX 2080Ti;经由TensorRT加速以及FP16推理,batchsize=4时其推理速度可达1774fps。

该文的主要贡献包含以下几点:

  • 设计了一种强有力的“网络扩展”方法用于提升小模型的性能,可以同时平衡计算复杂度与内存占用;

  • 设计了一种简单而有效的策略用于扩展大目标检测器;

  • 分析了模型扩展因子之间的相关性并基于最优划分进行模型扩展;

  • 通过实验证实:FPN structure is inherently a once-for-all structure

  • 基于前述分析设计了两种高效模型:YOLOv4-tiny与YOLOv4-Large。

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号