译：Two-Stream Convolutional Networks for Action Recognition in Videos

发布时间：2022-11-09 16:00

摘要：我们研究了用于训练视频中行为识别的深度卷积网络架构。这个挑战是捕捉静态帧中的外观和连续帧间的运动的互补信息。我们也旨在推广这个在数据驱动的学习框架中表现得最好的手工特征。

本文一共做出了3个贡献：

首先，本文提出了一个two-stream卷积网络架构，这个架构由时间和空间网络构成。
然后，我们验证了，尽管是有限的训练数据集，在多帧密集光流上训练的卷积网络仍然能够表现出很好的性能。
最后，我们展示出，应用于两个不同的动作分类数据集的多任务学习，可以同时用来增加训练数据集的数量和提高性能。
我们的架构是在标准视频动作数据集UCF-101和HMDB-51上训练的，与最先进水平（state of the art）相比还是有竞争力的。它也超出了先前大部分使用深度网络对视频进行分类的方法。

相关推荐

Codeforces Round #804 (Div. 2) - A, B, C

十个Python中常用的pip命令总结

一起来动手做个 AS 插件，自动生成Java Bean文件

Nginx如何配置根据路径转发详解

测试 - 用例篇 - 细节狂魔

Vue面试题归总

Python绘制散点图之可视化神器pyecharts

10.高并发Lua、OpenResty、redis

【15分】E. 谁是老二（结构体）

YoloV6:YoloV6+Win10---训练自己得数据集

2022/7/18 魔术方法之 `__set`

Vue3中使用vuex4

opencv学习笔记--直方图的均值化

YOLOv7官方出品 Alexey Bochkovskiy操刀，精度速度超越当前所有YOLO系列

microsoft .net framework 3.5下载

我的论文串讲「一」

使用python如何提取JSON数据指定内容

机器学习05-(分类模型\逻辑回归:训练集和测试集划分、交叉验证、交叉验证指标、混淆矩阵、分类报告，决策树分类)

【C++】类和对象（重中之重）

Qt实用技巧：截屏功能的实现

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号