论文笔记：Neural Baby Talk

发布时间：2022-08-18 18:41

Neural Baby Talk

1、提出问题

现代神经网络图像描述方法产生的自然语言描述虽然比较流畅，但是都是依靠语言模型去生成句子，往往不太依赖于图像。

2、提出创新点

提出了 Neural Baby Talk —— 一种新的图像描述框架，在生成自然语言描述的同时，清楚的定位图像中的对象。
我们的方法分为两个阶段，首先生成混合的模板，该模板包含单词和与图像区域插槽的混合，然后通过识别相应图像区域中的内容用单词填充插槽。
我们提出了一个稳健的图像描述任务，以衡量图像描述算法的构成性，在测试时，模型遇到了包含已知物体但有新的组合的图像（例如，模型在训练时看到了沙发上的狗和桌子上的人，但在测试时遇到了桌子上的狗）。这种新的组合是证明图像落地的一种方式，而不是简单地利用训练数据的相关性。

（为了验证模型能生成新对象的描述，作者重新划分了一个鲁棒的数据集分片。将COCO数据集的train和val重新组合，使得训练中共现的对象与测试时共现的对象不同，即模型将遇到包含已知对象但对象是新的组合方式的图像。）

相关推荐

用java实现学生成绩管理系统_学生成绩管理系统（java实现）

实现oracle数据批量同步到mysql（一）

【论文】各高校的毕业论文的Latex模板链接

监控系统服务器地址是什么,监控系统服务器ip地址

ML-Agents案例之“排序算法超硬核版”

【深度学习】深度学习优化算法总结

Linux 系统显示emoji表情

UE4中资源加载资源的方式

如何自学软件测试

Redis 学习 - 05 Node.js 客户端操作 Redis、Pipeline 流水线

Java设计模式中的装饰者模式

硕士毕业论文查重率是多少？

大数据—Hadoop生态圈

读完这本书才发现，三毛和荷西的爱情并不“神圣”

Vue将将后端返回的list数据转化为树结构的实现

mysql分页3种方式,Mysql的limit用法与几种分页形式

springboot整合fisco

一文搞懂Mybatis-plus的分页查询操作

Python利用format函数实现对齐打印(左对齐、右对齐与居中对齐)

【迎战蓝桥】算法·每日一题（今日详解）-- day7

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网，如有侵权请联系：561261067@qq.com

桂ICP备16001015号