从事计算机视觉必知的「大牛」有哪些?

发布时间:2022-08-17 13:26

点击上方“机器学习与生成对抗网络”,关注"星标"

获取有趣、好玩的前沿干货!

说到计算机视觉,首屈一指的大牛必然是 David Marr(1945-1980)。

从事计算机视觉必知的「大牛」有哪些?_第1张图片

20 世纪 70 年代,身为神经系统学家的 Marr,将神经心理学与人工智能的知识相结合,提出了具有跨时代意义的「计算视觉理论」,标志着计算机视觉成为一门独立学科。

在 Marr 看来,视觉的主要功能是「从视网膜成像的二维图像,恢复三维物体的表面形状」,也就是「三维重建」。他还提出了一系列关于「三维重建」的计算理论与方法。

为了纪念 Marr 对计算机视觉领域做出的开拓性贡献,计算机视觉领域的最高荣誉「马尔奖」以他的名字命名。在两年一度的 ICCV(国际计算机视觉大会,The International Conference on Computer Vision)上,「马尔奖」会被授予最优秀论文的撰写者。

Marr 著作颇丰,不过年代所限,如今 Marr 的许多猜想都已被证明并不正确。他的理论由其学生归纳总结为一本《vision》,感兴趣可以找来看看。

从计算机视觉领域的顶级会议入手寻找「大牛」

能够在这些顶级会议中担任主席、评委,或是多篇论文被采纳的学者,都是值得学习的「前辈」。除了前文提到的 ICCV,还有 CVPR(计算机视觉及模式识别会议,IEEE Computer Vision and PatternRecognition)、ECCV(欧洲计算机视觉会议,European Conference on Computer Vision)等等。

1.Takeo Kanade(金出武雄)

卡耐基梅隆大学计算机科学和机器人研究所教授,计算机视觉泰斗,美国工程院院士。专注于目标跟踪、人脸检测和 3D 场景分析等方向的研究,跟踪算法 KLT 中的「K」指的就是他。Kanade 曾在 1990 年获马尔奖,此外,他还持有数十项专利。

2.Andrew Zisserman

英国牛津大学教授,视觉测量组主任。曾于 1993 年、1998 年和 2003 年 3 次获得马尔奖。著有计算机视觉经典书籍《Multiview Visual Geometry》,同时也是著名深度学习网络:VGGNet(Visual Geometry Group Net)的编写者之一。

3.David Lowe

英属哥伦比亚大学计算机科学系教授,1988 年获马尔奖,专注于目标识别、人类视觉计算模型等方面的研究。1999 年,David 发明的著名图像处理算法 SIFT 算法(scale-invariant feature transform),一度成为最流行的图像特征点检测方法,被广泛应用于物体识别和图像分类等领域。

4.Paul Viola

在人脸检测方面极具影响力的科学家,2003 年获马尔奖。在 2001 年的 CVPR 上,他与 Micheal Jones 联合发表的论文《Rapid object detection using a boosted cascade of simple features》,极大程度地影响了当时的学者,让其中的 boosting cascade 算法已被广泛应用于学术界和工业界。

5.Andrew Blake

曾获 2 次 ECCV 最佳论文奖和 1 次马尔奖。专注于图像分割、目标跟踪及人体姿态跟踪方面的研究。著名的 Active Shape Model(主动形状模型)就是由他参与发明的算法「Active Contours」演变而来。

6.Luc Van Gool

比利时荷语天主教鲁汶大学教授,瑞士苏黎世联邦理工学院教授,计算机视觉实验室主任,1998 年获马尔奖。他在 SIFT 算法的基础上,开发出了更加先进的 SURF 算法(speed up robust feature)。

7.David Forsyth

美国伊利诺伊大学厄巴纳-香槟分校教授,2019 ICCV 大会主席,1993 年获马尔奖,与 Jean Ponce 合著的《Computer Vision:A Modern Approach》堪称计算机视觉经典教材。

8. 朱松纯

著名计算机视觉华人学者,现为美国加州大学洛杉矶分校统计系与计算机系教授,UCLA 计算机视觉、认知、学习与自主机器人中心主任,2019 年 CVPR 主席。朱松纯曾获 1 次马尔奖,在场景理解、视觉常识推理等方面做出了重要贡献。

9.Marc Pollefeys

苏黎世联邦理工学院教授,2019 年 ICCV 大会主席,对摄像机自标定方面做出了杰出贡献。他与另外两名学者在一期 IJCV(计算机视觉国际期刊,International Journal of Computer Vision)上发表的文章《Self-Calibrationand metric reconstruction inspite of varying and unknown intrinsic camera parameters》,被称为摄像机自标定方面最经典的论文之一,他也因此在 1998 年获马尔奖。

10.Larry Davis

美国马里兰大学教授,2019 年 CVPR 大会主席。其最著名的研究成果为 W4 实时监控系统——最早能够进行户外人体检测和行为分析的实时视频监控系统。

11.Phillip Torr

英国牛津大学教授,2019 年 CVPR 大会主席,曾于 1998 年获马尔奖,现为自动驾驶公司 FiveAI 的首席科学顾问。

12.Kyoung Mu Lee

首尔大学教授,国际 CV 社区十分活跃的韩国学者,2019 ICCV 大会主席,领域著名期刊 TPAMI 副主编。

13.Gerard Medioni

2020 年 CVPR 大会主席,曾与他人合著《Emerging Topics of Computer Vision》、《多媒体系统:算法、标准和工业实践》等经典学术书籍。

有些「大牛」与顶级会议的联系没有那么「密切」,但顺着计算机视觉的发展脉络和阵地,你依然能发现他们。如:

1.Jitendra Malik

斯坦福大学教授,其研究工作集中在轮廓检测、图像/视频分割、图形匹配等方面,在边缘检测、图像分割和形状匹配方面拥有杰出贡献。Malik 的学生中人才济济,华人学者史建波就出自他的门下,还包括 Alexie Efros、Paul Debevec、Yair Weiss 等优秀学者。

2.David Murray

英国牛津大学教授,Active Vision 实验室主任,PTAM 算法(Parallel tracking and mapping)的发明者。他还是上文提到的 Philip Torr,Andrew Davison 的 PhD 导师。

3.Andrew Davison

英国帝国理工学院教授,机器视觉组及 Dyson 机器人实验室主任,专注于 SLAM 领域的研究,对 MonoSLAM、SLAM++等成果的问世做出了极大的贡献。

4.Vijay Kumar

宾夕法尼亚大学教授,Vijay Kumar 实验室主任,在无人机领域有很高的建树。

5.Daniel Cremers

德国慕尼黑工业大学教授、计算机视觉组主任。同样为无人机领域的优秀学者,还是 LSD-SLAM 算法的发明者之一。

6.Richard Szeliski

其所著的《Computer Vision: Algorithms and Applications》(计算机视觉:算法与应用)同样是计算机视觉非常经典的入门教材。

一些知名华人学者:

1. 黄煦涛

伊利诺伊大学厄巴纳-香槟分校(UIUC)Beckman 研究院图象实验室主任,美国国家工程院院士。专注图像处理、模式识别、计算机视觉和人机交互等方面的研究工作,并发明了预测差分量化,培养了诸多优秀学生。

2. 史建波

宾夕法尼亚大学计算机与信息科学教授,在图像分割方面有极高的成就。2000 年,史建波与他人在期刊 PAMI 上联合发布的文章《Normalized cuts and image segmentation》突破性地将图论方法应用于聚类和图像分割,使之成为了主流研究方法,极大程度上推动了图像分割,乃至整个计算机视觉领域的发展。

3. 李飞飞

斯坦福大学教授、人工智能实验室与视觉实验室主管。创办了著名的 ImageNet 竞赛。从 2010 年至 2017 年,一年一度的竞赛吸引了众多优秀的学者,也见证了图像识别算法的飞速发展,2017 年,获奖算法的识别准确率甚至达到了高于人类水平的 97.3%。

李飞飞还曾获 2018 年「影响世界华人大奖」,在不太关注 AI 领域的人中亦有相当的知名度。

4. 汤晓鸥

香港中文大学信息工程系主任,在人脸识别方面拥有极高的成就。

2009 年,汤晓鸥团队的论文在 CVPR 上获得年度「最佳论文奖」,是 CVPR 自创办起的 25 年来首次获奖的亚洲论文。IJCV 第一位华人主编;2014 年,由汤晓鸥团队发布的 GaussianFace 算法,在全球最权威的人脸识别数据库 LFW 上的准确率为 98.52%,首次超越人类水平。

当然他还有另外一个身份:商汤科技创始人。

5. 吴郢

美国西北大学教授、计算机视觉实验室主任。曾获美国青年教授的最高荣誉:美国国家科学基金「事业奖」,并在手势识别和目标跟踪方面取得了优秀成果。

6. 孙剑

旷世科技首席科学家,主要研究方向为人脸识别、计算摄影学和基于深度学习的图像理解 。自 2002 年起在 SIGGRAPH、CVPR 等顶级会议上发表超过 100 篇学术论文,两次获得 CVPR 最佳论文奖。其团队开发的深度残差网络(ResNet)对图像识别领域有着广泛影响。

7. 贾佳亚

香港中文大学教授,腾讯优图实验室科学家。主要研究方向为计算机视觉、图像处理、模式识别等,在图像滤波、图像稀疏处理、多频段图像信号融合等方面做出了巨大贡献。

8. 何恺明

Facebook AI Research 研究员,学术界冉冉升起的新星。2009 年,何恺明以图像去雾论文「Single Image Haze Removal Using Dark Channel Prior」获 CVPR 年度「最佳论文奖」,是首位获此奖项的中国学者,并于 2016 年再度获此荣誉。2017 年,何恺明凭其最新研究成果 Mask R-CNN 的相关论文「利用焦点损失提升物体检测效果」获马尔奖。

在 2015 年的 ImageNet 大赛上,何恺明团队以 ResNet-152 方法斩获第一名。此后,深度残差网络(ResNet)迅速成为计算机视觉领域十分流行的架构,在机器翻译、语音识别、语音合成等领域都能见到其身影。

作者:KnowingAI知智

https://www.zhihu.com/question/323644172/answer/715321371

 End 

声明:部分内容来源于网络,仅供读者学术交流之目的。文章版权归原作者所有。如有不妥,请联系删除。


公众号近期荐读:

  • GAN整整6年了!是时候要来捋捋了! 

  • 语义金字塔式-图像生成:一种使用分类模型特征的方法

  • 【无中生有的AI】关于deepfake的种类、危害、基础实现技术和挑战

  • 新手指南综述 | GAN模型太多,不知道选哪儿个?

  • 数百篇GAN论文已下载好!配一份生成对抗网络最新综述!

  • 图卷积网络GCN的理解与介绍

  • 【CapsulesNet的解析】了解一下胶囊网络?

  • 【综述笔记】一些弱监督语义分割论文

  • 人脸生成新SOTA?它还是GAN。

  • 结合GAN的零次学习(zero-shot learning)

  • GAN的图像修复:多样化补全

  • CVPR2020之MSG-GAN:简单有效的SOTA

  • CVPR2020之姿势变换GAN:图像里谁都会劈叉?

  • CVPR2020之多码先验GAN:预训练模型如何使用?

  • 两幅图像!这样能训练好GAN做图像转换吗? 

  • 单图训GAN!如何改进SinGAN?

  • 有点夸张、有点扭曲!速览这些GAN如何夸张漫画化人脸!

  • 见微知细之超分辨率GAN!附70多篇论文下载!

  • 天降斯雨,于我却无!GAN用于去雨如何?

  • 脸部转正!GAN能否让侧颜杀手、小猪佩奇真容无处遁形?

  • 容颜渐失!GAN来预测?

  • 强数据所难!SSL(半监督学习)结合GAN如何?

  • 弱水三千,只取你标!AL(主动学习)结合GAN如何?

  • 异常检测,GAN如何gan ?

  • 虚拟换衣!速览这几篇最新论文咋做的!

  • 脸部妆容迁移!速览几篇用GAN来做的论文

  • 【1】GAN在医学图像上的生成,今如何?

  • 01-GAN公式简明原理之铁甲小宝篇

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号