发布时间:2023-12-01 16:00
今天我们来看一篇人脸生成的论文,这个算法我愿称之为业界最强。
来自英伟达的styleGAN,全名《A Style-Based Generator Architecture for Generative Adversarial Networks》。
这个算法做的事很简单,生成逼真的人脸。不仅开源了代码,还开源了数据集,地址:https://github.com/NVlabs/stylegan
来看看算法思想:
正常的GAN网络都如左边这个a图所示,直接一个隐变量z作为输入,输入到生成器后经过层层网络得到输出。但是styleGAN没这么做,styleGAN使用隐变量z经过一系列非线性映射网络,得到w,同时在生成网络中使用了一个4*4*512的常量作为输入,如上图b所示。其中z和w都是512维,A是仿射变换,B是每个channel的高斯噪声的系数,w作用于生成的过程。AdaIN是: