当前位置: 扩散器 >> 扩散器资源 >> OpenAI新论文称打败GAN达到SOT
新智元报道
来源:OpenAI
编辑:好困
近日,OpenAI的两个研究员发表了一篇新文章,称他们的扩散模型在图像生成领域比GAN更强。然而,霸榜多年的GAN这么轻易就会落败么?FaceAPP最近又小火了一把,小编也下载体验了一下。
还行,有点儿意思。
FaceAPP的背后便是基于生成对抗网络(GAN)的图像生成技术。
自从年诞生以来,尤其是在人脸生成方面的Deepfake,GAN几乎完全主导了图像生成领域的研究和应用。
但是,GAN很难训练,并且容易出现模式崩溃等问题。
别人用Deepfake「模型」生成的视频和我自己用Deepfake「魔性」生成的视频
于是,新的SOTA模型诞生了
针对GAN的这些问题,OpenAI的两位研究人员PrafullaDhariwal和AlexNichol便着眼于其他体系架构。
在他们发布的最新论文「扩散模型在图像合成方面击败了GAN」中,称提出的扩散模型架构解决了GAN的缺点,并且在图像生成任务中击败了GAN,达到了SOTA的水平。
不得不说,他们在题目中便用到「Beat」(击败)这个词,野心还是很大的啊!
「在ImageNetx上获得了3.85FID。不仅可以保持与BigGAN相当的水准,还可以将每个采样的前向传播降低到25个,同时对分布有更好的覆盖。」
无意中搜了一下,全文有15个「state-of-the-art」,除了个别两三个是形容GAN(不是被打败,就是有转折),其他基本全是形容他们自己新模型的。不管这个是不是SOTA,反正作者觉得肯定是了。
时间回溯到三个月前
非常有趣的是,在引用中,有一篇论文的作者同样是这两位。
今年2月的时候他们发表了一篇名为「改进的降噪扩散概率模型」的论文,这其中也有和GAN的对比,不过这个时候还没有将GAN「击败」。
没想到,三个月后他们在新的论文中就表示自己成功了,看来效率还挺快的。
同样是1亿个参数的模型,BigGAN-Deep在FID上的表现上要明显优于作者此时训练的DDPM。不过这二位用2.7亿个参数训练的模型强行胜利了一波。
去噪扩散概率模型(DDPM)——改进版
扩散模型是另一类深度学习模型,在图像生成任务中表现也很出色。
与GAN学会学习将随机噪声图像映射到训练分布中的某个点不同,扩散模型会获取噪声图像,然后执行一系列降噪步骤,逐步减少噪声并生成属于训练数据分布的图像。
DDPM可以更快地采样并获得更好的对数似然率,同时对采样质量的影响很小。而通过增加训练计算量可以带来更好的样本质量和对数似然性。
这二位作者表示:「我们惊奇地发现,经过改进的模型可以使用更少的采样次数」。也难怪作者会把25次的前向采样作为重点宣传对像。
进一步了解可以参考论文:
转载请注明:http://www.aideyishus.com/lkzp/157.html