扩散器

OpenAI新论文称打败GAN达到SOT

发布时间:2022/5/6 9:57:30   
北京中科白殿疯在哪里 https://yyk.39.net/hospital/89ac7_detail.html

新智元报道

来源:OpenAI

编辑:好困

近日,OpenAI的两个研究员发表了一篇新文章,称他们的扩散模型在图像生成领域比GAN更强。然而,霸榜多年的GAN这么轻易就会落败么?

FaceAPP最近又小火了一把,小编也下载体验了一下。

还行,有点儿意思。

FaceAPP的背后便是基于生成对抗网络(GAN)的图像生成技术。

自从年诞生以来,尤其是在人脸生成方面的Deepfake,GAN几乎完全主导了图像生成领域的研究和应用。

但是,GAN很难训练,并且容易出现模式崩溃等问题。

别人用Deepfake「模型」生成的视频和我自己用Deepfake「魔性」生成的视频

于是,新的SOTA模型诞生了

针对GAN的这些问题,OpenAI的两位研究人员PrafullaDhariwal和AlexNichol便着眼于其他体系架构。

在他们发布的最新论文「扩散模型在图像合成方面击败了GAN」中,称提出的扩散模型架构解决了GAN的缺点,并且在图像生成任务中击败了GAN,达到了SOTA的水平。

不得不说,他们在题目中便用到「Beat」(击败)这个词,野心还是很大的啊!

「在ImageNetx上获得了3.85FID。不仅可以保持与BigGAN相当的水准,还可以将每个采样的前向传播降低到25个,同时对分布有更好的覆盖。」

无意中搜了一下,全文有15个「state-of-the-art」,除了个别两三个是形容GAN(不是被打败,就是有转折),其他基本全是形容他们自己新模型的。不管这个是不是SOTA,反正作者觉得肯定是了。

时间回溯到三个月前

非常有趣的是,在引用中,有一篇论文的作者同样是这两位。

今年2月的时候他们发表了一篇名为「改进的降噪扩散概率模型」的论文,这其中也有和GAN的对比,不过这个时候还没有将GAN「击败」。

没想到,三个月后他们在新的论文中就表示自己成功了,看来效率还挺快的。

同样是1亿个参数的模型,BigGAN-Deep在FID上的表现上要明显优于作者此时训练的DDPM。不过这二位用2.7亿个参数训练的模型强行胜利了一波。

去噪扩散概率模型(DDPM)——改进版

扩散模型是另一类深度学习模型,在图像生成任务中表现也很出色。

与GAN学会学习将随机噪声图像映射到训练分布中的某个点不同,扩散模型会获取噪声图像,然后执行一系列降噪步骤,逐步减少噪声并生成属于训练数据分布的图像。

DDPM可以更快地采样并获得更好的对数似然率,同时对采样质量的影响很小。而通过增加训练计算量可以带来更好的样本质量和对数似然性。

这二位作者表示:「我们惊奇地发现,经过改进的模型可以使用更少的采样次数」。也难怪作者会把25次的前向采样作为重点宣传对像。

进一步了解可以参考论文:

转载请注明:http://www.aideyishus.com/lkzp/157.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章