OpenAI新论文称打败GAN达到SOT_扩散器资源

当前位置： 扩散器 >> 扩散器资源 >> OpenAI新论文称打败GAN达到SOT

OpenAI新论文称打败GAN达到SOT

发布时间:2022/5/6 9:57:30

新智元报道

来源：OpenAI

编辑：好困

近日，OpenAI的两个研究员发表了一篇新文章，称他们的扩散模型在图像生成领域比GAN更强。然而，霸榜多年的GAN这么轻易就会落败么？

FaceAPP最近又小火了一把，小编也下载体验了一下。

还行，有点儿意思。

FaceAPP的背后便是基于生成对抗网络（GAN）的图像生成技术。

自从年诞生以来，尤其是在人脸生成方面的Deepfake，GAN几乎完全主导了图像生成领域的研究和应用。

但是，GAN很难训练，并且容易出现模式崩溃等问题。

别人用Deepfake「模型」生成的视频和我自己用Deepfake「魔性」生成的视频

于是，新的SOTA模型诞生了

针对GAN的这些问题，OpenAI的两位研究人员PrafullaDhariwal和AlexNichol便着眼于其他体系架构。

在他们发布的最新论文「扩散模型在图像合成方面击败了GAN」中，称提出的扩散模型架构解决了GAN的缺点，并且在图像生成任务中击败了GAN，达到了SOTA的水平。

不得不说，他们在题目中便用到「Beat」（击败）这个词，野心还是很大的啊！

「在ImageNetx上获得了3.85FID。不仅可以保持与BigGAN相当的水准，还可以将每个采样的前向传播降低到25个，同时对分布有更好的覆盖。」

无意中搜了一下，全文有15个「state-of-the-art」，除了个别两三个是形容GAN（不是被打败，就是有转折），其他基本全是形容他们自己新模型的。不管这个是不是SOTA，反正作者觉得肯定是了。

时间回溯到三个月前

非常有趣的是，在引用中，有一篇论文的作者同样是这两位。

今年2月的时候他们发表了一篇名为「改进的降噪扩散概率模型」的论文，这其中也有和GAN的对比，不过这个时候还没有将GAN「击败」。

没想到，三个月后他们在新的论文中就表示自己成功了，看来效率还挺快的。

同样是1亿个参数的模型，BigGAN-Deep在FID上的表现上要明显优于作者此时训练的DDPM。不过这二位用2.7亿个参数训练的模型强行胜利了一波。

去噪扩散概率模型（DDPM）——改进版

扩散模型是另一类深度学习模型，在图像生成任务中表现也很出色。

与GAN学会学习将随机噪声图像映射到训练分布中的某个点不同，扩散模型会获取噪声图像，然后执行一系列降噪步骤，逐步减少噪声并生成属于训练数据分布的图像。

DDPM可以更快地采样并获得更好的对数似然率，同时对采样质量的影响很小。而通过增加训练计算量可以带来更好的样本质量和对数似然性。

这二位作者表示：「我们惊奇地发现，经过改进的模型可以使用更少的采样次数」。也难怪作者会把25次的前向采样作为重点宣传对像。

进一步了解可以参考论文：

转载请注明:http://www.aideyishus.com/lkzp/157.html

------分隔线----------------------------