科技日报记者 吴长锋
记者从中国科学技术大学获悉,该校九韶团队研究了模式崩溃发生的根本机理,基于数学理论分析提出了一种新方法定量检测和解决生成对抗网络(GANs)中的模式崩溃问题。该成果日前发表于国际学术期刊《IEEE模式分析与机器智能汇刊》。
生成对抗网络(GAN),是广泛使用的生成模型。其通过学习真实样本的分布,被用于合成复杂逼真的数据。然而,模式崩溃是生成对抗网络面临的一个重要挑战,即生成样本的多样性明显低于真实样本的多样性,这对进一步应用造成了困扰。由于生成对抗网络及其训练过程的复杂性,涉及多种可能的因素和环节,一直无法明确究竟是何种机理导致模式崩溃的发生。
经过深入研究,研究团队发现了生成对抗网络产生模式崩溃的根本机理。理论分析表明,当真实数据存在多个模式时,生成器损失函数关于其参数是非凸的。具体而言,导致生成分布仅覆盖真实分布的部分模式的参数,是生成器损失函数的局部极小点。
为了解决模式崩溃问题,研究团队提出了一个统一的框架,称为动态生成对抗网络(DynGAN)。该方法通过对可观察的判别器输出设置相应阈值,检测出生成器无法生成的样本,即崩溃样。根据这些崩溃样本划分训练集,然后在这些划分上训练动态条件的生成模型。
这项研究结果理论确保了所提新方法DynGAN的渐进式模式覆盖。合成数据集和现实世界数据集的实验表明,DynGAN在克服模式崩溃方面超过了现有GAN及其变体。研究人员表示,该研究工作不仅推进了生成对抗网络的理论研究,也为完善生成模型的模式覆盖提供了重要的实现手段。
(中国科大供图)
责任编辑:孙莹
2024-02-28 14:59:59
文章来源:http://www.stdaily.com/index/kejixinwen/202402/e589f68c0d624336881c1a00a3b9be6a.shtml