环球速读:GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

来源:2023-05-16 17:58:01    时间:程序员客栈


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

关键词:

文章推荐

  • 环球速读:GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

    点蓝色字关注“机器学习算法工程师”设为星标,干货直达!自从DALL·E2之后,在图像生成方面扩散模型替代GA

    程序员客栈 2023-05-16
  • 产业跨省“联姻” 山城“链”上起舞|环球精选

    产业跨省“联姻”山城“链”上起舞,山城,张俊,宣城,安徽,皖南,合肥,全产业链

    金台资讯 2023-05-16
  • 美国黑人男子入店行窃逃离时被枪杀 检方未指控开枪者引发抗议

    安东尼在布朗离开时开枪(旧金山地区检察官办公室)海外网5月16日电据英国《卫报》5月16日报道,美国一名黑

    海外网 2023-05-16
  • 天天快播:天舟文化(300148)5月16日主力资金净卖出1.18亿元

    截至2023年5月16日收盘,天舟文化(300148)报收于5 11元,下跌12 65%,换手率21 33%,成交量165 37万手,成交额8 96亿元。

    证券之星 2023-05-16
  • 维金斯:希望伊戈达拉继续打球 他的生涯足够精彩&是一位传奇

    昨日西部半决赛G6,勇士不敌湖人被淘汰出局,勇士今日举办了赛季总结新闻发布会,维金斯参加并接受了采访。

    直播吧 2023-05-16
  • X 关闭

  • 众测
  • more+

    京张高铁每日开行17对冬奥列车

      京张高铁每日开行17对冬奥列车  预计冬奥服务保障期运送运动员、技术官员、持票观众等20万人次  2月6日,2022北京新闻中心举行“北

    北京冬奥会开幕式上 小学生朱德恩深情演绎《我和我的祖国》

      北京冬奥会开幕式上 小学生朱德恩深情演绎《我和我的祖国》  9岁小号手苦练悬臂吹响颂歌  2月4日晚,在北京冬奥会开幕式上,9岁的

    2022北京冬奥会开幕式这19首乐曲串烧不简单

      多名指挥家列曲目单 再由作曲家重新编曲 本报专访冬奥开幕式音乐总监赵麟  开幕式这19首乐曲串烧不简单  “二十四节气”倒计时、

    “一墩难求” 冰墩墩引爆购买潮

    设计师:没想到冰墩墩成爆款一墩难求冰墩墩引爆购买潮 北京冬奥组委:会源源不断供货北京冬奥会吉祥物冰墩墩近日引爆购买潮,导致一墩难求