论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery


combine CLIP with StyleGAN

一.introduction and related work


2、text prompt 文本提示

3、related work about  image manipulation base on text-guided 

Some  methods  [10,  31,  27]  use  a  GAN-based  encoder-decoder architecture, to disentangle the semantics of both input images and text descriptions.  ManiGAN [22] introduces a novel text-image combination module, which produces high-quality images. 

A  concurrent  work  to  ours,  TediGAN  [51],  also  uses StyleGAN for text-guided image generation and manipulation. 

[10]  H. Dong, Simiao Yu, Chao Wu, and Y. Guo. Semantic imagesynthesis via adversarial learning.Proc. ICCV, pages 5707–5715, 2017

[27]Yahui Liu, Marco De Nadai, Deng Cai, Huayang Li, XavierAlameda-Pineda,  N.  Sebe,  and  Bruno  Lepri.Describewhat to change: A text-guided unsupervised image-to-imagetranslation approach.Proceedings of the 28th ACM Interna-tional Conference on Multimedia, 2020

[31]Seonghyeon  Nam,  Yunji  Kim,  and  S.  Kim.   Text-adaptivegenerative adversarial networks:  Manipulating images withnatural language. InNeurIPS, 2018

4、While most works perform image manipulations in the W or W+ spaces,  Wuet  al.  [50]  proposed  to  use  the StyleSpace S, and showed that it is better disentangled than W and W+

 Our latent optimizer and mapper work in the W+ space, while the input-agnostic directions that we detect are in S.


In this work we explore three ways for text-driven image manipulation:

1.We first introduce an optimization scheme that utilizes a CLIP-based loss to modify an input latent vector in response to a user-provided text prompt.

2.we describe a latent mapper  that  infers  a  text-guided  latent  manipulation  step  fora given input image, allowing faster and more stable text-based manipulation.

3.Finally, we present a method for mapping  a  text  prompts  to  input-agnostic  directions  in  Style-GAN’s style space,  enabling interactive text-driven image manipulation. 


Latent Optimization: 将CLIP作为loss网络,这是最通用的方法,但是修改一张图片需要好几分钟。
Latent Mapper:固定文本提示,以待修改的图片作为起点,Mapper推理根据文本提示该如何修改图片,然后对图片进行修改。
Global Direction:与方法2类似,将文本提示映射到StyleGAN的‘style’空间,从而修改图像。

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第1张


论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第2张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第3张

 论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第4张

 论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第5张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第6张

 论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第7张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第8张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第9张

免责声明:文章转载自《论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery》仅用于学习参考。如对内容有疑问,请及时联系本站处理。


宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=


解决springboot——集成 mybatis遇到的问题:No MyBatis mapper was found in '[com.example.demo]' package...

不多说,直接上排查方法: 步骤1、pom 引入 依赖mybatis-spring-boot-starter2、启动类中 注解扫描mapper接口@MapperScan(basePackages = "com.xxx.mapper") 3、配置文件application.properties中介入xml地址mybatis.mapper-locations=...

mybatis mapper学习1-mapper.xml映射文件生成:Mybatis Generator的下载-安装-配置-运行

mybatis3系列文章目录链接 1.下载eclipse 点击eclipse mars.1 下载eclipse mars.1版本  2.下载Mybatis Generator 插件 1)在线安装 在eclipse中 marketplace搜索Mybatis Generator 插件install安装  2)离线安装 在这个页面下载generator-...

解决Intellij IDEA中Mybatis Mapper自动注入警告

问题描述: 首先说明自己出现上述原因是因为在mapper接口上方用的是@mapper标签,如果用@Repository标签替换可以解决这个问题 (idea可以理解Spring的上下文。然而 UserMapper 这个接口是Mybatis的,IDEA理解不了。 而 @Autowired 注解,默认情况下要求依赖对象(也就是 userMapper )必须存在...


写在前面: 我是 扬帆向海,这个昵称来源于我的名字以及女朋友的名字。我热爱技术、热爱开源、热爱编程。技术是开源的、知识是共享的。 这博客是对自己学习的一点点总结及记录,如果您对 Java、算法 感兴趣,可以关注我的动态,我们一起学习。 用知识改变命运,让我们的家人过上更好的生活。 学习使用一些插件,可以提高平常工作中的开发效率。对于我们开发人员很有帮助...


一、简介 1、基本概念 mybatis 是一个半自动轻量级的一个 orm 框架 将 java 与 sql 分离,解决了 jdbc 的硬编码问题; sql 由开发人员控制,更加方便 sql 的修改调优; 2、入门程序 2.1 原始方法:通过 sqlsession 来操作数据库 建一个全局配置文件(mybatis-config.xml),配置数据源等运行...


Mybatis实现多表查询有三种方式: (需求:给一个实体类设置属性值,但该实体类的数据保存在数据库的两张表中) 1,分别对两张表进行查询,将获取到的数据分别赋值给实体类。 2,编写多表查询的sql语句,通过给查询到的数据设置与实体类相同的别名,使用Auto Mapping特性,将查询结果自动映射到实体类。 3,使用MyBatis的<resultMa...