论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery

摘要:
为了完成这项任务,CLIP是一个需要学习识别图像中各种视觉概念并将视觉概念与图像关联起来的模型。因此,CLIP几乎可以用于任何视觉人工任务。LatentMaper:固定文本提示,以要修改的图片为起点。Mapper推理如何根据文本提示修改图片,然后修改图片。GlobalDirection:与方法2类似,通过将文本提示映射到StyleGAN的“style”空间来修改图像。

combine CLIP with StyleGAN

一.introduction and related work

1、CLIP主要完成的任务是:给定一幅图像,在32768个随机抽取的文本片段中,找到能匹配的那个文本。为了完成这个任务,CLIP这个模型需要学习识别图像中各种视觉概念,并将视觉概念将图片关联,也因此,CLIP可以用于几乎任意视觉人类任务。例如,一个数据集的任务为区分猫和狗,则CLIP模型预测图像更匹配文字描述“一张狗的照片”还是“一张猫的照片”。

2、text prompt 文本提示

3、related work about  image manipulation base on text-guided 

Some  methods  [10,  31,  27]  use  a  GAN-based  encoder-decoder architecture, to disentangle the semantics of both input images and text descriptions.  ManiGAN [22] introduces a novel text-image combination module, which produces high-quality images. 

A  concurrent  work  to  ours,  TediGAN  [51],  also  uses StyleGAN for text-guided image generation and manipulation. 

[10]  H. Dong, Simiao Yu, Chao Wu, and Y. Guo. Semantic imagesynthesis via adversarial learning.Proc. ICCV, pages 5707–5715, 2017

[27]Yahui Liu, Marco De Nadai, Deng Cai, Huayang Li, XavierAlameda-Pineda,  N.  Sebe,  and  Bruno  Lepri.Describewhat to change: A text-guided unsupervised image-to-imagetranslation approach.Proceedings of the 28th ACM Interna-tional Conference on Multimedia, 2020

[31]Seonghyeon  Nam,  Yunji  Kim,  and  S.  Kim.   Text-adaptivegenerative adversarial networks:  Manipulating images withnatural language. InNeurIPS, 2018

4、While most works perform image manipulations in the W or W+ spaces,  Wuet  al.  [50]  proposed  to  use  the StyleSpace S, and showed that it is better disentangled than W and W+

 Our latent optimizer and mapper work in the W+ space, while the input-agnostic directions that we detect are in S.

二.contributions

In this work we explore three ways for text-driven image manipulation:

1.We first introduce an optimization scheme that utilizes a CLIP-based loss to modify an input latent vector in response to a user-provided text prompt.

2.we describe a latent mapper  that  infers  a  text-guided  latent  manipulation  step  fora given input image, allowing faster and more stable text-based manipulation.

3.Finally, we present a method for mapping  a  text  prompts  to  input-agnostic  directions  in  Style-GAN’s style space,  enabling interactive text-driven image manipulation. 

中文:

Latent Optimization: 将CLIP作为loss网络,这是最通用的方法,但是修改一张图片需要好几分钟。
Latent Mapper:固定文本提示,以待修改的图片作为起点,Mapper推理根据文本提示该如何修改图片,然后对图片进行修改。
Global Direction:与方法2类似,将文本提示映射到StyleGAN的‘style’空间,从而修改图像。

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第1张

 三.method

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第2张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第3张

 论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第4张

 论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第5张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第6张

 论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第7张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第8张

论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery第9张

免责声明:文章转载自《论文阅读笔记StyleCLIP: TextDriven Manipulation of StyleGAN Imagery》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇统一项目管理平台(UMPLatForm.NET)【开发实例】之产品管理(WinForm)拯救者y7000p降低风扇声(个人简易做法,非bios)下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

解决springboot——集成 mybatis遇到的问题:No MyBatis mapper was found in '[com.example.demo]' package...

不多说,直接上排查方法: 步骤1、pom 引入 依赖mybatis-spring-boot-starter2、启动类中 注解扫描mapper接口@MapperScan(basePackages = "com.xxx.mapper") 3、配置文件application.properties中介入xml地址mybatis.mapper-locations=...

mybatis mapper学习1-mapper.xml映射文件生成:Mybatis Generator的下载-安装-配置-运行

mybatis3系列文章目录链接 1.下载eclipse 点击eclipse mars.1 下载eclipse mars.1版本  2.下载Mybatis Generator 插件 1)在线安装 在eclipse中 marketplace搜索Mybatis Generator 插件install安装  2)离线安装 在这个页面下载generator-...

解决Intellij IDEA中Mybatis Mapper自动注入警告

问题描述: 首先说明自己出现上述原因是因为在mapper接口上方用的是@mapper标签,如果用@Repository标签替换可以解决这个问题 (idea可以理解Spring的上下文。然而 UserMapper 这个接口是Mybatis的,IDEA理解不了。 而 @Autowired 注解,默认情况下要求依赖对象(也就是 userMapper )必须存在...

IDEA中比较实用的几款插件

写在前面: 我是 扬帆向海,这个昵称来源于我的名字以及女朋友的名字。我热爱技术、热爱开源、热爱编程。技术是开源的、知识是共享的。 这博客是对自己学习的一点点总结及记录,如果您对 Java、算法 感兴趣,可以关注我的动态,我们一起学习。 用知识改变命运,让我们的家人过上更好的生活。 学习使用一些插件,可以提高平常工作中的开发效率。对于我们开发人员很有帮助...

java框架之mybatis

一、简介 1、基本概念 mybatis 是一个半自动轻量级的一个 orm 框架 将 java 与 sql 分离,解决了 jdbc 的硬编码问题; sql 由开发人员控制,更加方便 sql 的修改调优; 2、入门程序 2.1 原始方法:通过 sqlsession 来操作数据库 建一个全局配置文件(mybatis-config.xml),配置数据源等运行...

mybatis多表查询

Mybatis实现多表查询有三种方式: (需求:给一个实体类设置属性值,但该实体类的数据保存在数据库的两张表中) 1,分别对两张表进行查询,将获取到的数据分别赋值给实体类。 2,编写多表查询的sql语句,通过给查询到的数据设置与实体类相同的别名,使用Auto Mapping特性,将查询结果自动映射到实体类。 3,使用MyBatis的<resultMa...