E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
VQGAN
【深度学习】CodeFormer训练过程,如何训练人脸修复模型CodeFormer
文章目录BasicSR介绍环境数据阶段I-
VQGAN
阶段II-CodeFormer(w=0)阶段III-CodeFormer(w=1)代码地址:https://github.com/sczhou/CodeFormer
XD742971636
·
2024-01-26 00:54
深度学习机器学习
深度学习
人工智能
codeformer
人脸修复
python之AI视频去码&图片修复CodeFormer,把你的老照片变漂亮
CodeFormer介绍CodeFormer是由南洋理工大学-商汤科技联合研究中心S-Lab在NeurIPS2022上提出的一种基于
VQGAN
+Transformer的人脸复原模型。
特立独行的猫a
·
2024-01-18 00:31
趣学python编程
1024程序员节
VQGAN
:从图像重建到图像生成
本文的目标是作为全新图像生成系统的
VQGAN
。我已经开始讨论
VQGAN
的一部分——自编码器(VQVAE:矢量量化变分自动编码器)。
小北的北
·
2024-01-17 07:43
人脸清晰化神器codeFormer图形界面包GUI
1.codeFormer介绍在NeurIPS2022上,南洋理工大学-商汤科技联合研究中心S-Lab提出了一种基于
VQGAN
+Transformer的人脸复原模型CodeFormer,效果是真的强大,先展示下效果
滚石deepfacelab
·
2024-01-01 08:46
AI换脸教程
人工智能
图像处理
超分辨率重建
人脸识别
深度学习
LVM Sequential Modeling Enables Scalable Learning for Large Vision Models
通过visualsentences的形式,统一图像/视频/标注/3D数据,使用
VQGAN
将视觉数据编码为token,然后进行预测下一个token的自回归式训练。在测试时,通过构建合适的visualp
Adenialzz
·
2023-12-26 05:09
computer
vision
【论文阅读】RoSteALS: Robust Steganography using Autoencoder Latent Space-2023-CVPR
方法架构图:训练期间只更新秘密编码器和秘密解码器,图像的编码器和解码器是锁定的说明使用自编码器
VQGAN
利用编码器将秘密信息映射到图像的潜在层中,使用Res50作为解码器,当平均验证损失停止
岁月漫长_
·
2023-12-15 13:18
图像隐写
论文阅读
论文阅读
Python开源项目VQFR——人脸重建(Face Restoration),模糊清晰、划痕修复及黑白上色的实践
FaceRestoration),模糊清晰、划痕修复及黑白上色的实践https://blog.csdn.net/beijinghorn/article/details/134334021VQFR也是腾讯LAB的作品,比较忠于德国
VQGAN
深度混淆
·
2023-11-16 09:30
C#入门教程
Beginner‘s
Recipes
python
开发语言
人工智能
(2023|AAAI,MS-
VQGAN
,分层扩散,PyU-Net,粗到细调制)Frido:用于复杂场景图像合成的特征金字塔扩散
Frido:FeaturePyramidDiffusionforComplexSceneImageSynthesis公众号:EDPJ(添加VX:CV_EDPJ或直接进Q交流群:922230617获取资料)目录0.摘要1.简介2.基础3.方法3.1学习多尺度感知潜在3.2特征金字塔潜在扩散模型4.实验4.1数据集和评估4.2条件复杂场景生成4.3模型分析5.相关工作6.结论附录E.附加讨论E.1限制
EDPJ
·
2023-10-21 21:04
论文笔记
人工智能
(2023|ICML,LLM,标记掩蔽,并行解码)Muse:使用掩蔽生成 Transformer 的文本到图像生成
Text-To-ImageGenerationviaMaskedGenerativeTransformers公众号:EDPJ(添加VX:CV_EDPJ或直接进Q交流群:922230617获取资料)目录0.摘要1.简介2.模型2.1.预训练文本编码器2.2.使用
VQGAN
EDPJ
·
2023-10-21 20:27
论文笔记
人工智能
CLIP和改进工作
CLIP和改进工作CLIP改进方向语义分割Lseg、GroupViT目标检测ViLD、GLIPv1/v2视频理解VideoCLIP、CLIP4clip、ActionCLIP图像生成
VQGAN
-CLIP、
白蜡虫可
·
2023-10-20 01:04
论文笔记
论文阅读
【
VQGAN
论文精读】Taming Transformers for High-Resolution Image Synthesis
【
VQGAN
论文精读】TamingTransformersforHigh-ResolutionImageSynthesis0、前言Abstract1.Introduction2.RelatedWork3
旋转的油纸伞
·
2023-10-16 08:20
扩散模型+CV与NLP科研笔记
人脸相关科研笔记【AI换脸】
深度学习
计算机视觉
人工智能
VQGAN
生成模型
基于CodeFormer使用C++实现图片模糊变清晰,去除马赛克等效果
该模型通过结合了
VQGAN
和Transformer等技术,可以通过提供模糊或马赛克图像来生成清晰的原始图像。可以实现老照片修复、照片马赛克修复、黑白照片彩色化、低码率视频增强,增加细节等效果。
金戈鐡馬
·
2023-10-15 07:20
人工智能
深度学习
CodeFormer
模糊变清晰
去除马赛克
深度学习
人工智能
VQGAN
理论加代码一对一详解,小白向解析
VQGAN
详解整体网络框架训练过程第一步——CNNEncoder,CNNDecoder,CodebookCNNEncoderCNNDecoderCodebook第二步——Transformer训练最近在看图像生成相关论文
黑洞是不黑
·
2023-09-17 21:57
Diffusion
Model
python
深度学习
stable
diffusion
gan
深入浅出讲解Stable Diffusion原理,新手也能看明白
看了这方面的一些论文,也给人讲过一些这方面的原理,写了一些文章,具体可以参考我的文章:北方的郎:图文匹配:Clip模型介绍北方的郎:
VQGAN
(VectorQuantizedGenerativeAdversarialNetwork
才能我浪费
·
2023-07-20 14:14
stable
diffusion
计算机视觉
人工智能
CLIP和GPT
CLIPCLIP下游应用:
VQGAN
、DALL-ECLIP-Event:ConnectingTextandImageswithEventStructuresHierarchicalText-ConditionalImageGenerationwithCLIPLatentsGPT
Laura_Wangzx
·
2023-06-23 04:17
机器学习与深度学习AI
gpt
深度学习
人工智能
【AI绘画发展史】AI绘画从历史到技术突破,何以突飞猛进?
文章目录AI绘画的进展开源贡献一、CLIP+
VQGAN
二、CLIP三、LAION-5B和LAION-AestheticsAI绘画模型/产品一、DiscoDiffusion二、MidJourney三、StableDiffusionMidJourney
Taylor_29511
·
2023-03-16 08:46
AIGC
AI作画
人工智能
计算机视觉
论文翻译:Text-based Image Editing for Food Images with CLIP
左起第二至第六列显示了
VQGAN
-CLIP所处理的图像。每个操作中使用的提示都是将食物名称和"与"一个配料名称结合起来。
nocol.
·
2023-02-04 09:08
计算机视觉
深度学习
生成对抗网络
图像处理
AI作画
CV-2022:CodeFormer【最强的AI 视频、图片修复】【南洋理工大学 S-Lab】
本文提出了一种基于Transformer+
VQGAN
的人脸重建方案CodeFormer,它可以对低质人脸的组成与上下文信息进行建模,促进自然人脸挖掘以生成与目标人脸更相近的结果。
u013250861
·
2023-01-18 01:58
计算机视觉/CV
人工智能
深度学习
Enhance the Visual Representation via Discrete Adversarial Training
DAT利用
VQGAN
将图像数据改为离散的类似文本的输入,即视觉单词。然后,它使具有符号对抗性扰动的离散图像上的最大风险最小化。我们进一步从分布的角度进行了解释,以证明DAT的有效性。
你今天论文了吗
·
2023-01-13 08:46
对抗攻击
人工智能
自然语言处理
深度学习
ICLR2022 | ViT-
VQGAN
+:Vector-quantized Image Modeling with Improved
VQGAN
论文链接:https://openreview.net/forum?id=pfNyExj7z2|https://arxiv.53yu.com/abs/2110.04627原文标题:Vector-quantizedImageModelingwithImprovedVQGAN一、问题提出Naturallanguageprocessing(NLP)hasrecentlyexperienceddramat
羊飘
·
2023-01-04 09:15
每日读论文
图像生成
CV
论文阅读
论文笔记:
VQGAN
-CLIP:Open Domain Image Generationand Editing with Natural Language Guidance
论文:https://arxiv.org/abs/2204.08583代码:GitHub-EleutherAI/
vqgan
-clip摘要从开放领域的文本提示中生成和编辑图像是一项具有挑战性的任务,到目前为止
nocol.
·
2022-12-21 14:39
论文阅读
深度学习
生成对抗网络
迁移学习
【GitHub】
VQGAN
+CLIP代码从零开始复现
我们在各种任务上证明了使用CLIP来指导
VQGAN
产生的视觉质量比之前不太灵活的方法如minDALL-E、GLID
nocol.
·
2022-12-21 14:39
java
开发语言
爆肝整理全网最全最新AI生成算法【Stable Diffusion|Diffusion Model|DallE2|CLIP|VAE|
VQGAN
】原理解析
1、生成模型首先回顾一下生成模型要解决的问题:如上图所示,给定两组数据z和x,其中z服从已知的简单先验分布π(z)(通常是高斯分布),x服从复杂的分布p(x)(即训练数据代表的分布),现在我们想要找到一个变换函数f,它能建立一种z到x的映射f:z–>x,使得每对于π(z)中的一个采样点z,都能在p(x)中有一个(新)样本点x与之对应。如果这个变换函数能找到的话,那么我们就实现了一个生成模型的构造。
丹心向阳love
·
2022-12-21 14:37
深度学习
迁移学习
计算机视觉
生成对抗网络
图像处理
2021-01-26Taming Transformers for High-Resolution Image Synthesis(arXiv2020)(有代码)
代码链接https://github.com/CompVis/taming-transformers项目主页:https://compvis.github.io/taming-transformers/
VQGAN
NANCYGOODENOUGH
·
2022-12-21 14:06
~~~超分辨率重建~~~
深度学习系列41:多模态Dalle-min生成图像
dalle模型包括:一个基于BART的编码器,将文本token转为图像token一个基于
VQGAN
模型的编解码器,将图像token和图片之间互相转换首先要训练VAGAN模型。
IE06
·
2022-12-21 14:36
深度学习系列
深度学习
python
计算机视觉
深度学习系列29:VQ-GAN模型
VQGAN
的突出点在于其使用codebook来离散编码模型中间特征,并且使用Transformer(GPT-2模型)作为编码生成工具。
IE06
·
2022-12-21 14:05
深度学习系列
深度学习
transformer
计算机视觉
VQ-GAN
VQ-GAN可以用来生成艺术图片如何构建AI生成艺术图片-知乎详解
VQGAN
(一)|结合离散化编码与Transformer的百万像素图像生成-知乎
大吴Heng
·
2022-12-21 14:05
深度学习
深度学习
计算机视觉
transformer
【论文简介】2204.
VQGAN
-CLIP(已开源):Open Domain Image Generation and Editing with Natural Language Guidance
2204.
VQGAN
-CLIP|论文|code基于自然语言导向的开放域图像生成与编辑摘要从开放域(opendomain)文本提示(textprompts)中生成和编辑图像是一项具有挑战性的任务,迄今为止
曾小蛙
·
2022-12-16 06:32
论文解读
#
生成对抗网络
计算机视觉相关
计算机视觉
VQGAN-CLIP
open-domain
text
prompts
CLIP+
VQGAN
这个现象真有趣~~知识库最近有大量使用CLIP+
VQGAN
的数字艺术作品出现,这两项组合技术不知大家都玩过没?
shadowcz007
·
2022-12-12 09:47
html
css
人工智能
ai
计算机视觉
CVPR2021 |
VQGAN
+:Taming Transformers for High-Resolution Image Synthesis
原文标题:TamingTransformersforHigh-ResolutionImageSynthesis主页:TamingTransformersforHigh-ResolutionImageSynthesis代码:https://github.com/CompVis/taming-transformerstransformer比CNN缺少了归纳偏置和局部性,但是更具表现力,但对于长序列(高
羊飘
·
2022-12-12 09:46
图像生成
每日读论文
论文阅读
如何删除pytorch虚拟环境
1.跳出要删除的虚拟环境的目录,比如先切到base环境:2.我要删除的虚拟环境名是
vqgan
,你换成你的名称就行conda envremove-nvqgan这一步有个坑,复制粘贴的命令行会报错:-bash
nocol.
·
2022-12-10 22:13
pytorch
python
深度学习
VQGAN
-CLIP: Open Domain Image Generationand Editing with Natural Language Guidance
1.
VQGAN
-CLIP:在自然语言指导下开放域图像生成和编辑机构:EleutherAIgithub:GitHub-EleutherAI/
vqgan
-clip2.介绍和摘要摘要:从开放域文本提示生成和编辑图像是一项具有挑战性的任务
海柱12
·
2022-11-29 19:11
机器学习
计算机视觉
人工智能
计算机视觉
深度学习
生成对抗网络
图像处理
[GITHUB]
VQGAN
-CLIP复现过程
代码源地址:
VQGAN
-CLIP源码地址代码功能介绍:使用GAN网络,通过英文描述生成图片介绍地址使用软件:pycharm\anaconda\conda易错资源包:torch-1.9.0+cu111-cp39
合辙的记录
·
2022-11-24 13:04
github
pycharm
pytorch
VQGAN
2_latent diffusion model
task1txt2image先根据config一层层调用先是ldm.models.diffusion.ddpm.LatentDiffusion里面super().init(conditioning_key=conditioning_key,*args,**kwargs)然后跑到DDPM类里面DDPM里面调用了DiffusionWrapper然后ldm.modules.diffusionmodule
Ellie进化中的程序猿
·
2022-11-22 00:09
机器学习和深度学习文章精读
深度学习
人工智能
014_SSS_High-Resolution Image Synthesis with Latent Diffusion Models
High-ResolutionImageSynthesiswithLatentDiffusionModels1.Introduction本文提出了在隐空间应用diffusionmodel(DM),称为LatentDiffusionModels(LDM)主要做法是在
VQGAN
Artificial Idiots
·
2022-11-15 07:11
文章阅读笔记
深度学习
人工智能
CLIP改进工作串讲(上)
CLIP改进方向语义分割Lseg、GroupViT目标检测ViLD、GLIPv1/v2视频理解VideoCLIP、CLIP4clip、ActionCLIP图像生成
VQGAN
-CLIP、CLIPasso、
Adenialzz
·
2022-10-16 11:21
计算机视觉
深度学习
计算机视觉
人工智能
文本生成图片
3.DAllE2需要申请4.DALL·Emini有点抽象,也像画https://huggingface.co/spaces/dalle-mini/dalle-mini5.Nüwa尚未开源6.CLIP+
VQGAN
Tarench
·
2022-07-15 10:03
人工智能
计算机视觉
深度学习
字节最新文本生成图像AI,训练集里居然没有一张带文字描述的图片?!
实验数据显示,它的效果比
VQGAN
-CLIP要真实,尤其是泛化能力还比不少用大量文本-图像数据对训练出来的模型要好很多。嗯?不给文字注释AI怎么知道每一张图片代表什么?这个模型到底咋训练出来的?
QbitAl
·
2022-03-28 10:03
深度学习
人工智能
机器学习
大数据
计算机视觉
现在,用音频也能指挥GAN生成图像了
用这个方法搭配
VQGAN
-CLIP,就能实现声音到图像的转变!
QbitAl
·
2021-11-01 13:56
人工智能
计算机视觉
机器学习
深度学习
神经网络
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他