前言 受最近对比学习范式的启发,作者团队首先提出一种无监督的退化表征学习策略,旨在利用对比学习和视觉注意力的最新进展,预训练一个退化表示编码器(DRE)。DRE 提取输入退化人脸图像的退化表征,作为全局条件指导恢复过程。此外,作者还提出了一种新的退化感知特征插值(DAFI)模块,可以根据退化表征动态融合 GAN 先验特征和从退化人脸图像中提取的特征。作者团队进一步提出了一种新的网络,以集成这些设计用于人脸修复任务。由于选择和融合不同来源的特征的思路类似于制作 panini (帕尼尼,KFC早餐经典食品)的方式,因此将这个网络称为 Panini-Net。该网络可以根据退化程度动态调整融合的特征比例,以实现更好的修复性能。
本文转载自GiantPandaCV
作者 | owen 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
计算机视觉入门1v3辅导班
Paper:AAAI'22 - Panini-Net: GAN Prior Based Degradation-Aware Feature Interpolation for Face Restoration
Authors:Yinhuai Wang, Yujie Hu, Jian Zhang 背景介绍
人脸修复是一种典型的ill-posed问题、可逆图像修复问题,其解不唯一且必存在。高度退化和多退化的场景下,高质量的人脸修复明显更具有挑战性。传统深度学习方法利用成对的数据集训练模型从而获得处理该退化问题的能力,这些普通范式虽然在全局人脸结构上有不错的效果,但是明显在修复结果的细节丰富度上并不理想。因此,近一两年,顶会上出现了不少基于GAN先验特征的人脸修复方法。这些方法通过将退化的人脸图像编码到训练好的GAN网络的潜在空间中,利用隐藏在GAN网络中丰富的图像先验知识,来获得更好的人脸修复细节。但是,常见的GAN网络的latent features维度并不高,这些特征的空间表达能力也不佳,难以完整捕获退化人脸图像的面部结构,造成恢复结果的身份信息与原图并不一致,即方法结果的保真度较低。为了进一步、更完整得捕获输入退化图像的面部特征,一些方法不仅将降质人脸图像编码到潜空间中,而且还将外部特征(例如从降质人脸图像中提取的特征)与 GAN 先验特征融合起来,以实现更好的身份一致性。然而,它们并没有提供明确的降质感知的特征融合设计,因此在面对不同的、多变的退化时,修复效果的鲁棒性并不理想。 方法介绍