文/编辑 | 言有三
作为被誉为“下一代深度学习技术”,同时已经在工业界能够真正成熟稳定应用的GAN,有三AI一直在关注相关的技术,并输出了大量的内容。
那如何从理论上和实践上更好地学好GAN这一个基础技术呢?为了满足更多的朋友们能够更加方便地与大家交流并且得到实时的指导,我们给有三AI秋季划新增了了GAN小组,介绍如下:
GAN小组学习内容
与另外三个秋季划小组,即“模型优化”,“人脸算法”,“图像质量”一样,我们对GAN的学习也分为若干方向,包括基础理论,结构设计,图像与视频生成,语音生成,图像增强,风格迁移,图像编辑,综合使用技巧(具体学习顺序灵活决定)。
1 基础理论
这一部分主要是学习对GAN的基础理论的理解以及评估,包括:
(1) GAN的算法原理
(2) GAN的优化
(3) GAN的评估
(4) GAN的理解
2 结构设计
这一部分主要是学习对GAN的各种各样的结构进行设计和调参改进,包括:
(1) GAN的基本结构
(2) GAN中判别器的改进
(3) GAN中生成器的改进
(4) GAN结构单元的使用(归一化层,注意力机制等)
3 图像与视频生成
这一部分主要是学习图像生成和视频生成技术,这是GAN最为人熟知的应用,包括:
(1) 图像生成技术的基本原理
(2) 视频生成技术的基本原理
(3) 如何提高生成图像和视频的质量
(4) 如何使用GAN提高已有数据的质量
4 语音生成
这一部分主要是学习语音的基础以及GAN在其中的应用,包括:
(1) 语音技术的基础概念
(2) 语音合成的基本原理
(3) 如何使用GAN合成语音
(4) 如何使用GAN提高语音的质量
5 图像增强
这一部分主要是学习GAN在图像增强领域中的应用:
(1) GAN如何用于图像降噪
(2) GAN如何用于图像去模糊
(3) GAN如何用于图像超分辩
(4) GAN如何用于提升图像的美学质量
6 风格迁移
这一部分主要是学习GAN在图像风格化中的应用:
(1) 图像风格化基础
(2) 人脸的风格化
(3) 通用图像的风格化
7 图像编辑
这一部分主要是学习GAN在图像编辑中的应用:
(1) 图像编辑基础
(2) 人脸的编辑,包括人脸年龄,表情,姿态,以及换脸等
(3) 通用图像的编辑,包括深度,纹理等
8 使用技巧
这一部分主要是总结GAN的使用技巧:
(1) 对抗思想在图像经典任务中的使用,包括图像分类,图像分割,目标检测等
(2) GAN的训练技巧
(3) 增强学习与GAN的结合
除了以上的内容,还会学习GAN在模型优化,多模态融合等方向相关的技术。