GAN(Generative Adversarial Network, 생성적 적대 신경망)은 2014년 이언 굿펠로우(Ian Goodfellow)가 제안한 혁신적 생성 모델입니다.
두 신경망 — 「생성자(Generator)」와 「판별자(Discriminator)」 — 가 서로 경쟁하면서 학습하는 독특한 구조입니다.
생성자의 역할은 「가짜 이미지를 만들어 판별자를 속이는 것」이고, 판별자의 역할은 「입력이 진짜 이미지인지 생성자가 만든 가짜인지 구별하는 것」입니다.
두 신경망은 마치 「위조지폐범」과 「경찰」처럼 서로 능력을 끌어올립니다.
비유하자면 GAN은 「화가가 위조 그림을 그리고, 감정사가 그것을 진위 감별하는 끊임없는 대결」과 같습니다.
화가는 더 그럴듯한 위조를 만들려 노력하고, 감정사는 더 미묘한 차이를 찾아내려 노력합니다.
이 경쟁이 평형에 이르면 화가의 작품이 진품과 구별되지 않을 만큼 정교해집니다.
GAN은 사진처럼 사실적인 가짜 얼굴, 풍경, 예술 작품을 생성하는 능력으로 큰 충격을 줬습니다.
「This Person Does Not Exist」 같은 사이트는 GAN이 만들어 낸 존재하지 않는 사람의 사진을 매번 새로 보여 줍니다.
단점은 학습이 매우 불안정하다는 점입니다.
두 신경망의 경쟁이 평형을 이루기 어려워 한쪽만 일방적으로 강해지거나(모드 붕괴), 학습이 발산하는 일이 잦았습니다.
그래서 2020년 이후 더 안정적인 Diffusion 모델에 자리를 점차 내주는 추세이지만, 여전히 빠른 추론과 적은 자원이 필요한 분야에서 강한 경쟁력을 가집니다.
한 줄 요약
GAN은 「가짜를 만드는 생성자」와 「진위를 가리는 판별자」 두 신경망의 경쟁으로 사실적인 이미지를 만들어 내는 모델로, 한때 생성 AI의 왕좌였으나 현재는 Diffusion에 자리를 일부 내주고 있습니다.
더 알아볼 것
- DCGAN — 안정적 GAN의 첫 표준
- WGAN·SNGAN — 학습 안정화 기법
- GAN vs Diffusion — 두 패러다임의 비교