Replicated

생성 모델 본문

학부/빅데이터마이닝

생성 모델

라구넹 2025. 6. 8. 15:29

생성 모델과 판별 모델

- 판별 모델에서는 이미지를 정확히 분류하거나 이미지 내 객체를 검출하는 등이 목적

- 생성 모델은 입력 이미지에 대한 데이터 분포를 학습해 새로운 이미지를 생성하는 것이 목적

 

확률 변수의 유무에 따른 구분

- 확률 변수 p(x): 주어진 데이터 x가 관측될 확률을 나타내는 분포. 전체 학습 데이터의 분포로 생각해도 됨

- 변형 오토 인코더: 확률 변수를 명시적으로 정의하여 사용 (명시적 방법)

- GAN: 확률 변수에 대한 정의가 없는 모델 (암시적 방법)

 

오토인코더

- 단순히 입력을 출력으로 복사하는 신경망, 은닉층(혹은 병목층이라고도 함)의 노드 수가 입력 값보다 적은 것이 특징

- 데이터를 압축한다는 의미

 

오토 인토더 vs 변형 오토인코더 (Variational Autoencoder)

- 오토인코더는 입력->인코더->압축(차원축소)->디코더->출력이 나오게 하는 방법

- 오토인코더는 차원을 줄이는 것이 목표이기에 새롭게 생성된 데이터의 확률 분포에는 관심이 없음

- 오토인코더는 데이터 벡터에 대한 차원을 축소하여 실제 이미지와 동일한 이미지를 출력하는 것이 목적이었다면, 변형 오토인코더는 데이터가 만들어지는 확률 분포를 찾아 비슷한 데이터를 생성하는 것이 목적

 

- 인코더 층의 출력으로 표준편차와 평균 생성

- 구해진 표준편차와 평균을 가진 가우시안이 표준 정규 분포를 따르도록 학습

- 표준 정규 분포에서 값을 샘플링해 디코더를 통과시키면 학습 데이터에 있을법한 이미지를 생성하게 됨

 

 

적대적 신경망 (GAN, Generative Adversarial Network)

- 경찰과 위조지폐범.. 경쟁이 지속되면 위조지폐범의 실력이 점점 좋아진다는 개념

- 생성 모델은 최대한 진짜와 비슷한 데이터를 생성하려는 생성자,

- 진짜와 가짜를 구별하려는 판별자가 각각 존재하여 서로 적대적으로 학습

- 생성자와 판별자는 각각 뉴럴 네트워크로 구성

- 생성자는 랜덤 노이즈로부터 이미지를 생성

- 학습이 완료되면 실제같은 이미지를 만드는 능력을 가진 생성자만을 사용