본문 바로가기
스터디/딥러닝

CNN VS FC

by ag_zero 2022. 7. 14.
728x90

FC(완전연결) 계층의 문제점

완전 연결 계층(fully connected layer)을 이용해 MNIST 데이터 셋을 분류하는 모델을 만들 때, 3 차원(세로, 가로, 채널)인 MNIST 데이터(28, 28, 1)를 입력 층(input layer)에 넣어주기 위해서 아래의 그림처럼, 3 차원 → 1 차원의 평평한(flat) 데이터로 펼쳐줘야 한다.

즉, (28, 28, 1)의 3 차원 데이터를 28X28X1= 784의 1 차원 데이터로 바꾼 다음 입력 층에 넣었다.

이러한 완전 연결 계층의 문제점은 바로 '데이터의 형상이 무시' 된다는 것

이미지 데이터의 경우 3 차원(세로, 가로, 채널)의 형상을 가지며, 이 형상에는 '공간적 구조(spatial structure)'를 가진다.

예를 들어 공간적으로 가까운 픽셀은 값이 비슷하거나, RGB의 각 채널은 서로 밀접하게 관련되어 있거나, 거리가 먼 픽셀 끼리는 관련이 없는 등, 이미지 데이터는 3 차원 공간에서 이러한 정보들이 내포 되어있다.

하지만, 완전 연결 계층에서 1 차원의 데이터로 펼치게 되면 이러한 정보들이 사라지게 된다.

 

 

CNN(합성곱층)

완전 연결 계층과는 달리 '합성 곱층(convolutional layer)'은 아래의 그림과 같이 입력 데이터의 형상을 유지한다.

3 차원의 이미지 그대로 입력 층에 입력 받으며, 출력 또한 3 차원 데이터로 출력하여 다음 계층(layer)으로 전달하기 때문에 CNN에서는 이미지 데이터처럼 형상을 가지는 데이터를 제대로 학습할 가능성이 높다고 할 수 있다.