728x90
FC(완전연결) 계층의 문제점
완전 연결 계층(fully connected layer)을 이용해 MNIST 데이터 셋을 분류하는 모델을 만들 때, 3 차원(세로, 가로, 채널)인 MNIST 데이터(28, 28, 1)를 입력 층(input layer)에 넣어주기 위해서 아래의 그림처럼, 3 차원 → 1 차원의 평평한(flat) 데이터로 펼쳐줘야 한다.
즉, (28, 28, 1)의 3 차원 데이터를 28X28X1= 784의 1 차원 데이터로 바꾼 다음 입력 층에 넣었다.
이러한 완전 연결 계층의 문제점은 바로 '데이터의 형상이 무시' 된다는 것
이미지 데이터의 경우 3 차원(세로, 가로, 채널)의 형상을 가지며, 이 형상에는 '공간적 구조(spatial structure)'를 가진다.
예를 들어 공간적으로 가까운 픽셀은 값이 비슷하거나, RGB의 각 채널은 서로 밀접하게 관련되어 있거나, 거리가 먼 픽셀 끼리는 관련이 없는 등, 이미지 데이터는 3 차원 공간에서 이러한 정보들이 내포 되어있다.
하지만, 완전 연결 계층에서 1 차원의 데이터로 펼치게 되면 이러한 정보들이 사라지게 된다.
CNN(합성곱층)
완전 연결 계층과는 달리 '합성 곱층(convolutional layer)'은 아래의 그림과 같이 입력 데이터의 형상을 유지한다.
3 차원의 이미지 그대로 입력 층에 입력 받으며, 출력 또한 3 차원 데이터로 출력하여 다음 계층(layer)으로 전달하기 때문에 CNN에서는 이미지 데이터처럼 형상을 가지는 데이터를 제대로 학습할 가능성이 높다고 할 수 있다.
'스터디 > 딥러닝' 카테고리의 다른 글
Chapter1. 한눈에 보는 머신러닝 (0) | 2022.07.20 |
---|---|
[논문] ViT(Vision Transformer) (0) | 2022.07.18 |
Pytorch vs Tensorflow (0) | 2022.03.15 |
CNN-based Approaches For Cross-Subject Classification in Motor Imagery: From The State-of-The-Art to DynamicNet (0) | 2022.03.12 |
핸즈온 머신러닝(Hands-On Machine Learning) 18장 - 강화학습(3) (0) | 2021.10.31 |