Learning
토픽 42 / 172·딥러닝

CNN 아키텍처

CNN 아키텍처

컴퓨터 비전 문제 해결을 위해 설계된 대표적인 CNN 구조들로, LeNet부터 ResNet까지 점진적으로 발전하며 깊이·성능·효율을 개선

주요아키텍처

  • LeNet-5 (1998): 최초CNN, 7층, 손글씨인식(MNIST), Conv-Pool-FC
  • AlexNet (2012): ImageNet우승, 8층, ReLU·Dropout·GPU, 딥러닝혁명
  • VGG (2014): 3×3필터반복, 16/19층, 깊은네트워크, 단순구조
  • GoogLeNet/Inception (2014): Inception모듈(다중필터병렬), 22층, 파라미터효율
  • ResNet (2015): 잔차연결(Residual Connection), 152층, 기울기소실해결, 매우깊은네트워크
  • MobileNet (2017): 깊이분리합성곱, 경량화, 모바일·엣지
  • EfficientNet (2019): 복합스케일링(깊이·너비·해상도), 최고효율

핵심기법

  • 잔차연결(ResNet): Skip Connection, F(x)+x, 기울기소실방지
  • Inception모듈(GoogLeNet): 1×1·3×3·5×5 병렬, 다중스케일
  • 배치정규화(Batch Normalization): 학습안정화

적용사례: 이미지분류(ResNet·EfficientNet), 객체탐지(백본), 전이학습

비교: LeNet(초기) < AlexNet(혁명) < VGG(단순·깊음) < ResNet(매우깊음) < EfficientNet(효율)

연관: CNN, ResNet, VGG, AlexNet, 잔차연결, 전이학습