토픽 78 / 172·컴퓨터 비전과 NLP
컴퓨터 비전 (Computer Vision)
컴퓨터 비전 (Computer Vision)
컴퓨터가 이미지와 비디오를 이해·분석·해석하는 AI 분야로, 객체 탐지·이미지 분류·이미지 분할 등의 작업을 수행하며 CNN을 핵심 기술로 사용
특징: 시각 데이터 처리, 공간적 패턴 학습, CNN/ViT 기반, 대규모 데이터 필요
주요작업: 이미지분류(ResNet·ViT), 객체탐지(YOLO·Faster R-CNN), 이미지분할(U-Net·Mask R-CNN), 얼굴인식(ArcFace), 포즈추정(OpenPose), OCR(문자인식)
핵심기술: CNN, ResNet, YOLO, Mask R-CNN, Vision Transformer
적용사례: 자율주행, 의료영상진단, 얼굴인식, 공장품질검사, AR
비교: CNN기반(합성곱·로컬패턴) vs ViT기반(어텐션·글로벌패턴) vs 하이브리드(CNN+Transformer)
연관: CNN, 객체탐지, 이미지분할, ResNet, YOLO