Learning
토픽 79 / 172·컴퓨터 비전과 NLP

객체 탐지 (Object Detection)

객체 탐지 (Object Detection)

이미지나 비디오에서 여러 객체의 위치(바운딩박스)와 클래스를 동시에 찾아내는 컴퓨터 비전 작업으로, 자율주행·보안·의료 등에 활용

방법

  • Two-Stage: 영역제안 → 분류, R-CNN·Fast R-CNN·Faster R-CNN, 정확·느림
  • One-Stage: 단일네트워크, YOLO·SSD·RetinaNet, 빠름·실시간

대표알고리즘

  • YOLO (You Only Look Once): 실시간, 그리드기반, 빠름
  • Faster R-CNN: RPN(영역제안네트워크), 높은정확도
  • RetinaNet: Focal Loss, 불균형해결

평가지표: IoU(Intersection over Union), mAP(mean Average Precision)

적용사례: 자율주행(차량·보행자탐지), 보안(이상행동), 의료(종양탐지)

비교: Two-Stage(정확·느림) vs One-Stage(빠름·실시간)

연관: 컴퓨터비전, CNN, YOLO, Faster R-CNN, 이미지분할