토픽 196 / 201·비교표

컴퓨터 비전과 NLP

CNN 기반 vs ViT 기반 vs 하이브리드

항목	CNN 기반	ViT 기반	하이브리드
핵심 연산	합성곱	Self-Attention	CNN+Transformer
패턴 인식	로컬 패턴 우수	글로벌 패턴 우수	장점 결합
데이터 요구	적은 데이터 우수	대규모 데이터 우수	중간
귀납 편향	있음 (지역성)	약함	중간

Two-Stage vs One-Stage (객체 탐지)

항목	Two-Stage	One-Stage
정의	영역제안 → 분류	단일 네트워크 통합
대표	Faster R-CNN	YOLO, SSD
정확도	높음	상대적 낮음
속도	느림	빠름 (실시간)
적용	정밀 탐지	실시간 모니터링

Semantic vs Instance vs Panoptic Segmentation

항목	Semantic	Instance	Panoptic
분할 대상	픽셀→클래스	객체별 분할	통합 (둘 다)
객체 구분	같은 클래스 미구분	개별 객체 구분	개별 구분 + 배경
대표 모델	FCN, DeepLab	Mask R-CNN	Panoptic FPN

TF-IDF vs Word2Vec vs BERT (텍스트 표현)

항목	TF-IDF	Word2Vec	BERT
표현 유형	희소 벡터	밀집 (정적)	밀집 (동적 문맥)
문맥 반영	불가	불가 (고정 벡터)	양방향 문맥 반영
학습	불필요 (통계)	사전학습	대규모 사전학습
적용	검색, 키워드	유사도, 전이학습	SOTA NLP 전반

협업 필터링 vs 콘텐츠 기반 vs 딥러닝 (추천)

항목	협업 필터링	콘텐츠 기반	딥러닝
기반	사용자 행동 패턴	아이템 특징 속성	복합 패턴
장점	도메인 지식 불필요	콜드스타트 대응	최고 성능
단점	콜드스타트 문제	필터버블	높은 비용

LiDAR SLAM vs Visual SLAM vs Visual-Inertial SLAM

항목	LiDAR SLAM	Visual SLAM	Visual-Inertial SLAM
센서	LiDAR	카메라(단안/스테레오)	카메라 + IMU
정밀도	높음(cm급)	중간	높음
비용	고비용	저비용	중간
적합 환경	실외/대규모	실내/텍스처 풍부	빠른 움직임/실내외

목록 ←생성형 AI와 LLM 활용 다음: MLOps와 모델 운영→