토픽 196 / 201·비교표
컴퓨터 비전과 NLP
CNN 기반 vs ViT 기반 vs 하이브리드
| 항목 | CNN 기반 | ViT 기반 | 하이브리드 |
|---|
| 핵심 연산 | 합성곱 | Self-Attention | CNN+Transformer |
| 패턴 인식 | 로컬 패턴 우수 | 글로벌 패턴 우수 | 장점 결합 |
| 데이터 요구 | 적은 데이터 우수 | 대규모 데이터 우수 | 중간 |
| 귀납 편향 | 있음 (지역성) | 약함 | 중간 |
Two-Stage vs One-Stage (객체 탐지)
| 항목 | Two-Stage | One-Stage |
|---|
| 정의 | 영역제안 → 분류 | 단일 네트워크 통합 |
| 대표 | Faster R-CNN | YOLO, SSD |
| 정확도 | 높음 | 상대적 낮음 |
| 속도 | 느림 | 빠름 (실시간) |
| 적용 | 정밀 탐지 | 실시간 모니터링 |
Semantic vs Instance vs Panoptic Segmentation
| 항목 | Semantic | Instance | Panoptic |
|---|
| 분할 대상 | 픽셀→클래스 | 객체별 분할 | 통합 (둘 다) |
| 객체 구분 | 같은 클래스 미구분 | 개별 객체 구분 | 개별 구분 + 배경 |
| 대표 모델 | FCN, DeepLab | Mask R-CNN | Panoptic FPN |
TF-IDF vs Word2Vec vs BERT (텍스트 표현)
| 항목 | TF-IDF | Word2Vec | BERT |
|---|
| 표현 유형 | 희소 벡터 | 밀집 (정적) | 밀집 (동적 문맥) |
| 문맥 반영 | 불가 | 불가 (고정 벡터) | 양방향 문맥 반영 |
| 학습 | 불필요 (통계) | 사전학습 | 대규모 사전학습 |
| 적용 | 검색, 키워드 | 유사도, 전이학습 | SOTA NLP 전반 |
협업 필터링 vs 콘텐츠 기반 vs 딥러닝 (추천)
| 항목 | 협업 필터링 | 콘텐츠 기반 | 딥러닝 |
|---|
| 기반 | 사용자 행동 패턴 | 아이템 특징 속성 | 복합 패턴 |
| 장점 | 도메인 지식 불필요 | 콜드스타트 대응 | 최고 성능 |
| 단점 | 콜드스타트 문제 | 필터버블 | 높은 비용 |
LiDAR SLAM vs Visual SLAM vs Visual-Inertial SLAM
| 항목 | LiDAR SLAM | Visual SLAM | Visual-Inertial SLAM |
|---|
| 센서 | LiDAR | 카메라(단안/스테레오) | 카메라 + IMU |
| 정밀도 | 높음(cm급) | 중간 | 높음 |
| 비용 | 고비용 | 저비용 | 중간 |
| 적합 환경 | 실외/대규모 | 실내/텍스처 풍부 | 빠른 움직임/실내외 |