토픽 118 / 172·고급 학습 기법
Few-Shot Learning / Zero-Shot Learning
Few-Shot Learning / Zero-Shot Learning
매우 적은 샘플(Few-Shot, 1~10개) 또는 샘플 없이(Zero-Shot) 새로운 클래스를 인식·분류하는 학습 방법으로, 메타학습(Meta-Learning)이나 사전학습 모델의 일반화 능력을 활용하며 LLM에서는 프롬프트만으로 새 태스크 수행
목적: 데이터 부족 문제 해결, 빠른 적응, 일반화 능력 향상, 새로운 클래스 인식
특징: 적은 샘플·샘플 없이 학습, 메타학습, Prompt 기반(LLM), 일반화 능력 중요
구성요소
- •Support Set: Few-Shot에서 제공되는 소수 샘플(예: 클래스당 5개), Zero-Shot에서는 없음
- •Query Set: 테스트 샘플, 새로운 클래스 인식
- •메타학습(Meta-Learning): "학습하는 방법 학습", MAML, Prototypical Networks
- •사전학습 모델: CLIP(이미지-텍스트), LLM(GPT, BERT), 일반화 능력
Few-Shot Learning
- •정의: 클래스당 1~10개 샘플로 새 클래스 학습(1-shot, 5-shot 등)
- •방법: Prototypical Networks(프로토타입 임베딩), MAML(빠른 적응), Matching Networks
- •LLM Few-Shot: 프롬프트에 예시(In-Context Learning), GPT-3/4
Zero-Shot Learning
- •정의: 샘플 없이 클래스 설명(텍스트)만으로 인식, 보지 못한 클래스 예측
- •방법: CLIP(이미지-텍스트 정렬), 속성 기반(Attribute-Based), 의미 임베딩
- •LLM Zero-Shot: 프롬프트만으로 태스크 수행(예시 없음)
메타학습
- •MAML(Model-Agnostic Meta-Learning): 빠른 적응(Few Gradient Steps)
- •Prototypical Networks: 클래스 프로토타입(평균 임베딩) 기반 분류
- •Matching Networks: Support-Query 유사도 기반
장점: 극소량 데이터로 학습, 빠른 적응, 새로운 클래스 인식, 데이터 수집 비용 절감
단점: 성능 제한(많은 데이터보다 낮음), 메타학습 복잡, 도메인 일반화 어려움
적용사례: 희귀 질병 진단(Few-Shot), 새 상품 분류(Zero-Shot), LLM 프롬프트(GPT Few/Zero-Shot)
기술요소: MAML, Prototypical Networks, CLIP, In-Context Learning, Semantic Embedding, Attribute-Based
비교: Few-Shot(소수 예시) vs Zero-Shot(예시 없음) vs 일반 학습(많은 데이터)
연관: Meta-Learning, CLIP, Transfer Learning, In-Context Learning, Prompt Engineering