토픽 142 / 172·고급 학습 기법

Vector DB 성능 최적화 (Vector Database Performance Optimization)

대규모 벡터 데이터의 인덱싱·검색 성능을 위한 튜닝, 양자화, 샤딩, 캐싱 기법

특징: 정확도-속도-비용 트레이드오프, 워크로드별 튜닝

인덱스 최적화: HNSW(M/efConstruction/efSearch), IVF(nlist/nprobe), 데이터 규모·메모리·정확도별 선택

양자화: PQ(벡터 분할/10-100배 절감), SQ(FP32→INT8), Binary(해밍거리/매우빠름), 압축↑=정확도↓

분산 아키텍처: 샤딩(수평 확장), 레플리케이션(읽기 처리량/고가용성), 파티셔닝(메타데이터 필터링)

하드웨어 가속: GPU(FAISS-GPU/배치검색), SIMD(AVX-512), SSD/NVMe(DiskANN)

쿼리 최적화: Pre-filter vs Post-filter, 배치 처리, 핫 데이터 캐싱

모니터링 지표: QPS, P99 레이턴시, Recall@K, 메모리 사용량

비교: 정확도 우선(높은 ef/nprobe) vs 속도 우선(양자화) vs 비용 우선(디스크 기반)

연관: Vector Search, FAISS, Pinecone, Milvus, RAG