Learning
토픽 140 / 172·고급 학습 기법

Vector Search 알고리즘 (Vector Search Algorithms)

Vector Search 알고리즘 (Vector Search Algorithms)

고차원 벡터 공간에서 쿼리와 유사한 벡터를 효율적으로 검색하는 알고리즘 (ANN: 근사 최근접)

특징: 고차원, 정확도-속도 트레이드오프, 인덱싱 필요

유사도 메트릭: Cosine Similarity(방향/텍스트), Euclidean(거리/이미지), Dot Product(정규화/빠름)

ANN 알고리즘

  • HNSW: 계층적 그래프, 로그 복잡도, 높은 정확도, 메모리↑ (Pinecone/Milvus 기본)
  • IVF: 클러스터링 기반 Voronoi 분할, 메모리 효율, nprobe 조정 (FAISS)
  • PQ: 벡터 압축, IVF+PQ 조합, 대규모 메모리 절약
  • ScaNN: Google, Anisotropic Quantization, TensorFlow 통합
  • ANNOY: 트리 기반, Spotify, 메모리 매핑

Vector DB: Pinecone, Milvus, Weaviate, Qdrant, Chroma, FAISS

비교: HNSW(빠름/메모리↑) vs IVF(메모리효율) vs PQ(압축) vs 정확검색(느림/정확)

적용사례: RAG, 이미지 검색, 추천 시스템, 중복 탐지

연관: Vector DB, Embedding, RAG, FAISS, 유사도 검색