토픽 140 / 172·고급 학습 기법
Vector Search 알고리즘 (Vector Search Algorithms)
Vector Search 알고리즘 (Vector Search Algorithms)
고차원 벡터 공간에서 쿼리와 유사한 벡터를 효율적으로 검색하는 알고리즘 (ANN: 근사 최근접)
특징: 고차원, 정확도-속도 트레이드오프, 인덱싱 필요
유사도 메트릭: Cosine Similarity(방향/텍스트), Euclidean(거리/이미지), Dot Product(정규화/빠름)
ANN 알고리즘
- •HNSW: 계층적 그래프, 로그 복잡도, 높은 정확도, 메모리↑ (Pinecone/Milvus 기본)
- •IVF: 클러스터링 기반 Voronoi 분할, 메모리 효율, nprobe 조정 (FAISS)
- •PQ: 벡터 압축, IVF+PQ 조합, 대규모 메모리 절약
- •ScaNN: Google, Anisotropic Quantization, TensorFlow 통합
- •ANNOY: 트리 기반, Spotify, 메모리 매핑
Vector DB: Pinecone, Milvus, Weaviate, Qdrant, Chroma, FAISS
비교: HNSW(빠름/메모리↑) vs IVF(메모리효율) vs PQ(압축) vs 정확검색(느림/정확)
적용사례: RAG, 이미지 검색, 추천 시스템, 중복 탐지
연관: Vector DB, Embedding, RAG, FAISS, 유사도 검색