토픽 193 / 201·데이터 아키텍처 신기술
벡터 데이터베이스 (Vector Database)
벡터 데이터베이스 (Vector Database)
고차원 벡터(임베딩)를 저장하고 유사도 기반 근사 최근접 이웃(ANN) 검색에 최적화된 데이터베이스로, AI/ML 애플리케이션의 의미론적 검색을 지원
특징: 의미 기반 검색(↑), ANN 알고리즘, 고차원 인덱싱, 실시간 검색, 스케일아웃
구성요소: 벡터 저장소, ANN 인덱스, 메타데이터 필터, 쿼리 엔진, 임베딩 파이프라인
기술요소
- •ANN 알고리즘(HNSW, IVF, PQ)
- •코사인 유사도 / 유클리드 거리 / 내적
- •임베딩 모델 연동(OpenAI, Sentence-BERT)
- •하이브리드 검색(벡터 + 키워드 결합)
적용사례: RAG(Retrieval-Augmented Generation), 시맨틱 검색, 추천 시스템, 이미지 검색, 이상 탐지
비교: 벡터DB(유사도/비정형) vs RDBMS(정확매칭/정형) vs 검색엔진(전문검색/역인덱스)
주요 제품: Pinecone, Weaviate, Milvus, Chroma, pgvector(PostgreSQL 확장)
연관: RAG, LLM, 임베딩, 생성형 AI, 시맨틱 검색