Learning
토픽 71 / 201·인덱스 및 쿼리 최적화

Full-Text 인덱스 (전문 검색 인덱스)

Full-Text 인덱스 (전문 검색 인덱스)

텍스트 데이터에서 단어/구문 단위의 검색을 효율적으로 수행하기 위한 역색인(Inverted Index) 기반 인덱스

핵심 구조

  • 역색인(Inverted Index): 단어 → 해당 단어를 포함하는 문서/위치 목록 매핑
  • 형태소 분석(Tokenizer): 텍스트를 토큰(단어)으로 분리, 불용어(Stopword) 제거, 스테밍(Stemming)

검색 알고리즘

  • TF-IDF: 단어 빈도(TF) × 역문서 빈도(IDF), 문서 내 중요도 측정
  • BM25: TF-IDF 개선, 문서 길이 정규화, Elasticsearch 기본 알고리즘

비교표

적용사례: 검색 엔진, 게시판 검색, 로그 분석 (MySQL FULLTEXT, PostgreSQL tsvector, Elasticsearch)

연관: 인덱스, 역색인, 검색 엔진, 텍스트 마이닝