토픽 71 / 201·인덱스 및 쿼리 최적화
Full-Text 인덱스 (전문 검색 인덱스)
Full-Text 인덱스 (전문 검색 인덱스)
텍스트 데이터에서 단어/구문 단위의 검색을 효율적으로 수행하기 위한 역색인(Inverted Index) 기반 인덱스
핵심 구조
- •역색인(Inverted Index): 단어 → 해당 단어를 포함하는 문서/위치 목록 매핑
- •형태소 분석(Tokenizer): 텍스트를 토큰(단어)으로 분리, 불용어(Stopword) 제거, 스테밍(Stemming)
검색 알고리즘
- •TF-IDF: 단어 빈도(TF) × 역문서 빈도(IDF), 문서 내 중요도 측정
- •BM25: TF-IDF 개선, 문서 길이 정규화, Elasticsearch 기본 알고리즘
비교표
적용사례: 검색 엔진, 게시판 검색, 로그 분석 (MySQL FULLTEXT, PostgreSQL tsvector, Elasticsearch)
연관: 인덱스, 역색인, 검색 엔진, 텍스트 마이닝