Learning
토픽 75 / 172·생성형 AI와 LLM 활용

도메인 특화 언어모델 (Domain-Specific Language Model)

도메인 특화 언어모델 (Domain-Specific Language Model)

특정 산업(의료, 법률, 금융 등)의 전문 데이터로 사전학습 또는 파인튜닝하여 해당 도메인의 정확도·규제 준수·전문 용어 이해를 극대화한 언어모델

특징: 도메인 정확도(↑), 규제 준수(↑), 할루시네이션 감소, 소형화 가능, 비용 효율

구성요소: 도메인 코퍼스, 파인튜닝 파이프라인, 평가 벤치마크, 가드레일

기술요소

  • 도메인 사전학습(Domain-Adaptive Pretraining)
  • 파인튜닝(SFT, RLHF, DPO)
  • RAG 연동(도메인 지식 베이스)
  • 도메인 토크나이저(전문 용어 최적화)

적용사례: 의료(Med-PaLM), 법률(Harvey AI), 금융(BloombergGPT), 코드(StarCoder), 과학(Galactica)

비교: 도메인특화LM(정확/소형/규제) vs 범용LLM(다용도/대형/할루시네이션) vs RAG(검색보강/외부지식)

연관: LLM, 파인튜닝, RAG, AI 거버넌스