Learning
토픽 154 / 172·고급 학습 기법

오픈소스 AI 모델 (Open Source AI)

오픈소스 AI 모델 (Open Source AI)

모델 가중치, 아키텍처, 학습 코드를 공개하여 연구·수정·상업적 활용이 가능한 AI 모델로, 벤더 종속 방지와 투명성을 제공하며 커뮤니티 기여로 빠르게 발전

목적: 접근성, 투명성, 커스터마이징, 비용 절감, 벤더 종속 방지, 혁신 가속

특징: 가중치 공개, 수정 가능, 커뮤니티 기여, 상업적 사용 가능(라이선스별)

주요 오픈소스 모델

  • LLaMA(Meta): 7B~70B, 높은 성능, 연구·상업 가능
  • Mistral: 7B/8x7B(MoE), 고성능, Apache 2.0
  • Falcon: 40B/180B, 오픈 데이터 학습
  • BLOOM: 176B, 다국어, BigScience
  • Phi(Microsoft): 소형 고성능, 3B
  • Stable Diffusion: 이미지 생성, 완전 오픈

라이선스 유형

  • Apache 2.0: 상업적 자유(Mistral)
  • MIT: 제약 거의 없음
  • LLaMA License: MAU 7억 초과 시 별도 라이선스 필요
  • GPL: 수정 시 오픈소스 공개 의무

허깅페이스(Hugging Face): 오픈소스 모델 허브, Transformers 라이브러리, 커뮤니티

파인튜닝 기법: LoRA, QLoRA(메모리 효율), Full Fine-Tuning, PEFT

장점: 비용 절감(무료), 커스터마이징, 투명성, 벤더 독립, 혁신 속도

단점: 지원 부족, 보안 책임, 성능 차이(폐쇄형 모델 대비), 인프라 필요

적용사례: 사내 챗봇(LLaMA), 이미지 생성(Stable Diffusion), 번역, 코드 생성

비교: 오픈소스(투명/자유/저비용) vs 폐쇄형(고성능/지원/비쌈)

연관: LLaMA, Hugging Face, 파인튜닝, LoRA, AI 민주화