Learning
토픽 197 / 201·비교표

MLOps와 모델 운영

DevOps vs MLOps vs DataOps

항목DevOpsMLOpsDataOps
대상소프트웨어 배포ML 모델 배포+운영데이터 파이프라인
추가 요소CI/CD+데이터+모델 관리+데이터 품질/거버넌스
핵심 과제배포 자동화모델 드리프트, 재학습데이터 품질, 리니지
도구Jenkins, GitHub ActionsMLflow, Kubeflowdbt, Airflow

실시간 서빙 vs 배치 서빙 vs 엣지 서빙

항목실시간 서빙배치 서빙엣지 서빙
지연시간저지연 (ms)지연 허용초저지연
처리량소량고처리량소량
환경클라우드/서버클라우드/서버디바이스
적용추천API, 사기탐지대량 예측, 리포트자율주행, IoT

데이터 드리프트 vs 개념 드리프트 vs 성능 드리프트

항목데이터 드리프트개념 드리프트성능 드리프트
변화 대상입력 분포 P(X)입출력 관계 P(YX)출력 품질
원인데이터원 변화환경·행동 변화복합 원인
탐지KS Test, PSI성능 지표 모니터링비즈니스 메트릭
대응전처리 갱신모델 재학습전체 파이프라인 검토

Model Card vs Datasheet vs AI SBOM

항목Model CardDatasheet for DatasetsAI SBOM
대상AI 모델학습 데이터셋AI 시스템 전체
목적모델 투명성데이터 투명성구성요소 추적
내용성능/편향/용도수집/라벨링/분포모델/데이터/코드 목록
제안Google 2018Microsoft 2018NTIA/SPDX

Model Collapse vs Catastrophic Forgetting vs Mode Collapse

항목Model CollapseCatastrophic ForgettingMode Collapse
원인합성 데이터 반복 학습새 태스크 학습 시 이전 지식 손실GAN 생성기가 제한된 출력만 생성
영향전체 분포 축소이전 태스크 성능 저하생성 다양성 감소
대상LLM, 확산 모델 등모든 신경망GAN
대응원본 데이터 혼합, 데이터 출처 추적EWC, 리플레이 버퍼다양성 손실 정규화

전통 Observability vs AI Observability

항목전통 ObservabilityAI Observability
대상서버/앱/네트워크LLM/AI 모델
핵심 신호메트릭/로그/트레이스추론/평가/드리프트
품질 지표응답시간, 오류율할루시네이션율, 정확성
드리프트인프라 성능 변화모델 성능/편향 변화
대표 도구Datadog, GrafanaLangSmith, Arize, Phoenix