토픽 151 / 210·클라우드 및 플랫폼 보안
LLM Guard (AI 방화벽, AI Firewall)
LLM Guard (AI 방화벽, AI Firewall)
LLM 입출력을 실시간 검사하여 프롬프트 인젝션, 유해 콘텐츠, 데이터 유출을 차단하는 보안 계층
특징
- •프롬프트 인젝션 탐지: Direct/Indirect Injection 패턴 실시간 분류
- •PII 마스킹: 개인정보(이름/주민번호/카드번호) 자동 탐지·마스킹
- •유해 콘텐츠 필터링: 폭력/혐오/불법 콘텐츠 생성 차단
- •API 게이트웨이 통합: 기존 API 인프라에 미들웨어로 삽입 가능
동작원리
- •① 입력 스캐닝: 사용자 프롬프트 수신, 인젝션/PII/유해 패턴 검사
- •② 정책 평가: 조직 보안 정책에 따라 허용/차단/수정 결정
- •③ LLM 호출: 검증 통과 시 LLM에 프롬프트 전달
- •④ 출력 스캐닝: LLM 응답의 PII 유출/유해 콘텐츠/환각 검사
- •⑤ 응답 반환/차단: 정책 위반 시 차단·수정 후 반환
비교
연관: AI 보안 플랫폼, 프롬프트 인젝션, WAF, 가드레일, DLP