토픽 151 / 210·클라우드 및 플랫폼 보안

LLM Guard (AI 방화벽, AI Firewall)

LLM Guard (AI 방화벽, AI Firewall)

LLM 입출력을 실시간 검사하여 프롬프트 인젝션, 유해 콘텐츠, 데이터 유출을 차단하는 보안 계층

특징

•프롬프트 인젝션 탐지: Direct/Indirect Injection 패턴 실시간 분류
•PII 마스킹: 개인정보(이름/주민번호/카드번호) 자동 탐지·마스킹
•유해 콘텐츠 필터링: 폭력/혐오/불법 콘텐츠 생성 차단
•API 게이트웨이 통합: 기존 API 인프라에 미들웨어로 삽입 가능

동작원리

•① 입력 스캐닝: 사용자 프롬프트 수신, 인젝션/PII/유해 패턴 검사
•② 정책 평가: 조직 보안 정책에 따라 허용/차단/수정 결정
•③ LLM 호출: 검증 통과 시 LLM에 프롬프트 전달
•④ 출력 스캐닝: LLM 응답의 PII 유출/유해 콘텐츠/환각 검사
•⑤ 응답 반환/차단: 정책 위반 시 차단·수정 후 반환

비교

연관: AI 보안 플랫폼, 프롬프트 인젝션, WAF, 가드레일, DLP

목록 ←AI 보안 플랫폼 (AI Security Platform)다음: AI SBOM (AI 자재명세서)→