글로벌 AI, 공격 방어율 57% 불과…韓 스타트업, 해법 내놨다
야타브, 보안 솔루션 ‘AEGIS’ 오픈소스 공개
결정론적 방어 기술로 효과적인 위협 차단 제공
수정 2026-02-20 19:00
입력 2026-02-20 18:46
글로벌 주요 인공지능(AI) 모델의 보안 방어 성능이 기대에 못 미치는 것으로 나타난 가운데, 한국 스타트업인 ‘야타브’가 이를 해결할 보안 솔루션을 내놔 주목을 받고 있다.
한국 AI 보안 스타트업 야타브가 20일 공개한 ‘AEGIS v4.0 보안 감사 보고서’에 따르면 클로드·그록·제미나이·큐원3·딥시크 등 6개 최신 모델의 보안성을 점검한 결과 자체 방어만으로는 공격을 충분히 막지 못했다. 이번 점검에는 국제 보안 분야 비영리기구인 ‘OWASP’의 25개 시나리오가 활용됐다.
야타브 관계자는 “악의적 공격 시나리오에서 완전 차단에 성공하는 비율이 모델별로 4%~72% 수준에 머물렀다”면서 “채용·대출·의료 등 국민 생활에 직결되는 AI가 악의적 조작에 취약할 수 있다는 점에서 우려가 크다”고 설명했다.
특히 딥시크는 자체 차단이 4%에 불과했고, 제미나이는 56%, 그록은 60%, 큐원3-32B는 36%로 집계됐다. 클로드 소넷 4.6의 경우 자체 차단은 72%였지만, 일부 정책과 프롬프트 설계에 따라 우회할 수 있는 여지가 남을 수 있는 것으로 분석됐다.
야타브는 자체 개발한 보안 솔루션 ‘AEGIS v4.0’을 적용한 결과 방어율이 크게 상승했다고 밝혔다. 클로드 소넷 4.6·클로드 소넷 4·그록·큐원3-32B·딥시크는 AEGIS 적용 후 100% 차단을 달성했다. 또 오탐률 0%, 처리 시간 0~3ms로 업무 흐름을 방해하지 않는 점도 강점으로 제시됐다.
핵심 기술은 ‘결정론적 방어’다. 확률적 판단에 의존해 추정하는 방식이 아니라, 악성 의도와 패턴을 사전 정의된 규칙과 탐지 로직으로 식별해 즉시 차단하는 접근이다. 야타브는 접근성 강화를 위해 AEGIS를 MIT 라이선스로 오픈소스 공개했으며, 깃허브에서 무료로 내려받을 수 있도록 했다.
이성찬 야타브 대표는 “AI는 이제 채용을 결정하고 신용을 평가하고 건강을 진단한다”며 “이런 AI가 악의적 조작에 무방비하다면 피해는 시민에게 돌아간다”고 말했다. 이어 “AI 안전은 특권이 아니라 기본권”이라며 “2026 MWC 바르셀로나에서 전체 AEGIS 솔루션을 공개할 예정”이라고 덧붙였다.
ⓒ 서울경제신문, 무단 전재-재배포, AI 학습 및 활용 금지