엔씨소프트(036570)의 인공지능(AI) 전문 기업 NC AI는 멀티모달 생성용 파운데이션 모델 ‘배키’(VAETKI)의 자체 성능평가 결과를 공개했다고 8일 밝혔다. NC AI 컨소시엄은 과학기술정보통신부의 독자 AI 파운데이션 모델 프로젝트의 일환으로 배키를 개발했다.
NC AI는 자체 성능평가 결과 배키 100B 모델은 오픈AI의 ‘GPT OSS’, 메타의 ‘라마’(Llama) 등 현존하는 글로벌 SOTA 오픈소스 모델과 비교해 대등하거나 이를 상회하는 성능을 기록하며 기술적 완성도를 높였다고 설명했다. NC AI에 따르면 유사한 파라미터 규모를 가진 GPT-OSS-120B 시리즈와 한국어 주요 벤치마크 3종에서 평균 101% 우세한 성능을 기록했다. 아울러 한국어 외 글로벌 주요 벤치마크 지표 평균에서도 메타의 ‘라마4 스카웃’ 대비 약 1.9배에 달하는 성능 우위를 점했다. 지시 이행 능력(IFEval)에서 265%, 박사 수준의 추론능력(HLE) 영역에서 137%의 성능 수치를 기록했다.
NC AI 컨소시엄은 10조 토큰의 방대한 코퍼스를 바탕으로 배키를 학습했다. 토크나이저 어휘의 20%를 한국어에 할당하고 고어(古語)까지 처리 가능한 한글 조합(Jamo) 기능을 포함해 한국어 전문성을 극대화했다. 배키는 모델의 크기를 키우면서도 운영 효율성을 극대화하기 위해 혼합 전문가(MoE) 아키텍처를 도입했다. 차세대 어텐션 기술인 MLA(Multi-Latent Attention)와 국소-전역 인터리빙(Local-Global Interleaving) 기법을 결합해 기존 방식 대비 KV 캐시 메모리 사용량도 약 83% 절감했다.
NC AI는 배키가 국내 산업현장에 최적화된 소버린 AI를 지향한다고 강조했다. 한국 강점 산업군의 AI 전환을 지원해 독자적인 ‘도메인 옵스’(DomainOps) 체계를 구축했다. 도메인옵스는 특정 산업 분야에 최적화된 AI 모델을 상호 협업하는 방식으로 운영하는 개념을 뜻한다. 이를 통해 범용 대형언어모델(LLM)의 한계를 넘어 제조 현장의 피지컬 AI, 국방 분야의 전술 지능, 콘텐츠 산업의 창의적 AI 등 각 산업군에 특화된 데이터를 최적화하고 현장에서 작동하는 AI 모델을 공급할 전략이다.
NC AI는 롯데이노베이트(286940)·미디어젠·에이아이웍스·인터엑스·포스코DX(022100)·MBC·NHN(181710)·HL로보틱스 등 다양한 기업들과 손을 잡았다. 현대차(005380)그룹의 정보기술(IT) 계열사 현대오토에버로 컨소시엄에 참여했다. 아울러 고려대·서울대·연세대·한국과학기술원(KAIST)·한국전자통신연구원(ETRI) 등 학계 및 연구기관을 동맹으로 확보했다.
이연수 NC AI 대표는 “배키는 단순히 글로벌 기술을 따라잡는 것을 넘어 대한민국의 주력 산업이 AI를 무기 삼아 글로벌 시장을 선도하게 만드는 전략적 자산이 될 것”이라며 “독자적인 도메인옵스 기술력을 바탕으로 산업 현장에서 실제로 가치를 창출하는 소버린 AI 생태계를 구축해 나가가겠다”고 말했다.
현재 정부는 NC AI를 비롯해 네이버클라우드와 LG(003550) AI연구원, SK텔레콤(017670), 업스테이지가 각각 주축인 컨소시엄 5곳을 프로젝트 지원 대상으로 선정해 심사하고 있다. 이달 중순 1차 탈락팀 곳이 발표될 예정이다.
