산업 IT

딥시크發 가성비 전쟁 2라운드…기존 이용료의 8%로 AI 쓴다

[딥시크 쇼크 1년…AI 격전 예고]

SLM 점수, LLM 거의 따라잡아

비용·규제부담에 대안으로 주목

딥시크, 1년만에 새 학습법 공개

韓, 국대AI·NPU 전방위로 대응

딥시크. 연합뉴스딥시크. 연합뉴스




적은 자원과 낮은 비용으로 인공지능(AI) 성능을 크게 끌어올릴 수 있는 이른바 ‘AI 가성비(가격 대비 성능)’가 새해 글로벌 업계의 핵심 경쟁력으로 떠올랐다. 그래픽처리장치(GPU)와 전력 비용, 고성능 AI를 겨냥한 규제 부담이 커지자 대안으로 소형·경량형 AI 수요가 커진 것이다. 1년 전 가성비 경쟁력을 앞세워 ‘딥시크 쇼크’를 야기한 딥시크는 연초부터 신기술을 뽐내며 주도권을 쥐려 하고 국내외 경쟁사들도 관련 대응으로 수요 선점에 나섰다.

4일 글로벌 시장조사기관 CB인사이츠에 따르면 지난해 전 세계 300억 파라미터(매개변수) 미만 소형언어모델(SLM) 개발사들의 평균 ‘모자이크 스코어(점수)’는 754점으로 2024년보다 29점 상승했다. 이는 779점인 대형언어모델(LLM)에 거의 근접한 수준이라고 기관은 설명했다. CB인사이츠와 미국 국립과학재단(NSF)이 공동 개발한 모자이크 스코어는 비상장 스타트업들의 투자 가치를 매기기 위해 사업 성과와 투자 유치, 경영진 역량 등 시장 경쟁력을 종합적으로 평가하는 지표다. LLM 위주였던 AI 시장에서 이제 SLM도 못지않게 활발히 도입되는 주류 기술로 자리매김했다는 분석이다.



LLM에 드는 GPU와 전력 등 비용 부담이 커지며 SLM이 대안으로 떠오른 덕이다. LLM은 고성능 AI로서 유럽연합(EU) ‘AI법’, 한국의 ‘AI 발전과 신뢰 기반 조성 등에 관한 기본법(AI기본법)’ 등 AI 규제 대상이 될 여지가 크다. 피지컬 AI 시대 로봇·드론 등에 탑재하기 적합한 온디바이스(내장형) AI 모델로도 SLM 수요가 커졌다. 홍진배 정보통신기획평가원(IITP) 원장은 “단순 규모를 넘어 AI를 어떻게 효율적으로 쓸 수 있느냐를 두고 경쟁의 축이 움직이고 있다”며 “대형과 소형 온디바이스 모델로 시장이 양분돼 발전해나가는 흐름이 예상된다”고 말했다.

관련기사





SLM을 포함해 기존 모델의 성능을 유지하면서도 규모를 줄인 경량형 모델, 적은 비용으로 데이터를 학습시킬 수 있는 고효율 학습법 등 관련 신기술을 통해 AI 가성비를 끌어올리는 데 업계가 앞다퉈 나서고 있다. 대표 주자는 딥시크다. 회사는 ‘R1’ 모델 공개 약 1년 만인 지난달 31일(현지 시간) 새로운 학습법 ‘매니폴드 제약 초연결(mHC)’을 선뵀다. 모델 자원을 6.7%만 늘려 성능은 크게 높일 수 있다는 설명이다. 후속 모델 ‘R2’ 출시도 임박했다.

문샷AI는 최근 시리즈C 투자로 알리바바·텐센트 등으로부터 5억 달러(7200억 원)를 유치했다. 학습 비용이 딥시크(560만 달러)보다 적은 460만 달러(66억 원)에 불과하다고 알려진 모델 ‘키미 K2 씽킹’을 지난 연말 공개했다. 미니맥스와 지푸AI는 홍콩 증시 상장을 추진 중이다. 앞서 미니맥스는 자사 모델 ‘M2’가 앤트로픽의 ‘클로드 소네트’ 대비 추론 속도가 2배 빠르지만 이용료는 8%에 불과하다고 주장했다. 프랑스 미스트랄은 지난달 30억~140억 매개변수로도 이미지 분석 등 멀티모달(다중모델) 기능을 지원하는 소형모델 ‘미니스트랄3’를 공개했다.

국내에서는 지난달 30일 첫 공개된 국가 대표 AI 모델인 ‘독자 AI 파운데이션 모델’들이 관련 신기술을 탑재했다. 네이버는 80억 매개변수만으로 텍스트·이미지·영상 등 다양한 데이터를 통합 학습해 고성능을 낼 수 있는 국내 첫 옴니모달을 공개했다. 업스테이지는 학습 기간을 기존 120일에서 66일로 40% 이상 단축하는 기술을 선뵀다. LG AI연구원과 NC AI도 딥시크처럼 필요에 따라 일부 매개변수만 활성화해 운영 비용을 줄이는 전문가혼합구조(MoE)를 채택했다. 5000억 매개변수의 초거대 모델을 들고 나온 SK텔레콤도 이를 통해 작은 모델에 지식을 공급하는 ‘교사 모델’ 역할을 자처했다.

노타는 지난달 30일 삼성전자의 모바일 애플리케이션프로세서(AP) ‘엑시노스2600’에 최적화 기술을 탑재하는 계약을 체결했고 스퀴즈비츠도 최근 AI를 경량화해 제공하는 서비스 ‘예터’를 출시했다. AI 가성비 대응의 또 하나 축은 GPU보다 전력 대비 성능비(전성비)가 앞서는 신경망처리장치(NPU) 개발이다. 딥엑스는 지난달 8일 대규모 영상 전용 저전력 NPU ‘DX-H1 V-NPU’를 출시했다. 이를 탑재한 온디바이스 AI 기기는 미국 소비자가전쇼(CES)에서 혁신상을 수상했다. 퓨리오사AI의 2세대 NPU 레니게이드(RNGD)는 엔비디아 GPU ‘H100’보다 전성비가 2.7배가량 높다.


김윤수 기자·김태호 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기