“코딩 성능 딥시크 앞서”…SKT, 거대 AI ‘A.X K1’ 기술보고서 공개

허깅페이스에 업데이트

SK텔레콤 본사. 사진제공=SK텔레콤



SK텔레콤(017670)이 독자 인공지능(AI) 파운데이션 모델 프로젝트를 위해 개발한 초거대 AI 모델 ‘A.X K1’의 기술보고서를 오픈소스 플랫폼 허깅페이스에 공개했다고 7일 밝혔다.


A.X K1은 약 5000억개(500B) 이상의 파라미터(매개변수)를 갖춘 초거대 언어모델이다. 모델 설계와 학습 전략을 수립하는 과정에서 투입할 수 있는 연산 자원과 학습량에 따라 성능이 비례한다는 이른바 스케일링 이론이 적용됐다.


SK텔레콤은 AI 학습에 1000개 이상의 그래픽처리장치(GPU)를 투입했다. 또한 학습 효율을 높이기 위한 연산량 관리와 최적화 기법을 활용했다.


A.X K1은 수학 문제 해결과 코딩과 같은 특정 과제에서 비교 평가를 통해 상대적으로 높은 성능을 보였다. 수학은 AIME25 벤치마크에서 89.8점을 받아 딥시크-V3.1 모델(88.4점) 대비 102% 수준으로 앞섰다. 코딩 활용도 측면에서 측정한 라이브코드벤치에서는 영어 기반 75.8점, 한국어 기반 73.1점을 기록했다. 이는 딥시크-V3.1 대비 각각 109%, 110% 높은 수치다.


SK텔레콤은 올해 안에 A.X K1에 텍스트·이미지·음성·영상 등 다양한 유형의 데이터를 동시에 인식해 처리할 수 있는 멀티모달 기능을 추가할 방침이다. 아울러 파라미터 규모를 조 단위로 확대하는 방안을 추진할 계획이다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>