‘수학도 잘하는’ 업스테이지 매스GPT, MS 누르고 동급 최강 등극

130억개 매개변수 급서 MS 'ToRA' 눌러
고품질 수학데이터 주효…글로벌 진출 발판


업스테이지가 인공지능(AI) 기반 학습 플랫폼 ‘콴다’를 운영하는 매스프레소, KT(030200)와 공동 개발한 수학 도메인 특화 ‘매스GPT(가칭)’가 오픈AI의 챗GPT와 마이크로소프트(MS) 모델을 제쳤다고 8일 밝혔다.


업스테이지와 콴다는 지난해 11월 KT와 전략적 파트너십의 일환으로 매스GPT 개발에 착수했다. 매스GPT는 업스테이지의 모델을 기반으로 콴다의 고품질 수학 전문 데이터를 학습해, 기존 자연어 처리 능력에 더해 논리적 추론을 가능하게 하고 복잡한 수학 문제를 풀 수 있도록 미세조정된 모델이다.


130억(13B)개 매개변수를 가진 매스GPT는 ‘MATH’, ‘GSM8K’ 등 언어 모델의 수학 능력을 평가하는 대표 벤치마크 테스트에서 동급 최강의 MS ‘ToRA 13B’를 능가하는 고무적인 성적표를 거뒀다. 13B 이하 모델 중에서 가장 높은 성능이다. 또 벤치마크 테스트 평균에서 챗GPT 성능을 돌파하고, MATH 벤치마크에서는 GPT-4까지 능가했다.


이러한 성과에는 기업들간 유기적인 협력이 작용했다. 전략적 파트너십을 통한 KT의 인프라 지원에 힘입어, 콴다의 독보적인 수학 특화 노하우와 고품질의 학습 데이터, 그리고 자체 언어 모델 ‘솔라(SOLAR)’이 삼박자를 이뤄냈다는 평가다. 업스테이지 관계자는 “고난도의 수학 도메인에서 국내 개발한 소형 사이즈 모델이 오픈AI, MS 등 빅테크 기업을 제치고 의미 있는 깃발을 꽂은 것”이라고 자평했다.


매스GPT를 통해 교육 영역에서도 가시적인 성과를 확인한 업스테이지는 앞으로 솔라를 앞세워 거대언어모델(LLM) 시장 재편에 나선다. 금융, 유통, 의료, 엔터테인먼트 등 다양한 산업군을 망라해 국내를 넘어 본격적인 해외 진출을 위한 발판으로 글로벌 체질 강화에도 주력할 방침이다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>