알파고 '문제의 그 수' 수학에서도?…글로벌 AI 대전에 국내 기업 참전

[슈퍼앱 '콴다' 만든 매스프레소]
AI기술로 수식·언어 손글씨 인식
DB 속 적합한 문제·풀이 찾아내
63억여건 학습 원본 데이터 바탕
업스테이지·KT와 LLM 개발해
AI 성능 테스트 신기록 세우기도
학생별 1대 1 '튜터링' 제공이 꿈

알파고 대 이세돌 대전 2국에서 알파고가 둔 ‘문제의 그 수(P10).' 초반 포석 국면에서 우변 5선에 놓인 이 흑돌은 인간 최고수 바둑 기사들이 수백 년 동안 축적한 상식을 깨뜨렸다. 사진 제공=구글 딥마인드

2016년 3월 10일 서울 광화문 포시즌스 호텔. 구글 딥마인드 소속 아자 황 박사가 인공지능(AI) 바둑 프로그램 ‘알파고’ 지시에 따라 바둑판 우변 5선에 흑돌을 놓자 대국을 해설하던 김성룡 9단과 이희성 9단, 최유진 아나운서가 크게 당황하는 모습을 보였다.


“지금 어디에 뒀죠?”(김 9단)


“충격적인 자리에 뒀어요.”(이 9단)


“지금까지 본 수 중에 가장 충격적인 수 같은데요. 이 수는 조금 이상하다고 얘기해야 되는 것 아닌가요?”(최 아나운서)


“뭐 이상하다기 보다는 그냥, 없는 수예요. 프로의 감각에서는 생각하기조차도 힘든 수가 나왔습니다.”(이 9단)



알파고와 전설적인 바둑기사 이세돌 간 대국이 전세계를 충격에 빠뜨린지 8년이 지났다. 알파고가 가진 실력은 바둑계를 놀래켰지만 이보다 사람들을 전율케 한 것은 AI가 바둑을 두는 방식이었다. 2국에서 해설진이 ‘가장 충격적인 수’라고 말한 37수는 프로 바둑계의 금기를 깼다. 인간은 초반 포석 때 좀처럼 가장자리에서 멀리 떨어진 바둑판 5선에 돌을 놓지 않는다. 기껏해야 ‘세력선’이라고 부르는 4선에 착수한다. 하지만 알파고는 이 불문율을 깨고 완벽한 승리를 거뒀다. 어쩌면 AI가 인간보다 창의적일 수 있음을 보여준 역사적인 장면이었다.


이후 오픈AI가 챗GPT를 내놓고 최근에는 자동 영상 생성 서비스 ‘소라’ 데모 버전까지 공개하면서 AI가 보여줄 수 있는 창의성에 대한 의문은 사라졌다. AI는 사람들이 정한 틀을 개의치 않고 ‘자신'만의 방식으로 저돌적인 창의성을 발휘할 수 있다. 세계 산업계는 애초 AI가 노동 집약적이거나 단순 사무 업무를 반복하는 직군 일자리를 위협할 것으로 봤지만 최근에는 영상 제작·편집자, 웹툰 작가와 같이 창의력을 바탕으로 창작물을 만들어내는 이들에게 가장 먼저 위협이 될 것으로 전망하고 있다.


국내 에듀테크(교육 기술) 기업 매스프레소는 AI 기술이 불러오는 거대한 변화의 바람을 타기로 했다. 매스프레소는 전 세계에서 매달 1000만 명 이상이 이용하는 AI 기반 수학 문제 풀이 서비스 ‘콴다’를 운영한다. 광학 문자 인식(OCR) 등 다양한 AI 기술을 활용해 정확도 높은 문제 풀이 서비스를 제공하면서 세계에서 누적 기준 9000만 명이 넘는 가입자를 확보하고 있다. 매스프레소는 기존에 축적한 AI 기술력을 바탕으로 수학 특화 거대언어모델(LLM)을 개발하는 담대한 도전에 나섰다. 콴다 서비스의 가장 큰 경쟁자는 오픈AI다.



이용재 매스프레소 대표. 오승현 기자

콴다의 계획

콴다 서비스 핵심은 그동안 확보한 방대한 데이터베이스(DB)를 바탕으로 이용자가 사진을 찍어 올린 수학 문제에 대한 풀이와 답변을 5초 내외의 빠른 시간에 제공하는 데 있다. AI 기술은 이용자가 손으로 쓴 복잡한 수식과 언어를 인식하는 데 일차적으로 쓰이고, 광활한 DB 속 적합한 문제와 풀이를 찾아 제시하는 데 다시 한번 쓰인다. 해외 비중이 90%를 넘는 이용자는 콴다 플랫폼 안에서 매달 1억여 건의 문제를 풀고 이는 곧 콴다 DB 확장으로 이어진다. AI는 계속해 늘어나는 DB를 정제해 체계화하는 데 또 한번 사용된다.


콴다는 이렇게 축적한 약 63억 건의 원본 데이터(로데이터)를 바탕으로 수학 풀이에 특화된 정교한 AI 모델을 만드는 꿈을 꾸고 있다. 이를 위해 국내 AI 전문 기업 업스테이지를 비롯해 수준 높은 데이터센터를 보유한 KT와 손잡고 자체 LLM ‘매스GPT’를 개발했다. 매스GPT 개발은 글로벌 빅테크 메타가 오픈 소스로 공개한 ‘라마2’ LLM을 활용하는 방식으로 진행됐다. 단순한 해외 LLM 모델 미세 조정(파인 튜닝)은 아니다. 콴다가 축적한 수학 문제 DB를 투입하고, 업스테이지가 모델 고도화를 맡고, KT가 데이터센터를 제공해 차별화된 LLM을 구축하는 데 성공했다.


왜 자체 LLM 개발에 나섰을까. LLM은 방대한 데이터를 기반으로 한 ‘자가 학습 모델’이라 할 수 있다. 인간 뇌에 구축된 인지·추론 신경망과 같이 정교한 알고리즘으로 구성된 LLM은 스스로 학습하고 정보를 받아들여 답을 내놓는다. LLM을 가지지 못한 이는 LLM을 가진 이에게 종속될 수밖에 없는 구조다. 이용재 매스프레소 대표는 “오픈AI 모델을 활용해 서비스를 고도화할 수 있겠지만 이는 장기적으로는 비전이 없는 방식”이라며 “GPT-3.5 같은 과거 모델을 이용하면 서비스 속도가 느려지고 최신 모델을 사용하면 비용 부담이 늘어나 서비스 고도화와 확장에 한계가 있다”고 말했다.




리스크와 기회

오픈AI는 조직 내에 수학 특화 LLM 개발 팀을 두고 있는 것으로 알려져 있다. 이는 매스프레소와 같은 기업에게 ‘적신호’이자 ‘청신호'다. 빨간불인 이유는 당연하게도 월등한 경쟁력을 가진 글로벌 빅테크 기업이 동종 서비스를 준비하고 있기 때문이다. 파란불인 이유는 오픈AI의 합류가 그만큼 이 시장이 규모나 수익성 측면에서 경쟁력을 가지고 있다는 것을 의미하기 때문이다. 이 대표는 “오픈AI 외에도 전 세계에는 수많은 LLM 개발 기업이 있고 이들에게 천문학적인 돈과 인재가 몰린다”며 “이는 콴다 사업에 있어 분명한 리스크이자 기회 요인”이라고 분석했다.


콴다는 격변하는 시장 속에서 살아남을 수 있을까. 콴다가 의지할 수 있는 것은 거대한 고품질 DB다. 이용자가 실제로 수학 문제를 푸는 과정이 온전히 닮겨 있는 데이터를 원본으로 수십 억 건 가지고 있는 AI 기업은 드물다. 아무리 AI 알고리즘을 짜는 능력이 뛰어나도 결국 AI 자가 학습을 위해서는 고품질 데이터가 필요하기 때문에 이 부분은 콴다가 가진 핵심 경쟁력이다. 콴다는 실제 현재 개발 중인 모델로 수학 분야 국제 AI 모델 성능 테스트에서 신기록을 쓰며 1위에 올랐다. 이 과정에서 오픈AI와 마이크로소프트(MS)를 제쳤다. 과거에는 구글 본사로부터 투자 받으며 경쟁력을 입증하기도 했다.


이 대표는 업스테이지·KT와 개발한 LLM 일부가 라마2를 토대로 해 추후 메타 AI 플랫폼에 종속될 우려에 대해서는 “큰 걱정을 하고 있지는 않다”는 확신에 찬 답변을 내놓았다. 현재 글로벌 AI 시장은 오픈AI를 필두로 구글, 메타가 경쟁하고 있다. 여기에 프랑스 미스트랄이 최근 MS로부터 대규모 투자를 유치하면서 플랫폼이 확대되는 추세다. 지난 몇 년 오픈AI가 압도적인 경쟁력을 뽐냈지만 한 플랫폼에 종속될 정도로 독점 시장이 형성되지는 않을 것이라는 관측이 지배적이다. 또 콴다는 라마2뿐만이 아니라 자체 데이터와 기술력에 기반해 LLM을 개발했다.


콴다는 수학 AI 모델 개발을 시작으로 AI 교육 서비스 확장을 꿈꾸고 있다. 점점 개인화되고 있는 교육 시장에서 각 학생에 특화된 ‘튜터링’을 제공하는 AI 교육 서비스를 만드는 것이 목표다. 에듀테크 기업을 창업해 경영하는 이들은 ‘교육 기회 균등화’를 꿈꾸는 경우가 많다. 이 대표 또한 “모두가 최고의 1대 1 과외 선생님을 24시간 누릴 수 있으면 그것이 교육의 평등이라 생각한다”며 “이를 실현하려면 AI 교사를 세계 최고 수준으로 만들어 보급하는 수밖에 없다”고 말했다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>