LG 소속 연구원이 인공지능(AI) ‘엑사원’에 “호박 모양의 모자를 만들어 줘”라고 주문하자 엑사원 스스로 그간 학습된 정보를 기반으로 전에 없는 ‘호박 모양의 모자’ 이미지를 새롭게 그려냈다. 그간 AI 엔진이 문자(텍스트)를 분석해 여러 정보 가운데 정확하게 검색하는 수준이었다면 ‘엑사원’은 이 단계를 뛰어넘어 창조까지 가능한 셈이다.
LG가 14일 초거대 AI ‘엑사원(EXAONE)’을 공개하고 관련 AI 생태계 확장에 나섰다. LG AI연구원은 이날 설립 1주년을 맞아 온라인으로 개최한 토크 콘서트에서 엑사원을 비롯한 주요 연구 성과와 향후 계획을 발표했다.
초거대 AI는 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있는 AI를 뜻한다. 특정 용도에 국한되지 않고 다양한 분야에서 활용될 수 있다. LG가 개발한 초거대 AI 엑사원은 ‘인간을 위한 전문가 AI’라는 뜻의 ‘EXpert Ai for everyONE’의 줄임말이다. ‘EX’는 전문가라는 뜻 외에도 10의 18승 즉, 100경(京)을 뜻하는 접두어 ‘EXA’의 의미도 있다.
인류가 지금까지 사용한 모든 단어를 데이터로 저장한다고 가정할 때 그 양이 5엑사바이트일 만큼 매우 큰 단위로, 초거대 AI의 규모를 가늠하기에 적합한 단어라고 LG AI연구원은 설명했다.
LG AI연구원은 올해 5월 초거대 AI 개발을 위해 향후 3년간 1억달러(약 1,127억원) 이상을 투자한다고 발표했다. 인간의 뇌에서 정보를 학습하고 기억하는 시냅스와 유사한 역할을 하는 인공 신경망의 파라미터를 13억개, 130억개, 390억개, 1,750억개 등으로 단계적으로 키우며 초거대 AI를 연구했다. 파라미터는 AI가 딥러닝을 통해 학습한 데이터가 저장되는 곳을 말한다. 이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있다.
이날 공개된 엑사원은 국내 최대인 약 3,000억개의 파라미터를 보유하고 있다. 언어뿐만 아니라 이미지와 영상에 이르기까지 인간의 의사소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티 능력을 갖췄다고 LG는 소개했다.
LG AI연구원은 멀티 모달 AI로 가는 첫 단계로 자체 개발한 알고리즘으로 언어를 이미지로, 이미지를 언어로 변환하는 기술을 구현했을 뿐 아니라 품질 역시 글로벌 최고 수준의 성능을 의미하는 ‘소타(SOTA·최첨단)’를 달성했다고 전했다.
향후 멀티 모달 AI 기술이 고도화되면 AI가 단순히 데이터를 습득해 이해하는 수준을 넘어 추론하고, 시각과 청각 등 다양한 감각 영역을 넘나드는 창조적 생성도 할 수 있다.
이 같은 멀티 모달 AI를 개발하기 위해 LG AI 연구원은 말뭉치 6,000억개와 언어와 이미지가 결합된 고해상도 이미지 2억5,000만장 이상 등 세계 최대 규모의 학습 데이터를 활용했다.
엑사원은 LG전자, LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유하고 있는 전문 데이터를 포함해 논문, 특허 등의 정제된 말뭉치들을 학습해 다양한 산업 분야에서 전문가로 활약할 수 있는 가능성을 높여 가고 있다. 또 미국 AI연구소 ‘오픈 AI’가 개발한 초거대 AI인 ‘GPT-3’가 영어를 학습하거나 국내에서 개발 중인 다른 초거대 AI들이 한국어에 집중하는 것과 달리 엑사원은 원어민 수준으로 한국어와 영어를 이해·구사하는 ‘이중 언어 AI’라는 점도 차별화된 특징이라고 연구원은 강조했다.
LG AI연구원은 엑사원을 제조, 연구, 교육, 금융 등 모든 분야에서 ‘상위 1% 수준의 전문가 AI’로 활약할 수 있도록 만든다는 계획이다. 또 LG 계열사와의 협업을 통한 실증과 글로벌 AI 연합 결성을 통한 활용 영역 확대, 초거대 AI 대중화에 기반한 상생 환경 구축 등 초거대 AI 생태계 조성을 위한 3단계 계획을 추진하기로 했다.
LG AI연구원은 지난해 12월 출범 이후 올해에만 18건의 논문이 권위 있는 인공지능 학회에서 채택되는 성과를 거뒀다고 밝혔다. LG 계열사들은 AI를 통해 18건의 과제를 해결했으며 내년에는 25건 이상을 목표로 한다.
배경훈 LG AI연구원장은 “난제를 해결하기 위해 끊임없이 도전하고 우수한 연구 성과를 바탕으로 고객에게 꼭 필요한 전문가 AI를 만드는 연구원이 되겠다”며 “국내외 주요 대학·석학과 협업 체계를 강화하고 향후 응용프로그램 인터페이스(API) 공개 등을 통해 글로벌 초거대 AI 생태계를 만드는 데 기여하겠다”고 말했다.