‘AI에, AI에 의한, AI를 위한 선도 기업’
구글이 회사의 핵심 가치에 인공지능(AI)을 전면으로 내세우며 생성형AI 전쟁에서 판세를 뒤집었다. 올 초 마이크로소프트(MS)와 오픈AI가 대대적인 파트너십을 발표한 뒤 오픈AI의 챗GPT를 MS의 검색 엔진 ‘빙’에 탑재한 ‘뉴 빙’이 발표됐다. 이어 오픈AI가 새로운 대규모언어모델 GPT4 공개하는 동안 구글은 조용했다. 구글이 한물 갔다는 평가가 나오기도 했다. 반 년 동안 절치부심한 구글이 MS와 오픈AI의 초반 선전을 뒤집는 패를 내놨다. 그 무대는 지난 10~11일(현지 시간) 열린 구글 연례 개발자회의(I/O)였다.
올해 구글 I/O에서 가장 새로운 관심사는 최신 대규모 언어 모델(LLM)인 ‘팜2(PaLM2)’ 공개였다. 팜2는 100개 이상의 언어로 학습했으며 고급 수학 연산과 추론은 물론 코딩 작성에 강점이 있다. 모델의 성능과 연관성이 높은 매개변수는 5400억 개로 오픈AI의 GPT3(1750억 개) 대비 3배에 달하는 규모다. GPT4의 경우 정확한 매개변수 규모가 공개되지 않았다. 하지만 팜2의 스펙을 공개하는 것만으로는 전 세계에서 온 4100여명의 참가자들을 흥분시킬 수 없다.
구글은 여기서 한 단계 더 나아가 팜2를 기반으로 한 대화형 AI ‘바드’를 시연했다. 중요한 점은 바드가 각 나라 이용자들의 언어로 학습하고 각 문화권의 문화와 규범을 익힌 결과물이라는 점이다. 구글은 이날 영어로 서비스되는 바드에 이어 한국어와 일본어 버전의 바드를 공개했다. 영어를 기반으로 번역된 명령(프롬프트)와 결과물을 내놓는 오픈AI의 챗GPT와 가장 다른 점이다. 조만간 구글은 대화형 AI 바드를 전 세계 40여개국에 출시할 전망이다. 대화형AI의 경우 사용자들의 피드백이 무엇보다 중요하다. 각 언어를 기반으로 한 이용자들의 사용 패턴과 피드백이 더 직관적일 수밖에 없다는 점은 명확하다.
동시에 한국어와 일본어가 알파벳을 근간으로 하는 영어와 대척점에 있어 공통점이 거의 없는 언어라 도전적이라는 점을 꼽았다. 피차이 CEO는 “한국어와 일본어는 영어와 전혀 다른 종류의 언어이기 때문에 도전적인 과제”라며 “우리가 무엇을 필요로 하는 지 확인할 수 있고 다른 언어 학습을 훨씬 쉽게 인식하게 해준다"고 말했다. 출시 과정에서는 해당 언어 데이터의 품질과 각 언어를 기반으로 하는 현지화에 세심한 주의를 기울인다는 설명이다. 피차이 CEO는 “강화학습을 통해 현지의 규범과 정서를 올바르게 파악하고 이용자들의 피드백을 반영한다”며 “데이터를 규제에 맞춰 안전하게 다룰 수 있는 점도 중요 요소”라고 강조했다.
결국 구글 번역 서비스를 통해 축적된 역량이 대화형AI에서는 더 빠른 상승곡선을 타는 것을 볼 수 있는 대목이다. 구글은 이어 구글 독스, 포토, 지메일 등 20개 서비스에 생성형 AI를 탑재한 25개 서비스를 동시에 내놓는다. 순다르 피차이 구글 최고경영자(CEO)는 구글이 챗GPT 등 생성형 AI의 근간이 된 트랜스포머 모델을 개발한 곳이고 생성형 AI의 선두 기업이라는 점을 강조하면서 “애초 트랜스포머 모델의 경우 번역을 더 잘하기 위해 고안한 개념이었지만 구글이 최첨단 기술을 전 세계와 공유하면서 진보를 이끌었다”고 평하기도 했다. 번역에서 쌓인 역량이 생성형AI 서비스를 각 언어권·국가별로 맞춤형으로 내놓을 수 있다는 점이 구글의 큰 차별점이 된다는 점은 분명하다.
허를 찔린 건 오픈AI뿐만 아니라 각 나라에서 LLM을 기반으로 서비스를 개발 중이던 기업들이다. 네이버와 카카오는 올 하반기에 자체 대규모 언어 모델을 공개할 예정이지만 한국어에 특화됐다는 강점으로 승부하기가 쉽지 않게 됐다. 이번 구글 I/O의 핵심들을 상단의 영상을 통해 살펴봤다.