글로벌 빅테크가 선보이는 생성형 인공지능(AI)의 한국어 실력이 나날이 발전하며 토종 AI 기업들의 영역까지 넘보고 있다. 단순 번역은 기본이고 몇 초 만에 원하는 음성까지 생성하는 기술도 선보인 빅테크에 안방을 내주지 않으려면 토종 플랫폼 기업들이 서둘러 차별화된 기술 확보에 나서야 한다는 목소리가 나온다.
메타는 이달 10일 서울 강남구 메타코리아 오피스에서 열린 ‘AI 미디어 브리핑’에서 한국어를 포함해 최대 100개의 언어에 대한 즉각적인 번역을 제공할 수 있는 ‘심리스M4T’를 시연했다. 심리스M4T는 음성-텍스트, 음성-음성, 텍스트-음성, 텍스트-텍스트 번역을 지체 없이 수행할 수 있다. 나아가 메타는 단순 번역뿐 아니라 전 세계의 다양한 언어로 음성을 생성할 수 있는 모델인 ‘오디오박스’도 선보였다. 이용자가 ‘빠른 속도로 말하는 나이든 여성의 목소리를 만들어줘’라고 요청했을 때 오디오박스는 이에 맞는 음성을 몇 초 만에 만들어준다. 동시에 영상 속의 화자가 말하는 언어와 속도를 변경하는 것 또한 가능하다. 예컨대 프랑스어로 빠르게 말하고 있는 영상 속 음성을 영어로 바꾸거나 속도를 더 느리게 조절할 수 있다.
오픈AI 역시 AI 기술로 언어의 장벽을 허물고 있다. 오픈AI가 지난달 선보인 챗GPT의 ‘고급 음성 모드’는 기존에 어색했던 한국어를 현지인 발음에 가깝게 개선했을 뿐 아니라 한국어 사투리까지도 이해한다. 오픈AI는 “챗GPT가 한국어를 능숙하게 구사하게 하기 위해 한국인 전문 성우와 회사 내 한국인 직원들로부터 피드백을 받고 한국어 능력을 향상시켰다”고 설명했다.
국내 기업들의 전유물이었던 한국어 능력을 글로벌 빅테크들이 빠르게 정복하고 나서면서 토종 AI 업체들의 활동 영역이 좁아지고 있다는 우려가 나온다. 지금껏 고객사들이 한국어만큼은 토종 플랫폼 기업들의 음성 모델 등을 선택했으나 글로벌 빅테크들이 바짝 추격하면서 경쟁력을 잃고 있다는 설명이다. 업계의 한 관계자는 “아직까지는 네이버 등 토종 기업의 음성 모델이 한국어 데이터 학습량과 문화 이해도 측면에서 우위에 있지만 글로벌 빅테크들이 막대한 자본력을 앞세워 쫓아오고 있어 언제 뒤집힐지 모르는 상황”이라며 “한국 기업만이 가질 수 있는 차별점에 대해 더 고민해야 할 시점”이라고 조언했다.