산업 IT

“엄마한테 카톡 보내줘”…일상을 파고든 AI 음성인식

AI 스피커 없이 플랫폼에서 바로 이용

메시지·뉴스·게임 등 적용 활발

올해 AI 음성인식 30% 성장 예상

“카톡 온 거 있어? 가족 방에 톡 온 거 읽어줘” 손으로 직접 작성하지 않아도 인공지능(AI)이 알아서 메시지를 읽어주고, 원하는 메시지를 상대에게 보내준다. 음성을 인식하는 별도의 AI 스피커 없이 기존에 이용하던 플랫폼에서 간편하게 이용할 수 있다. 가전제품은 기본이고 메시지, 뉴스, 게임에 이르기까지 AI 음성인식이 이제는 도입 단계를 넘어 대중화됐다는 평이 나온다.

카카오톡 음성모드 설정화면(왼쪽)과 이용화면/카카오톡화면캡처카카오톡 음성모드 설정화면(왼쪽)과 이용화면/카카오톡화면캡처


3일 정보기술(IT) 업계에 따르면 카카오(035720)는 최근 별도의 AI 스피커 없이 카카오톡에서 음성으로 메시지를 읽거나 보낼 수 있는 ‘톡 음성모드’ 서비스를 시작했다. 기존에는 카카오의 AI 플랫폼 ‘카카오i’가 탑재된 모바일 애플리케이션 ‘헤이카카오’를 통해서만 해당 기능을 이용할 수 있었다. 하지만 카카오톡 자체에 카카오i가 탑재되면서 카카오톡에서 바로 이용할 수 있게 됐다.


이용 방법은 간단하다. 카카오톡 설정 탭의 실험실에서 ‘톡 음성모드’를 사용하기로 설정하면 된다. AI 음성도 남성이나 여성, 친절한 말투나 친구 같은 말투 중 선택해 이용할 수 있다.

다만 아직 도입 초기라 많은 기술이 적용되지는 못했다. 간단한 안부나 응답 정도의 메시지를 보내기에는 유용했지만 사진이나 이모티콘 등 다른 기능의 활용도는 떨어졌다.



네이버도 AI 음성인식 기술인 ‘클로바’를 고도화하고 있다. 최근에는 PC나 네이버 모바일 앱에의 뉴스 기사 ‘본문 읽기’ 서비스에 오상진 전 아나운서의 목소리를 기반으로 개발한 ‘AI 앵커’를 적용했다. 해당 기능에는 특정 분야에 전문화된 목소리 특성을 강화해 본연의 목소리에 가까운 고품질의 합성음을 만드는 ‘HDTS’ 기술이 적용됐다. 이를 통해 기존보다 목소리 자연스러움을 평가하는 지표가 30% 이상 높아졌다.


이렇게 만들어진 AI 앵커 기술은 향후 네이버 지도, 음성검색, 클로바 탑재 스마트스피커 등 음성으로 콘텐츠를 전달하는 여러 영역에서 활용될 예정이다. 김재민 네이버 클로바 보이스 책임리더는 “이번 작업에서는 오상진 전 아나운서가 직접 뉴스를 읽어주는 것 같은 자연스러움을 느낄 수 있을 정도의 고도의 정밀함과 전문성을 구현하는 것에 집중했다”며 “앞으로도 다양한 콘텐츠를 음성으로 접할 때 어색함이 없도록 관련 기술을 고도화할 것”이라고 밝혔다.

관련기사



아울러 네이버가 자체 개발한 브라우저 ‘웨일’에는 웹 페이지에 나오는 텍스트를 음성으로 읽어주는 기능도 기본으로 탑재돼 있다.

넷마블의 모바일 게임 ‘A3:스틸얼라이브’ 대표 이미지/사진제공=넷마블넷마블의 모바일 게임 ‘A3:스틸얼라이브’ 대표 이미지/사진제공=넷마블


최근에는 게임에까지 AI 음성인식 기술이 적용됐다. 넷마블은 지난 3월 출시한 모바일 게임 ‘A3:스틸얼라이브’에 AI 음성인식 시스템 ‘모니카’를 도입했다. 모니카는 넷마블의 AI 전담기구인 ‘넷마블 AI레볼루션 센터’에서 개발한 기술로, 이용자들은 “자동 전투 시작해줘” 같은 간단한 형태의 음성명령을 내릴 수 있다.

일각에서는 이 같은 AI 음성인식 기술 발전이 신종 코로나바이러스 감염증(코로나19) 여파로 사람들 간 신체 접촉을 자제하는 ‘노터치’ 문화와 연계돼 더욱 가속화될 것으로 내다봤다. 글로벌 연구조사기관 ABI에 따르면 스마트홈을 위한 음성인식 AI 기기 출하 대수는 지난해 1억4,100만대에 달했으며, 올해는 30% 가량 성장할 것으로 예측됐다. 또 다른 시장 조사업체 주니퍼 리서치는 음성 인식 장치의 활용 댓수가 올해 42억대에 달하고 2023년 80억대 규모로 성장할 것으로 예측했다.


백주원 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기