“학습 데이터 적어도 OK”…네이버 新 음성인식 ‘네스트’ 공개

데이터 대량 학습 없이 예상 못한 표현도 정확히 인식
클로바 케어콜·뉴스 자동자막 서비스에 적용돼
일본어·영어·중국어 등으로 언어 확대 예정

네이버 클로버의 새로운 음성인식 엔진 ‘네스트’ 이용화면/네이버 클로바 이용 화면 캡처

네이버는 새로운 음성인식 엔진 ‘네스트(NEST·Neural End-to-end Speech Transcriber)’를 공개했다고 13일 밝혔다.

네스트는 복잡하고 다양한 장문의 음성 표현을 정확하게 인식하고 문자로 변환할 수 있는 기술이다. 대량의 정제된 데이터를 사전에 학습하지 않고도 예상치 못한 표현에 대해 정확한 음성인식이 가능한 것을 장점이다.

네이버에 따르면 네스트는 음향 정보와 언어 정보를 별도로 학습하는 기존 방식을 통합해 학습에 필요한 데이터의 양과 시간은 기존의 10분의 1 수준으로 줄였으면서도 인식 정확도는 오히려 높다.


네스트는 인공지능(AI)이 전화로 신종 코로나바이러스 감염증(코로나19) 능동 감시자를 확인하는 ‘클로바 케어콜’에 적용돼 있으며, 이미 지난 1월에는 뉴스 자동자막 서비스에도 도입돼 있다.

네이버는 네스트 기술을 적용한 자동 자막을 다양한 동영상 및 오디오 서비스로 확대하고, 동영상 검색 및 에디터에도 해당 기술을 활용할 예정이다.

클로바 스피치 홈페이지에서 무료로 체험해볼 수 있으며, 하반기 일본어를 시작으로 영어와 중국어 등으로 제공 언어도 확대한다.

한익상 네이버 리더는 “동영상 및 오디오 콘텐츠의 자막 제작이나 아카이빙, 고객센터의 통화 데이터 관리 등 다양한 분야에서 활용 가치가 높을 것”이라며 “앞으로도 AI 핵심 기술 연구에 더욱 집중해 음성인식의 품질과 효율을 더욱 고도화하겠다”고 말했다.
/백주원기자 jwpaik@sedaily.com


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>