네이버의 AI 음성인식 기술력이 세계 최고의 학회에서도 주목을 받았다.
2일 네이버는 지난 29일 막을 내린 세계 최고 음성신호처리 학회 ‘인터스피치 2020(Interspeech 2020)’에 10개의 논문을 발표하는 성과를 거뒀다고 밝혔다. 특히 음성인식·음성합성·데이터셋 모델 성능 평가 지표 등 다양한 음성 신호 관련 분야에 걸친 연구 결과가 채택됐다.
네이버에 따르면 음성인식 연구 결과는 클로바 AI 스피커, 네이버 음성검색 등 관련 서비스에 적용되고 있고 음성합성 관련 기술은 뉴스 본문 읽기·클로바 더빙 등 서비스를 구성하는 핵심 기술로 적용되고 있다. 또 소상공인들이 활용할 수 있는 매장 전화를 대신 받아주는 AI 서비스인 AiCall 을 개발하는데 사용된 데이터인 ‘클로바콜(ClovaCall)’도 논문으로 채택되었다.
또 정준선, 최소연 네이버 연구원이 강홍구 연세대 교수와 협력 연구로 진행한 결과를 담은 페이스필터: 단일 이미지 활용 음성 분리 기능‘FaceFilter: Audio-visual speech separation using still images )’ 논문은 이번 인터스피치의 최고 학생 논문(Best Student Paper)으로 선정되는 쾌거를 이루었다.
위 연구 성과들은 클로바 AI 깃허브에 소스코드와 함께 공개되어 AI 생태계 확장에도 기여하고 있다. 특히 그 중 클로바콜에 대한 논문은 한국어 목적 지향형 대화 음성 데이터를 함께 공개함으로써, 국내 AI연구 저변 확대에 크게 기여했다는 평가를 받고 있다.
하정우 네이버 AI랩 리더는 “네이버가 보유한 자유롭게 중장기 선행 연구에 집중할 수 있는 문화와 AI 기술에 대한 지속적인 대규모 투자 확대가 국제 무대에서도 주목받는 연구 결과로 이어지고 있다”며 “한국을 넘어서 글로벌 AI 생태계 확장에도 기여할 수 있도록 할 것” 이라고 밝혔다.