KT, 음성합성 'AI 보이스 스튜디오' 출시

인간 감정 담은 음성합성 지원
100개 AI 목소리 5개 감정으로

KT가 인간 감정을 담은 인공지능(AI) 음성합성 콘텐츠를 제작할 수 있는 ‘AI 보이스 스튜디오’ 서비스를 출시했다고 19일 밝혔다.



사진제공=KT


AI 보이스 스튜디오는 100개의 AI 목소리를 즐거움·침착함·중립·슬픔·화남의 5가지 감정으로 합성할 수 있는 ‘AI 보이스’와 이 AI 보이스로 콘텐츠를 제작할 수 있는 ‘스튜디오’로 구성돼 있다.


KT AI 보이스 스튜디오는 ‘감정 더빙’ 기술을 탑재했다. AI 음성을 내가 낭독한 감정 그대로 더빙할 수 있는 기술이다. 모든 AI 목소리는 한국어·영어·중국어·일본어 4개 국어로 합성할 수도 있다.


유명인들의 음성을 AI로 제공하는 ‘셀럽 AI 보이스’도 준비했다. 첫번째 셀럽 AI 보이스는 가수 윤도현이다.


KT AI 보이스 스튜디오 웹 버전은 월별 AI 보이스 제공량에 따라 프리(무료, 4000자)에서 프로맥스(12만 원, 38만4000자)까지 4종 요금제로 나뉜다. API 버전은 월 10만 원이다.


최준기 KT AI/BigData사업본부 본부장은 “향후 그룹사를 비롯한 다양한 파트너와 협력해 더 혁신적인 AI 보이스 스튜디오 서비스를 선보이겠다”고 말했다.


/윤민혁 기자 beherenow@sedaily.com

<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>