산업 IT

'수퍼톤 API' CBT로 첫 공개…텍스트 음성변환 기술 개방

향후 음성 변환 기술 등 확대





하이브(352820)의 인공지능(AI) 오디오 자회사 수퍼톤이 자사 기술의 외연 확대를 위해 ‘수퍼톤 API’를 클로즈드 베타 테스트(CBT) 형식으로 공개했다고 24일 밝혔다.



응용 프로그래밍 인터페이스(API)는 서로 다른 소프트웨어 간 데이터를 교환하거나 기능을 사용할 수 있도록 하는 일종의 디지털 연결고리다. 수퍼톤은 23일부터 수퍼톤 API를 공식 웹사이트에 공개했다.

관련기사



회사는 이번 CBT를 통해 자사의 AI 음성 기술이 다양한 플랫폼이나 애플리케이션(앱) 등과 연동할 수 있도록 추진한다. 우선 텍스트를 음성으로 변환하는 AI 음성 기술인 ‘텍스트 음성 변환(TTS)’ 기술을 제공한다. 수퍼톤의 자체 개발 파운데이션 모델 ‘낸시(NANSY)’가 적용된 TTS 기술은 자연스럽고 풍부한 감정까지 가능한 음성을 만들어낸다.

TTS API는 대화형 게임 캐릭터 제작이나 오디오북, 애니메이션, 채팅 서비스 등 TTS 기술이 필요한 곳 어디서나 이용할 수 있다. 기존 낸시 모델 대비 텍스트의 음성 출력 시간이 줄어들어 챗봇 등 즉각적인 음성 피드백이 필요한 서비스 개발에도 용이하다.

수퍼톤은 API를 통해 TTS 기술 뿐 아니라 가창 합성 음성 기술, 음성 변환 기술 등도 공개할 예정이다.

이교구 수퍼톤 대표는 “비즈니스 파트너사 뿐만 아니라 1인 또는 소규모 콘텐츠 크리에이터들도 수퍼톤 AI 음성 기술들을 더 자연스럽고 몰입감 있는 인터랙티브 콘텐츠 등에 폭넓게 적용할 수 있을 것”이라고 말했다.


진동영 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기