“인공지능(AI) 기반 실시간 음성 변환 서비스 '수퍼톤 시프트’를 통해 콘텐츠 창작자나 이용자들은 다양하고 창의적인 음성으로 콘텐츠를 만들고 즐길 수 있습니다.”
하이브(352820)의 AI 오디오 자회사 수퍼톤의 이교구 대표는 최근 서울 강남구 사옥에서 서울경제신문과 만나 “지난달 오픈 베타 테스트를 통해 수퍼톤 시프트를 대중에게도 선보이고 있다”며 이같이 밝혔다.
시프트는 수퍼톤이 콘텐츠 제작 및 크리에이터들의 창작을 지원하고 업무 편의성을 높이기 위해 개발한 솔루션이다. 이용자가 10초가량의 대본만 읽고 10개의 캐릭터 음성 가운데 하나를 선택하면 말하는 즉시 캐릭터의 목소리가 실시간 송출된다. 지난 달 15일부터 시작된 베타 테스트의 중간 평가는 기대 이상이다. 김희영 수퍼톤 제품개발실장은 “베타 테스크 기간 동안 1만 명이 넘는 이용자를 모으겠다는 목표를 세웠지만 이미 달성했다”며 “이용자 수 5만 명이 넘기는 것이 새로운 목표”라고 말했다.
시프트의 강점으로는 자연스러운 음성과 실시간 수준 변환 등이 꼽힌다. 수퍼톤이 자체 개발한 음성 합성 파운데이션 모델 '낸시'를 기반으로 사용자의 음성을 음색·발음·음고·강세 등 4개 구성 요소로 빠르게 분석할 수 있기 때문이다. 이를 통해 기계가 아닌 사람의 목소리를 생생하게 전달하며 음성이 출력돼 청자에게 도달하기까지 걸리는 지연 시간을 청자가 인지하지 못하는 수준인 47㎳(밀리세컨드·1000분의 1초)까지 단축했다. 사용자와 캐릭터 음성 간의 혼합 비율이나 감정의 표현 정도도 조절할 수 있다. 고성능 컴퓨팅 연산 장치 없이 누구나 고품질의 음성 변환 서비스를 실시간으로 쓸 수 있는 것도 장점이다.
수퍼톤은 시프트를 통해 콘텐츠 창작 생태계가 확장될 것으로 기대했다. 버츄얼 유튜버나 스트리머, 팟캐스터 등이 개성 있는 목소리로 실시간으로 소통할 수 있기 때문이다. 허훈 수퍼톤 최고기술책임자는 “버튜버 등이 새로운 정체성에 몰입해서 연기할 수 있는 환경이 구성됐다”고 전했다.
수퍼톤은 내달 26일까지 시프트의 베타 테스트를 진행한 뒤 올 하반기 정식 출시할 계획이다. 글로벌 시장을 적극 공략하는 한편 2종의 신제품도 추가로 선보일 예정이다. 이 대표는 “오디오 워터마크 등을 통해 시프트의 악용도 막을 것”이라며 “수퍼톤은 문자를 목소리로 바꿔주는 솔루션과와 오디오 후반 작업에서 활용할 수 있는 서비스도 준비하고 있다”고 말했다.