사회 전국

ETRI, 4개국어 언어음성DB 구축하고 배포

한국전자통신연구원(ETRI)은 독일어, 러시아어, 아랍어, 베트남어 등 4개 국어 대화체 음성DB 총 36만 문장 및 한국어 대역 총 20만 문장을 산업체 및 학계 등에 배포한다고 30일 밝혔다.


언어음성 DB는 음성인식 분야와 언어번역 분야의 SW 개발이나 음성언어처리 연구의 기초데이터로 사용된다. 기업들은 그동안 SW들을 태블릿 PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야에 널리 활용해 왔으며, 음성리모콘제조사, 외국어 교육 업체, 자동통번역 서비스업체, 자동차 및 내비게이션 제조사, 포탈업체 등에 이번에 개발한 4개 외국어가 활용될 전망이다.

이 다국어 음성DB를 활용하면, 향후 해당 지역 언어권에 수출하는 음성인식 에어컨, 음성인식 TV리모콘, 음성인식 내비게이션 등에 장착되어 수출을 견인할 것으로 내다보고 있다.


ETRI가 이번에 배포하는 DB는 ▦독일어, 러시아어, 아랍어, 베트남어 대화체 음성DB ▦한국어-독일어, 한국어-러시아어, 한국어-아랍어, 한국어-베트남어 대화체 대역문장DB 등 8종의 언어음성 DB다.

관련기사



그동안 음성DB를 이용한 상용제품들은 국가DB사업에서 구축한 자료를 이용해 국내 기술로 자체개발한 부분도 있으나, 국내 DB가 없는 경우 외국에서 개발한 음성인식 및 번역엔진을 도입해 탑재해 왔다.

ETRI가 제공하는 4개국어 음성DB는 발화 인원수도 총 2,400명에 달하며 가격면에서도 해외DB대비 5~10% 수준으로 중소기업에 제공한다.

ETRI는 현재까지 국내 57개 기관에 247개 DB를 배포, 총 430억원에 해당하는 비용 절감 성과를 얻었으며, 이번에 배포하는 8종의 DB를 국내 10개 기관에 배포할 경우 최소 120억원의 수입대체 효과를 얻을 수 있다.

이영직 ETRI 자동통역연구실 박사는 “음성DB는 국가DB사업에서 요구하는 고품질 수준으로 국가지정 감리업체로부터 합격했다”며 “이를 활용할 경우 언어음성기술의 완성도를 높일 수 있다.

대덕=구본혁기자 nbgkoo@sed.co.kr

박희윤 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기