홈 산업 IT

韓 연구팀 AI음향 인식대회서 1위...청각장애인 위험회피기술 활용될 듯

입력2020.07.20 11:20:18 수정 2020.07.20 11:20:18

facebook twitter kakao email 복사

뉴스듣기 가 저장

ETRI팀 국제경진대회 DCASE 출전해 성과

소리 듣고 녹음장소 알아맞히는 분야서 우승

소리를 주파수별로 나눠 딥러닝시키는 기술

ETRI연구진이 소리를 주파수 대역별로 나눠 AI에게 학습시키는 기술을 소개하고 있다. /사진제공=ETRI

기계가 주변의 소리를 정확히 듣고, 그 내용을 인지하는 것은 인공지능(AI) 및 사물인터넷(IoT) 기반의 4차 산업혁명에서 핵심 기술이다. 이 같은 청각 인식기술은 시각 인식기술에 비해 AI분야에서 상대적으로 발전이 더뎌 전세계적으로 도전이 치열하다. 이런 가운데 한국 연구진이 이 같은 기술 수준을 겨루는 국제경진대회에서 세계적 대기업들을 제치고 정상에 섰다.

한국전자통신연구원(ETRI)는 지난 3일 열린 세계적 행사인 ‘제 6회 AI 기반 음향 이벤트 및 장면 인식 기술 경진 대회(DCASE)’의 음향장면 인식분야에서 1위를 차지했다고 20일 밝혔다. 이로써 기계에게 사람과 같은 청각 인식능력을 부여하는 하는 국산 기술 및서비스 발전에 대한 기대감이 한층 커지게 됐다. 팀 순위 2등은 ‘조지아텍-중국과기대-텐센트-UEK 연합팀’이 차지했다.

ETRI팀이 1~2위에 오른 분야는 여러 종류의 단말장치로 녹음한 소리를 듣고 녹음 장소를 알아 맞히는 ‘복수 단말 대상 음향 장면 인식’ 과제다. 액션캠 및 바이노럴 마이크 뿐 아니라 잡음이 쉽게 섞이는 일반 스마트폰에 이르기까지 장비별로 다른 신호 특성을 아울러 정확하게 판단하는 분야다. 여기서 관건은 ‘일반화 성능’이다. 예를 들면, 학습용 음향 데이터로 프랑스 파리 지하철에서 나는 소리를 스마트폰으로 녹음한 파일이 주어지면 이를 인식하는 시스템을 개발한 뒤, 평가에서는 학습에 쓰이지 않았던 액션캠으로 녹음된 지하철 소리를 들려주며 상황을 맞힐 수 있는지 알아보는 방식이다.