국내 연구진이 인공지능(AI)을 이용해 영상을 압축하는 기술력을 겨루는 국제경진대회에서 우수한 성적으로 수상했다.
기존 MPEG, HEVC 등 국제표준 압축 기술에 이어 진화하는 미디어 콘텐츠를 효율적으로 이용할 수 있는 획기적 인프라 기술 개선에 큰 도움이 될 전망이다.
한국전자통신연구원(ETRI)은 세계적인 컴퓨터비전 관련 학회인 CVPR(Computer Vision Pattern Recognition)이 미국 시애틀에서 지난 14일 온라인으로 개최한 인공지능 기반 영상 압축 기술 경진 대회(CLIC·Workshop and Challenge on Learned Image Compression)에 두 팀이 참가해 각각 세계 1위와 2위 성적을 거뒀다고 밝혔다.
이로써 연구진은 몰입감과 현장감을 극대화할 수 있는 초실감 미디어 서비스 활용과 차세대 비디오 압축 국제표준화 선도를 위한 원천기술을 확보케 되었다.
올해로 3회째를 맞이하는 CLIC 대회는 구글, 페이스북, 넷플릭스 등 세계 유수의 기관들이 주관하고 후원하는 인공지능 기반 영상 압축 기술 관련 유일한 대회다.
최근 들어 VR, AR, 홀로그램 등 미디어 콘텐츠의 용량이 커지고 복잡해지고 있다. 이에 AI를 이용해 기존 방식의 한계를 뛰어넘어 압축률, 복원 영상 화질 등을 최적화하기 위한 산업 동향에 따라 대회의 중요성이 높아지는 추세다.
대회 심사 부문은 저비트율 영상 압축, 비디오 압축 두 개 분야다. ETRI는 저비트율 영상 압축 부문에 두 팀이 참가해 전세계 기업, 대학 연합팀들과 기술력을 겨뤘다.
ETRI가 참가한 저비트율 영상 압축 분야는 HD부터 4K 해상도의 다양한 자연 영상 428개를 화소당 0.15 비트율(bpp·bit per pixel) 이하로 압축한 뒤, 다시 이를 복원한 결과물의 화질 수준을 경쟁하는 방식으로 이뤄진다. 원본 영상은 평균 24비트율을 지녀 기존보다 최대 1/160의 크기로 용량을 줄이면서도 화질을 떨어트리지 않는 것이 관건이다.
화질은 원본 영상을 압축한 뒤 복원한 영상의‘인지 화질’을 기준으로 평가한다. 인지 화질은 거리와 밝기 등 정해진 프로토콜 환경 기준을 두고 사람이 직접 점수를 매겨 순위를 매기는 평가 방식이다.
ETRI에서 참가한 팀 중 ETRI EIC-PQE팀은 기존 영상 압축 기술에 화질을 개선하기 위한 후처리 기술에 AI를 적용한 방식을 사용했고 ETRI EIC-E2E-P팀은 영상 압축 전 과정에 처음부터 AI를 도입한 방식으로 출전했다.
연구진의 기술은 지난해 발표한‘엔트로피 최소화 기반 영상 압축’기술 등 원천 기술을 바탕으로 자체 기술력을 보유했다는 점에서 기존 공개된 여러 기술들을 조합해 나온 타 팀과는 차별화된다고 ETRI는 설명했다.
대회에는 총 55개 팀이 참가했으며 영상 화질 비교 평점 방법은 엘로 방식이 사용됐다. ETRI는 작년에 펼쳐진 CLIC 2019 경진대회에서도 복원 속도 부문에서 우승을 거머쥔 바 있어 2년 연속 입상하는 쾌거를 거뒀다.
ETRI는 이번 참가 팀이 모두 우수한 결과를 내면서 각 기술은 상호 보완을 이루며 차세대 영상 압축 기술 진보를 이룰 전망이라고 설명했다. 연구진은 해당 기술들을 차세대 비디오 부호화 국제표준 원천기술로 제정하기 위한 노력도 진행할 계획이다.
ETRI 김흥묵 미디어연구본부장은 “홀로그램, 라이트 필드, 포인트 클라우드 등 입체 영상의 시대가 도래하면서 기존 방식으로는 한계가 있던 분야에서 AI를 활용해 차세대 미디어 콘텐츠 확산을 이루는 기반 기술을 더 적극적으로 연구해 나가겠다”고 말했다.
연구진은 향후 최신 비디오 부호화 표준인 HEVC 대비 4배 압축 성능과 화질 개선, 속도를 높이는 연구를 지속해나가면서 관련 분야 기술 우위를 점하기 위해 노력할 예정이다.
ETRI는 이번 기술과 관련해 국내·외 특허 38건을 출원했고 인공지능 분야 Top-3 학회인 ICLR2019를 비롯해 국제논문 18건을 발표했다.
/대전=박희윤기자 hypark@sedaily.com