컴퓨터 비전(Vision)·딥러닝(Deeplearning) 분야 최고 수준 학회 ‘CVPR 2020’에서 사진 한 장으로 사람의 뒷모습까지 포함한 3D(3차원) 모델을 복원해내는 연구가 발표돼 화제다. CVPR(IEEE Conference on Computer Vision and Pattern Recognition)은 세계 최대 기술 전문 단체인 IEEE와 CVF가 1983년부터 공동 주최해온 컨퍼런스다.
페이스북 AI 리서치는 ‘PIFuHD’라는 논문을 지난 14일부터 19일(현지시간)까지 원격으로 진행된 CVPR 2020에서 발표했다. 이미지를 입력하면 뒷모습을 포함해 완전한 3D 모델을 만들어 낼 수 있는 기술이다. 페이스북 AI 리서치 측은 “2D 이미지로부터 최첨단 화질과 디테일을 가진 사람들의 3D를 재구성하는 새로운 방법을 개발했다”며 “고해상도 사진을 입력해 손가락, 얼굴 특징, 의류 주름 등 추가 처리 없이는 불가능했던 매우 복잡한 디테일을 포착할 수 있게 됐다”고 설명했다.
한국에서는 네이버가 4년 연속 세션에 발표자로 참여한다. 네이버와 네이버랩스는 총 7편의 논문을 발표하고, 7개의 워크샵을 진행한다. 네이버 비전팀 연구원들의 논문인 ‘Embedding Expansion: Augmentation in Embedding Space for Deep Metric Learning(임베딩 확장: 심층 지표학습을 위한 임베딩 공간에서 증강기법)’은 딥러닝 기반으로 네이버 이미지 검색 정확도를 향상시킬 것으로 기대된다. CVPR 2020에 채택된 네이버와 네이버랩스 연구원들의 논문은 번역, 이미지 분류, 자율주행 등 분야에서 활용되는 컴퓨터 비전 기술 연구 결과에 대한 것이다.
네이버가 발표하는 연구결과는 네이버, 라인, 스노우의 OCR(광학 문자 인식), 이미지 검색, 동영상 서비스 등에 적용되고 있다. 김성훈 네이버 클로바CIC 책임리더는 “세계 무대에서도 네이버의 서비스에 녹아든 다양한 기술에 대한 주목도가 높아지고 있다”며 “앞으로도 기술을 통해 이용자에게 더욱 많은 가치를 제공할 것”이라고 전했다.