업스테이지, 컴퓨터비전 학회 ECCV서 OCR 논문 2편 채택

"세계 3대 AI 학회서 모두 논문 발표"

유럽 컴퓨터비전 학술대회(ECCV) 홈페이지. 사진 제공=업스테이지

인공지능(AI) 전문 기업 업스테이지가 컴퓨터 비전 분야의 권위 있는 국제학술대회 '유럽 컴퓨터비전 학술대회(ECCV) 2022'에서 자사 논문 두 편이 채택됐다고 11일 밝혔다.


이번 발표로 업스테이지는 올해 ECCV를 비롯해 표현 학습 국제학회(ICLR), 국제 컴퓨터 비전 및 패턴 인식 학술대회(CVPR)를 비롯한 세계 3대 AI 학회에서 모두 논문을 발표했다. 업스테이지 측은 “논문을 통해 발표한 기술적 성과를 바탕으로 AI를 활용해 이미지에서 원하는 정보를 추출해 이용할 수 있는 '업스테이지 OCR 팩' 개발을 가속화할 계획”이라고 강조했다.


업스테이지에 따르면 두 논문은 광학문자판독(OCR) 문자 인식 모델 연구와 머신러닝의 기반이 되는 학습전략에 대한 내용을 골자로 한다.


첫 번째 논문은 AI가 사진에서 문자를 인식할 때 언어적·시각적 요소를 한 번에 인식하는 ‘멀티 모달(multi-modal)’ 기술을 적용해 시각적 요소를 주로 활용하던 기존 문자 인식 모델보다 높은 성능을 달성했다.


두 번째는 사전 학습된 모델을 특정 분야에 적용할 때 발생하는 문제점을 해결하는 맞춤 학습 전략에 대한 연구 논문이다. 업스테이지는 이 기술이 여러 형태의 문서에 쉽게 적용 가능하며 OCR 성능을 개선하는 데 기여할 수 있다고 설명했다.


이들 논문이 발표될 올해 ECCV는 10월 23~27일 이스라엘 텔아비브에서 개최된다. 2년마다 열리는 이 학술대회는 최근(2020년) 대회에서 제출 논문 5150편 가운데 26%인 1360편만 채택되는 높은 경쟁률을 보이고 있다.


김성훈 업스테이지 대표는 “이번 성과를 학술적 연구에서 그치지 않도록 하고 서비스 개발의 주요한 기반으로 활용해 고객들이 최고 성능의 AI를 현업에서 노코드로 활용할 수 있도록 최선을 다하겠다”고 했다.



ECCV에서 채택된 업스테이지의 '멀티모달 문자 인식체계' 관련 논문. 사진 제공=업스테이지


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>