미디어그룹사람과숲, AI 학습용 데이터 구축사업으로 한국형 데이터셋 개발 앞장


‘과학기술정보통신부’가 주관하고 ‘한국지능정보사회진흥원(이하 NIA)’이 추진하는 ‘2022년 인공지능 학습용 데이터 구축사업’이 본격적인 착수 궤도에 올랐다. 2022년 8월 현재 총 3차에 걸쳐 컴퓨터 비전(Vision), 자율주행, 음성, 자연어 처리, 헬스케어, 농업, 안전 등 19개 부문 150여 개 분야 과업의 사업자가 모두 선정됐다.

선정된 수많은 기업들 중 ㈜미디어그룹사람과숲은 지난 2021년 5개 사업 주관사로 수행한 성과에 이어 올해 7개 사업을 주관사로서, 7개 사업에서는 참여사업자로 선정돼 최다 과제 수행 업체가 됐다고 전했다.

‘사람과숲’이 수주한 분야는 교통정보, 산업안전, 스포츠, 객체 추론 및 추적 등 산업 전반부터 일상 영역까지 광범위한 분야를 아우른다. 특히 한국형 자율주행 데이터셋 구축을 주도하고 있는 ‘사람과숲’은 NIA의 사업 이외에도 한국자동차연구원, 세종테크노파크, 한국교통안전공단 자동차안전연구원 등의 자율주행 분야 용역 사업을 수년째 꾸준히 수행하고 있다.

다수의 사업수행 뿐 아니라 구축한 데이터셋의 품질 면에서도 TTA(한국정보통신기술협회) 권고 품질을 준수하는 자동 품질 진단 프로그램 ‘HF-Validator’를 개발해 한국형 데이터셋의 품질 수준을 높이는 데도 기여하고 있다. 이러한 공로를 인정받아 ‘2022 제8회 대한민국 리딩기업대상’ 시상식에서 ‘3년 연속상’으로 ‘AI 데이터셋’ 부문 ‘ICT대상’을 수상하기도 했다.

‘사람과숲’은 국가지정문화재와 근현대 역사자료 콘텐츠의 디지털라이징 시각화 사업을 전개하며 이미지 및 영상 데이터 제작으로 약 30년 간 업계를 선도해오고 있다. ‘사람과숲’의 한윤기 대표이사는 2018년부터 국내 최초 자율주행을 위한 AI 학습용 데이터 구축 사업을 시작으로 AI Vision Data 분야의 선구자로서 한국형 AI 산업이 발전하는데 주도적인 역할을 하고 있다. 이후 2019년부터 ‘인공지능 학습용 데이터 구축사업’을 통해 Annotation(라벨링), Bounding Box, 2D 및 3D Segmentation, 모션 키포인트, Amodal Cloud Completion 등을 기반으로 하는 다양한 형태의 AI 학습 데이터셋을 제작해왔다.

‘사람과숲’이 자율주행, 로보틱스, 농업, 챗봇, 번역, 스포츠 등 수많은 분야에서 한국형 AI를 개발하고자 하는 노력에는 특별한 이유가 있다고 한다. 해외에서 만들어진 데이터셋의 주행 환경은 각종 법규와 도로 상황뿐 아니라 날씨와 기후, 사람들의 운행 습관 등의 문화적인 면까지 많은 차이를 보이고 있어 고려해야 할 요소가 많다. 국내 주행 환경에서 확실한 안전이 보장되는 Level 5의 완전자율주행으로 가기 위해서는 우리나라의 도로와 환경에서 수집한 데이터셋을 학습시키는 것이 매우 중요하다. 이러한 측면에서 ‘사람과숲’ 한윤기 대표이사는 해외 데이터를 기반으로 데이터셋 구축을 하는 것만으로는 충분하지 않다는 것을 절실하게 실감하고 ‘한국형 AI’의 필요성을 강조하고 또 강조하며 수년간 한국형 데이터셋 구축에 앞장서고 있다.

인공지능 학습용 데이터 구축사업 참여를 통해 ‘사람과숲’은 단순한 정량적 수행 결과 이상의 사회적, 산업적 가치 실현에도 큰 의의를 두고 있다. 관련 중소 업체 및 지역 업체와의 컨소시엄으로 산업 전반의 AI 역량을 제고하고, 수행 인력 고용을 통한 일자리 창출과 사회적 약자 및 취약 계층의 직업능력 강화, 진로발달 촉진 등을 도모하고 있다.

한편 ‘사람과숲’은 최근 회사의 빠른 내적, 외적 성장세에 힘입어 새로운 5대 사업분야로 Digital Convergence, Big Data & AI, Smart Mobility, Metaverse, Cloud를 선정하고 적극적으로 사세를 확장하고 있다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>