자연어를 이해하는 실용 AI 기술 기업 무하유(대표 신동호)는 중소벤처기업부에서 소관하는 ‘스마트서비스 ICT솔루션 개발사업’에 선정되어 ‘표절분석 정확도 향상을 위한 AI기반 대규모 표, 이미지 식별 기술’을 개발한다고 27일 밝혔다. 이번 사업은 2024년 4월 말까지 총 2년간 진행된다.
이번 사업은 문서 내 이미지의 구조적 형태 및 문맥 정보를 객체 단위로 복합 검증하는 솔루션 개발을 목표로 한다. 이를 위해 무하유는 표절 검사에 최적화된 AI기반 대규모 표, 이미지 식별 기술 및 솔루션 개발할 예정이다.
그동안 중소기업의 연구과제 중복 수행이나 교육 콘텐츠의 표절 문제가 지속적으로 제기되어 왔으나 텍스트에 치중된 표절 검사로는 이를 확인하기 어려운 문제가 있었다.
무하유는 이번 기술 개발을 통해 문서 데이터 내 텍스트, 사진, 그림, 일러스트, 차트, 표와 같은 이미지 객체별 데이터베이스(DB)를 1억5000만건을 구축할 계획이다. 구조적 특징 추출 기술을 1차로 개발하고, 추후 데이터베이스를 확장해 변형된 이미지까지 탐지/검증하는 기술을 개발할 예정이다.
이로써 이미지 자체 비교만 가능했던 기존의 이미지 유사도 검사 기술과는 다르게 국내에서 처음으로 표절 검사에 최적화된 표와 이미지를 식별하게 된다. 해외 문헌 데이터를 기준으로 해 국내 문헌 분석이 어려웠던 부분도 해결된다.
또한 AI기반의 솔루션으로, 전문가가 많은 시간을 투입해 이미지 중복과 표절을 아이체킹(eye-checking)했던 방식에서 벗어나 전문지식이 없이도 이미지를 빠르고 정확하게 검증할 수 있다.
기술 개발이 완료되면 중소기업 연구개발(R&D) 지원 환경과 온라인 교육 서비스 시장, 공공 및 연구 분야에서 텍스트 표절 검사의 한계를 의도적으로 악용하는 행위를 근본적으로 차단하고, 양질의 연구과제와 콘텐츠를 생산하는 데 활용될 것으로 예상된다. 문서 작성자는 과제 및 보고서 작성 시 자가 문서 검증으로 활용 가능하며, 평가자 및 멘토/지도교사는 평가 검증 도구로 활용할 수도 있다.
더불어 언어에 구애받지 않는 이미지 표절 검사를 활용해 해외 표절 검사 서비스에도 확대, 적용할 계획이다. 무하유는 자사의 논문 검사 솔루션 ‘카피킬러’에 해당 기술을 애드온(Add-on) 방식으로 적용하여 텍스트, 표, 이미지의 표절 여부를 종합적으로 판단할 수 있는 서비스를 개발할 예정이다.
무하유의 신동호 대표는 “이번 기술 개발은 약 10년의 기간 동안 AI기반의 표절 검사인 카피킬러를 바탕으로 성장해온 ‘무하유’만이 수행할 수 있는 사업이다. 무하유는 완전한 표절 검사를 위해 ‘인용/출처 표기법에 대한 오류 탐지 기술 개발’ 등 다양한 시도를 하고 있다”며 “이미 일본의 50여 개 대학이 사용하는 등 좋은 성과를 얻고 있고, 중국 진출도 검토 중이다. 전 세계 유일의 이미지, 표 등의 표절 검사 분석으로 더 많은 국가로의 진출을 기대하고 있다”고 말했다.
한편, 무하유는 2011년 출시한 카피킬러를 통해 쌓은 자연어처리(NLP) 노하우로 인적자원관리(HR) 분야에 진출했다. AI 기술을 기반으로 △AI 자기소개서 분석 서비스 ‘프리즘’ △취업 도움 솔루션 CK PASS △국내 최초의 대화형 AI 면접 서비스 ‘몬스터’ 등 다양한 HR 서비스를 제공하고 있다.