비플라이소프트는 지난 5월 ‘2023국제인공지능대전(AI EXPO KOREA)’를 통해 AI 기업들을 대상으로 한 ‘AI 데이터 API 공급 사업’을 처음으로 소개했다. 당시에도 회사 관계자는 “이미 국내 주요 AI기업들을 대상으로 AI 학습 및 분석 목적으로 뉴스데이터를 공급하고 있다”고 말했다. 이후에도 계속해서 회사의 미래 성장축으로 ‘AI 데이터 API 공급 사업’을 자주 언급하면서 사업에 대한 기대감을 나타냈다.
최근 생성형 AI 시장이 급성장하면서 관련 업체들이 서비스 경쟁력의 핵심인 양질의 데이터 확보에 사활을 걸고 있다. 이는 생성형 AI 서비스 성공은 방대하고 다양한 실시간 데이터 확보와 직결되기 때문이고 이로 인해 관련 데이터 시장도 급성장하고 있다.
'RDPLINE'은 생성형 AI 서비스향 학습, 분석, 서비스 모두를 지원하는 뉴스 데이터 공급서비스 사업으로 그 동안 구축한 원천데이터, 라벨링 및 정제 가공된 대량의 빅데이터와 실시간 데이터를 'RDPLINE'으로 통합해 다양한 거대언어모델(LLM)을 비롯한 인공지능 학습과 빅데이터 분석, 뉴스 서비스용 데이터를 실시간으로 제공 가능하다는 것이 핵심이다.
주요 서비스는 실시간 데이터를 API 방식으로 공급하는 RDPLine-R, 학습용 데이터를 대량(벌크) 공급하는 RDPLine-D, 학습 및 서비스용 데이터를 모두 공급하는 RPDLine-P 등으로 구성되어 있다.
특히, 실시간 뉴스 데이터 공급 과정에서 데이터 정제 등 전처리와 라벨링 등 후처리 과정을 자체 개발한 AI 기반 가공 솔루션인 'AI ROOT'로 해결해 경쟁력을 갖추었다는 평가다. 흔히, 인공지능 학습용 데이터 구축을 대규모 인력을 투입하여 ‘용역성’ 사업을 주로 수행하는 업체들과 비교했을 때 데이터의 보유량, 실시간 처리 속도, 라벨링 품질 측면 등에서 압도적이라는 것이다.
회사 관계자는 “이미 20년 전부터 ‘아이루트’를 통해 레거시 데이터(신문지면 기사)와 온라인 데이터의 정제 가공 공정 대부분을 자동화한 상태”라면서, “현재 국내 언론사는 거의 모두 ‘아이루트’를 통해 실시간 가공되어 데이터로 구축되고 있다” 고 밝혔다. 또한 “뉴스 데이터를 활용한 다수의 국책과제를 수행하면서 인공지능 뉴스 데이터에 대한 노하우는 이미 국내 최고 수준”이라고 전했다.
'RDPLINE'은 DaaS (Data as a Service)형 사업으로 기존 뉴스 유통 협력 체계를 인공지능 영역으로 확대해 실시간 뉴스 서비스는 물론, 국내외 한국어 언어모델 개발에 최적화된 데이터를 공급 할 수 있으며, 인공지능 분야 외에도 금융, 마케팅, 통신사업자, H/W 생산 사업자 등 뉴스데이터가 필요한 전분야 영역으로 확장해 나가면서 데이터 파이프라인을 구축할 계획임을 밝혔다.
이제는 양질의 뉴스 데이터를 합법적으로 확보하는 전략이 곧 AI 서비스 사업의 성패를 가르는 핵심 전략인데 지난 25일 과학기술정보통신부가 윤석열 대통령 주재 국무회의에서 ‘디지털 권리장전’을 보고하면서 정부도 인공지능(AI) 시대를 위한 법제화 노력을 시작했다. 디지털 권리장전의 내용 중 주목할 점은 디지털 자산의 보호라는 조문을 통해 디지털 자산의 지적재산권을 적시했다는 것이다. 최근 국내외에서 학습용 데이터셋에 대한 저작권 이슈가 본격화되자 데이터 보호가 필요하다는 점을 규정하는 것으로 풀이된다.
이에 비플라이소프트 관계자는 “지난 20년간 구독형 SaaS 사업을 통해 축적된 기술과 노하우를 토대로 'RDPLINE' 서비스 구축을 완료했고, 생성형 AI 구축에 중요한 뉴스 데이터 공급 활성화를 통해 비플라이소프트가 언론사와 AI 기업간 가교 역할을 다할 것”이라고 전했다.
한편, 관련 업계에 따르면 비플라이소프트는 최근 LLM 기반 생성형 AI 서비스 관련 주요 대기업과 중견기업,스타트업등 다수의 기업들과 'RDPLINE' 공급 논의를 진행하고 있는 것으로 알려지고 있다.