인공지능(AI)은 전 산업에 걸쳐 혁신을 주도하고 있으며 경제 및 사회 시스템 전반에서도 혁신을 이끄는 범용 기술이 되고 있다. 이런 AI의 거대한 물결에 올라타지 못하는 기업과 국가에는 미래가 없다. 세계 주요 국가가 데이터 규제 혁신을 통해 AI 산업 진흥에 진력하는 이유다.
AI는 데이터로부터 가치 있는 정보를 찾아내 활용한다. 특히 생성형 AI는 대규모 데이터와 패턴을 학습하고 기존의 데이터를 활용해 텍스트·이미지·비디오 등 새로운 결과를 만든다. AI에게 데이터는 원천 재료이자 자양분인 셈이다. 양질의 대규모 데이터를 확보할 수 있는지가 AI의 성능을 좌우한다.
생성형 AI가 데이터를 이용할 때 가장 큰 장애는 학습 대상 데이터에 저작권이 설정된 경우나 데이터가 공개된 개인정보인 경우다. 두 경우 각각 저작권자와 정보 주체의 이용 허락을 받으면 문제가 없지만 대규모 데이터를 기계적으로 분석·학습하는 AI 모델 특성상 개별적으로 동의를 받는 것이 사실상 불가능하다.
이 문제를 해결하기 위해 저작권법상 예외 규정으로 TDM(Text and Data Mining) 면책 규정이 논의되고 있다. 이는 정보 분석 등의 목적으로 AI가 데이터를 이용하는 경우에는 저작물을 AI 학습용 데이터로 사용할 수 있도록 하자는 것이다. 이미 영국·독일·프랑스·일본 저작권법에 도입돼 있다. 특히 일본은 영리적 목적의 TDM도 허용하고 있지만 한국에서는 이 논의가 답보 상태다.
공개된 개인정보의 경우 정보 주체의 동의가 있었다고 객관적으로 인정되는 범위 내에서 처리 가능하다고 할 수 있다. 개인정보보호위원회도 같은 입장이다. 나아가 위원회는 개인정보처리자의 정당한 이익이 정보 주체의 권리보다 명백하게 우선하는 경우 개인정보의 수집과 이용이 가능하다고 밝히면서 ‘정당한 이익’의 구체적 내용, 정당한 이익이 인정되는 사례 등에 관한 가이드를 곧 발표할 것이라고 했다. 다만, 미국 캘리포니아 개인정보보호권리법, 호주 빅토리아주 개인정보보호법과 같이 공개된 개인정보의 경우 법 적용 대상에서 제외하는 것도 검토할 필요가 있다.
최근 법원은 1~2심 공히 ‘정보 주체는 개인정보처리자에 대해 자신의 개인정보 처리의 정지를 요구할 수 있다’고 규정한 개인정보보호법 제37조 제1항에 근거해 개인이 가명 처리 정지를 요구할 수 있다고 판결했다. 그러나 가명 정보 제도는 데이터 활용에 대한 시대적 요구를 반영해 가명 처리를 통해 개인정보를 보호하되 개인정보처리자가 ‘정보 주체의 동의 없이’ 개인정보를 연구·통계 등 특정 목적에 가명 처리해 활용할 수 있도록 허용한 것이다. 법원의 해석은 입법자의 의사를 무시한 것이며 판결이 이대로 확정되면 데이터 활용이 불가능해지고 결국 AI 사업의 근간이 흔들릴 것이다. 일본·미국도 가명 처리 정지를 인정하지 않는다.
한국은 데이터·AI 산업에 있어서 미국·중국을 제외하면 선도국이라는 자부심이 있지만 최근 라인 사태에서 보는 바와 같이 일본으로부터도 도전을 받고 있다. 더구나 일본보다 더 경직적으로 데이터 법제를 운용해서는 AI 산업의 전망이 밝지 않다.