“삶과 공부는 분리될 수 없다. 공부를 성공과 출세, 일신의 안녕과 영화를 위해 도구화한다면 삶과 공부는 계속 분리되고 공부에 시달리는 아이들과 어른들은 끝없이 공부 중독의 늪에 빠져 허우적거릴 수밖에 없을 것이다. 진짜 공부는 진짜 삶과 동행하는 벗과 같다.”
이달 출간 예정인 자기 계발서의 한 대목이다. 마치 산전수전 다 겪은 인생 선배가 건네는 조언처럼 들린다. 하지만 이 문장을 쓴 주인공은 팔순을 넘긴 노교수도, 고학(苦學)으로 자수성가한 굴지의 기업인도 아닌 초거대 인공지능(AI) 챗GPT다. 능수능란한 논문 작성 능력으로 주목받은 챗GPT가 삶의 교훈을 주는 자기 계발서 분야로까지 진출한 것이다.
17일 출판 업계에 따르면 스노우폭스북스는 22일 ‘삶의 목적을 찾는 45가지 방법’을 전국 서점에 선보일 예정이다. 책 집필은 오픈AI의 초거대 AI ‘챗GPT’가, 번역은 네이버의 AI 번역 서비스 ‘파파고’가 맡았다. 표지 그림은 이미지 플랫폼 ‘셔터스톡’의 생성형 AI인 셔터스톡AI가 그렸다. 기획부터 인쇄까지 모든 과정에 소요된 시간은 고작 7일. 투입된 인력 또한 서진 스노우폭스출판사 대표와 보조 팀원 단 두 명뿐이다. 서 대표는 “보통 집필부터 인쇄까지 최소 16개월이 걸리고 인력도 최소 5~7명이 필요하다는 점에서 파격적”이라고 설명했다.
물론 AI는 사람보다 서툰 모습도 종종 보였다. 예컨대 작업자 측에서 한 꼭지당 5000자 내외를 요청했지만 챗GPT는 3000자 이상을 내놓지 못했다. 하나의 주제만으로 한 꼭지를 채우지도 못했다. 대신 다양한 주제를 다룬 여러 개의 글을 비교적 자연스럽게 엮어내는 데 그쳤다. 표지 제작에도 난항을 겪었다. 장장 3시간에 걸쳐 1000장이 넘는 이미지를 요청한 후에야 적절한 이미지를 선정할 수 있었다.
20년 경력의 베테랑 출판 기획자인 서 대표는 처음에는 반항심과 두려움으로 작업을 시작했지만 마무리할 즈음에는 일종의 환희를 느꼈다고 했다. 그는 “수많은 데이터 중 유의미한 결과물을 뽑아내는 것은 결국 인간의 역할”이라며 “충분한 ‘밑천’을 갖춘 사람이라면 챗GPT의 도움으로 더 무한한 창의력을 발휘할 수 있을 것이라고 생각한다”고 말했다. 출판사 측은 초판만 1만 부를 인쇄할 정도로 상당한 자신감을 보이고 있다. 보통 출판 업계에서는 초판 2000~3000부만 완판돼도 성공작으로 친다.
AI가 집필한 책들은 해외에서는 이미 수년 전부터 출판돼 왔다. 2018년 출시한 소설 ‘원 더 로드(1 The Road)’ 등이 대표적인 초기 사례로 꼽힌다. 국내에서도 한국어 기반 초거대 AI가 고도화되며 이 같은 흐름이 본격화하고 있다. 출판사 파람북은 2021년 8월 515쪽 분량의 장편소설 ‘지금부터의 세계’를 내놓았다. 카카오브레인은 지난해 8월 시 쓰는 AI ‘시아’의 첫 번째 시집 ‘시를 쓰는 이유’를 출간했다.
다만 저작권을 둘러싼 논란들은 이 같은 변화의 흐름에 걸림돌이 되고 있다. 현재 가장 문제가 되고 있는 것은 AI의 기계학습(ML)에 쓰인 데이터의 저작권 문제다. AI는 인간이 만든 데이터를 토대로 새로운 결과물을 재창조한다. 이와 관련해 학습용 데이터를 제공한 창작자 측에서의 반발이 본격화되고 있다. 최근 예술가들이 미국에서 스태빌리티AI 등 3곳의 이미지 생성 AI 업체들에 저작권 침해를 이유로 소송을 제기한 게 대표적인 사례다.
전문가들은 산업 발전을 위해 AI 기계 학습에 쓰이는 데이터에 대해서는 저작권 침해에 대한 요건을 완화하는 게 바람직하다고 조언한다. 대신 학습용 데이터를 제공하는 창작자들에게 합리적인 보상이 필요하다는 설명이다. 최경진 가천대 법학과 교수(한국인공지능법학회장)는 “AI 학습에는 방대한 데이터가 필요하기 때문에 저작권자를 일일이 확인하기는 현실적으로 힘들다”며 “AI 개발자 측에서 일정 부담금을 저작권 단체 측에 지불하는 ‘사적 복제 보상금 제도’와 같은 제도를 도입해 다양한 저작물을 합법적으로 쓸 수 있는 통로를 마련해야 한다”고 전했다.
나아가 AI가 생성한 창작물이 저작권 침해에 휘말리지 않기 위해서는 학습 데이터 분류 체계를 세분화할 필요가 있다는 목소리도 나온다. 최 교수는 “예컨대 AI 학습에 투입되는 일부 데이터는 이용료를 내야 사용할 수 있는 한편 어떤 데이터는 이용에 어떠한 제약이 없을 수도 있다”며 “이 같은 권리관계를 데이터에 명확히 표시(레이블링)하면 AI가 알아서 저작권 문제를 일으키지 않는 선에서 결과물을 낼 수 있다”고 조언했다.