오피니언 사외칼럼

[이슈 리포트] 'AI 대폭발' 불러올 챗GPT…저작권 표절 개념 재정립 필요성 커져

[게임 체인저 떠오른 챗GPT]

■장병탁 서울대 AI연구원 원장

응용 소프트웨어에 챗봇 기능 장착

활용 범위 넓어 파급 효과 무한대

韓, 세상 뒤흔들 새 AI 만들려면

인재·투자가·대기업 등 협력해야





대화형 인공지능(AI) 챗GPT 열풍이 세상을 흔들고 있다. 챗GPT가 여행 계획을 세워주고, 보고서를 작성해주고, 학생들의 숙제를 도와주고, 코딩 교육을 해준다.



챗GPT는 초대규모 AI(종합적 추론이 가능한 범용 AI) 모델인 GPT-3에 챗봇 기능이 결합돼 만들어졌다. GPT-3는 1750억 개의 시냅스(연결선)를 가진 생성 신경망 모델로 대규모 텍스트 데이터로부터 거대언어모델(Large Language Model·LLM)을 학습해 사람처럼 글을 쓴다. 챗GPT는 여기에 사람과의 대화 기능, 즉 챗봇 기능이 추가돼 사람과 이야기를 나누며 비서 역할을 한다. 알파고 AI가 나왔을 때는 바둑을 두는 사람들만이 AI의 발전을 경험할 수 있었다. 챗GPT는 아무 질문에나 대답하고 글을 써주기 때문에 모든 사람이 AI를 실감할 수 있다. 더구나 활용 범위가 넓어 알파고 AI에 비해 파급 효과가 훨씬 더 크다.

챗GPT 사용이 유료화한 것은 의미가 크다. 기존에는 유튜브에서 사용자가 좋아하는 영상을 추천해주듯이 AI가 보이지 않는 곳에서 서비스를 제공했다. 하지만 이제는 AI 자체가 서비스 주체가 돼 수익을 창출한다. 챗GPT의 등장으로 AI의 역할이 다른 서비스를 도와주기만 하는 보조자가 아닌 게임체인저로 바뀐 것이다. 챗GPT 유료화 이후 글로벌 정보기술(IT) 산업에 지각변동이 일어날 조짐이 보이기 시작했다. 챗GPT 개발사인 오픈AI에 10억 달러(약 1조 3000억 원)를 투자한 마이크로소프트는 챗GPT를 자사 검색엔진인 ‘빙’에 장착하면서 검색 시장의 최강자인 구글과 전쟁에 돌입했다. 챗GPT를 탑재한 빙이 구글의 비즈니스 모델을 위협한 것이다. 급해진 구글이 ‘바드’라는 대응 AI를 공개했지만 시연 때 실수를 하면서 주가가 하루 만에 7% 급락하는 사태가 발생했다.

마이크로소프트는 자사의 소프트웨어들에 챗GPT를 도입해 모든 서비스를 AI화하고 있다. 최근에는 AI 비서인 ‘코파일럿’이 웹브라우저 ‘엣지’에 추가됐다. 코파일럿이 마이크로소프트의 ‘파워포인트’와 결합되면 발표 자료가 자동으로 작성된다.

국내 기업들도 챗GPT 관련 기술과 서비스 개발에 박차를 가하고 있다. 네이버는 2021년 서울대 AI연구원과 초대규모 AI 공동연구센터를 설립하는 등 일찍부터 초거대 AI 개발에 투자했다. 네이버는 자사의 초거대언어 모델인 ‘하이퍼클로바’를 이미 출시했다. 카카오는 초거대 AI 모델인 ‘민달리’와 ‘KoGPT’를 내놓았다. LG는 멀티모달(multi modal, 문자뿐 아니라 사진·음성·영상 등의 복합 정보를 처리) 초거대 AI 모델인 ‘엑사원’을 개발했다. 엑사원은 시각 정보와 언어 정보를 동시에 이해하고 생성한다. SK텔레콤은 초거대 모델 GPT-3에 기반한 AI 에이전트 서비스인 ‘에이닷’ 서비스를 출시했다. 또 AI 에이전트가 메타버스와 결합된 아이버스를 통해 AI가 사용자의 분신 아바타 역할을 하며 경험과 학습을 하도록 했다. 이 밖에 KT와 삼성도 초거대 AI에 투자하고 있는 것으로 알려져 있다.



국내 기업들이 개발한 챗GPT 서비스들이 산업계에 미칠 파장은 아주 클 것이다. 챗GPT와 코파일럿이 다양한 응용 소프트웨어와 서비스에 장착되면 모든 소프트웨어들의 지능이 폭발적으로 향상되는 ‘AI의 캄브리아기 대폭발’ 시기에 돌입할 것이다. 여기서 뒤처진다면 앞으로 나올 신종 AI 소프트웨어들에 영원히 뒤처질 수도 있다.

관련기사



챗GPT 활용 시 유의할 점들도 있다. 챗GPT는 AI가 텍스트 데이터를 학습해 언어 모델을 만들고 그 모델에 기반해 사람처럼 글을 만드는 ‘생성형’ AI 기술이다. 원문을 그대로 저장했다가 검색해 보여주는 것이 아니고 원문을 학습하고 소화해 내용을 재구성한 다음 이로부터 새로운 글을 생성(작문)하기 때문에 작성된 글이 원문과 다를 수 있다는 점을 유의해야 한다. 즉 할루시네이션(AI가 틀린 답변을 맞는 말처럼 제시하는 현상) 가능성이 있는 만큼 생성한 글에 대한 신뢰도가 문제될 수 있다. 또 학습하는 데이터 자체가 왜곡돼 있거나 오류를 포함하고 있으면 이것이 언어 모델을 왜곡할 소지도 있다. 챗GPT는 훌륭하고 유용한 툴이지만 이를 활용할 때는 비판적일 필요가 있다.

챗GPT는 학습한 데이터에 대한 저작권이나 글의 표절 이슈를 일으킬 수 있다. 학습 데이터의 사용에 대한 저작권도 이슈지만 더욱 복잡한 문제는 학습의 결과로 생성한 텍스트를 다른 AI가 다시 학습해 새로운 텍스트를 생성하고 이것이 반복돼 궁극적으로 원문이 무엇인지를 추적하는 것이 거의 불가능해졌을 때다. 또 생성한 텍스트를 보면 기존의 문서 복제와는 달리 전체 문서가 그대로 카피되는 것이 아니라 일부 문장 또는 일부 단어들만이 변경되기 때문에 완전한 복사라는 개념은 더 이상 성립되지 않는다. 저작권이나 표절의 개념 자체를 다시 정의해야 할 수도 있다.

그렇다고 무조건 챗GPT의 사용을 금지하는 것은 바람직하지 않다. 챗GPT를 학생들이 맹목적으로 사용해 숙제를 한다면 표절이 될 수 있지만 건설적이고 비판적으로 사용한다면 보다 다양하고 폭넓은 지식과 경험을 주는 개인 과외 선생님 역할을 할 수도 있다. 건전한 발전을 위해서는 국가 차원에서 법적·윤리적 문제에 대한 새로운 시각을 가지고 좀 더 지켜봐야 할 것이다. 신기술이 인류가 경험하지 못한 새로운 이슈들을 계속해서 만들어내기 때문이다. 물론 이 과정에서 필요하면 정부가 개입해 개인과 산업 및 국가 차원에서 다양한 조치를 취할 필요도 있을 것이다.

챗GPT라는 게임체인저는 한국이 아닌 미국에서 태어났다. 10년 후 챗GPT처럼 세상을 뒤흔들 새로운 AI가 또 나온다고 하더라도 그곳은 여전히 한국이 아닐 가능성이 크다. 이를 이해하려면 챗GPT를 만든 오픈AI라는 회사와 그 성장 과정을 눈여겨볼 필요가 있다. 오픈AI는 테슬라의 창업자인 일론 머스크가 초기에 투자하고 공동 창업자로 참여한 회사다. 그는 AI 기술이 위험해질 수도 있으니 이를 방지하려면 오픈AI가 개발된 기술을 모두 공개하는 비영리법인으로 출범해야 된다고 생각했다. 회사 대표는 와이콤비네이터라는 벤처 액셀러레이터(스타트업 초기에 투자하는 회사) 출신인 샘 올트먼이다. 올트먼은 AI 분야의 최고 인재들을 모아 혁신적 AI 기술들을 개발했고 머스크를 포함한 실리콘밸리의 투자가들은 펀드를 만들어 투자했다. 오픈AI는 개발한 기술의 대부분을 논문을 통해 학계에 발표했으며 프로그램 소스도 공개했다. 이후 GPT-3를 발표한 2020년을 전후해 마이크로소프트가 거액을 투자해 이 기술을 상용화했다. 그리고 이를 기반으로 지난해 챗GPT를 발표해 세상을 놀라게 했다. 오픈AI와 챗GPT는 결국 벤처 액셀러레이터, 고급 인재 풀, 투자가, 대기업의 조합이 만들어낸 작품이다. 이러한 스타트업 투자 문화나 스타트업과 대기업의 협력 모델이 한국에서는 보이지 않는다.

챗GPT 사례에서도 알 수 있듯이 AI 강국이 되려면 인재를 육성하고 투자를 활발히 해야 한다. 실리콘밸리처럼 똑똑한 사람들이 모일 기반을 형성해줘야 한다. 이들이 자신감을 갖고 도전에 나서도록 환경을 만들어줘야 하며 그러려면 그들의 자신감에 투자할 생태계부터 조성해야 한다.

사진 설명사진 설명


■장병탁 서울대 AI연구원 원장

서울대 컴퓨터공학부를 졸업하고 독일 본대학에서 컴퓨터과학 박사 학위를 받았다. 미국 MIT 인공지능연구소(CSAIL) 및 뇌인지과학과 초빙교수와 한국정보과학회 인공지능소사이어티 회장을 지냈다. 서울대 컴퓨터공학부 교수이며 서울대 AI연구원장을 맡고 있다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기