홈 산업 IT

[사이언스] 감정 읽고 상상하는 AI…"3년내 포스트 트랜스포머 모델 출격"

입력2024.05.15 18:37:53 수정 2024.05.15 21:07:10

facebook twitter kakao email 복사

뉴스듣기 가 저장

■'생성형 AI' 미래와 과제

구글 AI 비서기능·검색엔진 출시

오픈AI, 대화하는 GPT-4o 발표

생성형AI 소유한 나라가 富 축적

"생활·산업·문화 게임체인저 될것

韓 수백조 들어도 참전 서둘러야"

윤석열 대통령이 4월에 선언한 ‘AI·반도체 이니셔티브’ 9대 기술혁신 분야.

“앞에 뭐가 있니” “차가 다가오고 있어요.” 시각장애인이 묻자 스마트폰 탑재 인공지능(AI) 비서가 대답한다. 스마트폰 카메라를 이리저리 비추면 AI 비서가 주변 상황을 인식한 뒤 안내한다. 구글이 14일(현지 시간) AI 비서 기능과 함께 AI 검색 엔진을 선보이면서 생성형 AI가 어디까지 발전할지 관심이 쏠리고 있다. 전날에는 오픈AI가 말로 대화하는 GPT-4o를 내놓았다.

오픈AI의 챗GPT, 구글의 제미나이 같은 생성형 AI는 대규모언어모델(LLM)로 빅데이터를 학습해 텍스트·이미지·동영상 등 다양한 콘텐츠를 만든다. 챗GPT는 2022년 11월 간단한 텍스트 생성에서 시작해 이미지·음악·동영상 등을 생성하는 단계로 발전했다.

구글이 올 2월 내놓은 제미나이 1.5 프로의 경우 최대 100만 개의 토큰 처리 능력을 갖췄다. 구글은 조만간 갑절의 능력을 갖춘 버전을 내놓는다. 토큰은 AI 모델이 단어·이미지·영상·오디오·코드 등을 한 번에 처리할 수 있는 정보의 양을 말한다. 이번에 구글이 검색엔진에 AI를 적용해 대화 형태로 사진·동영상까지 검색할 수 있게 만든 것도 데이터처리 능력의 향상 덕분이다. 실시간 통·번역과 빠른 e메일 요약도 마찬가지다. 오픈AI가 올 초 공개한 ‘소라’처럼 몇 문장을 입력하면 1분 이상의 영상도 만들어준다.

전문가들은 생성형 AI가 다방면에서 막대한 영향을 끼치고 있다고 설명한다.

순다르 피차이 구글 CEO가 14일(현지시간) 200만 개의 토큰 처리 능력을 갖춘 AI를 조만간 선보이겠다고 설명하고 있다. /유튜브 갈무리

우선 이날 구글 연례 개발자 회의에서 DJ가 AI 음악 공연을 선보인 것처럼 생성형 AI는 음악과 미술, 동영상 콘텐츠에서 널리 활용되고 있다. 동영상 제작자인 김태진 씨는 “요즘은 AI를 활용하지 않으면 동영상이나 게임을 효율적으로 만들 수 없다”고 전했다. AI는 개인화된 학습 도구로도 쓰인다. 전날 오픈AI가 수학 문제(3x+1=4)에 대해 단계별 풀이 과정을 보여준 게 한 예다. AI가 학생 맞춤형 학습 자료와 프로그램을 제시하고 교수·교사의 채점·평가도 돕는다. 계약서 작성, 판례 분석 등 법률 분야에도 활용된다. 연구개발(R&D) 현장에서는 실험 데이터나 복잡한 과학적 개념의 시각화와 새로운 연구 가설 수립에 도움을 준다. 의료 분야의 경우 AI가 건강 모니터링과 진단, 질병 예측, 신약 후보 물질 분석, 수술 로봇 등에서 활약한다. 이민수 스냅컴퍼니 대표는 “시장조사와 판매 예측, 보고서·발표자료 작성은 물론 새로운 프로토타입 생성과 최적의 제조 공정 설계에 활용된다”고 설명했다. AI는 물류 최적화, 재고·배송 관리에도 쓰인다. 국방 분야에서는 훈련과 작전 수립은 물론 우크라이나와 가자지구 전쟁터처럼 드론을 통해 적진을 교란한다. 킬러로봇 출현도 예상된다.

관련기사

정부가 민간·의료·제조 분야에서 필요하다고 보는 AI 과제. /과학기술정보통신부

특히 수년 뒤 생성형 AI가 저전력·저비용·고속 생성 시간의 특성을 지닌 ‘포스트 트랜스포머’ 모델로 진화하면 다시 한 번 파괴적 혁신을 불러일으킬 것으로 전망된다. 책이나 영화를 1분 만에 만들 수 있을 정도로 진화하는 것이다. 현재 생성형 AI는 문장 속 단어와 같은 순차 데이터의 관계를 추적해 맥락과 의미를 학습하는 트랜스포머 모델이다. 빠른 계산을 위해 파라미터(두 개 이상의 변수 사이의 함수관계를 간접적으로 표시할 때 사용하는 변수)가 많이 필요하다. 그만큼 답을 생성할 때 적잖은 시간이 소요된다. 신속한 학습·생성을 위한 그래픽처리장치(GPU)·고대역폭메모리(HBM)의 수요 급증이 이 때문이다. 차세대 반도체 수만 개를 연결하는 슈퍼컴퓨터도 필요하다. 반도체 모델 경량화를 통해 AI 성능을 높이는 게 중요한 과제다. 순다르 피차이 구글 최고경영자(CEO)는 “매년 10배 느는 머신러닝 연산 수요를 감당하기 위해 뛰어난 텐서처리장치(TPU)가 필요하다”고 말했다.

포스트 트랜스포머 모델에서는 메타버스(아바타가 온라인에서 사회·경제·문화적 활동을 하는 세상)에서 AI로 아바타를 생성할 수 있게 될 것으로 전망된다. 헤드마운트디스플레이(HMD)를 끼고 메타버스에 들어가면 현실인지, 가상세계인지 착각이 들 정도가 된다. AI가 사람의 의식 세계에 영향을 미치는 것이다. 김정호 한국과학기술원(KAIST) 전기전자공학부 교수는 “2~3년 뒤 포스트 트랜스포머 AI가 나온다면 반도체 모델의 경량화와 저전력 사용, 고속 생성이 가능해져 세상을 확 바꿔놓을 것”이라며 “기업들도 GPU·HBM·슈퍼컴퓨터 등에 10조~100조 원을 투자하지 않으면 AI 속도전에서 당할 수 없을 것”이라고 강조했다.

김 교수는 이어 “메타버스 영상을 사람이 찍어서 올리지만 앞으로 3~10년 내 AI가 직접 찍어서 올리며 사람과 소통하는 세상이 올 것”이라고 내다봤다. 전날 샘 올트먼 오픈AI CEO가 X(옛 트위터)에 AI 비서와 인간의 사랑을 다룬 공상과학(SF) 영화인 ‘그녀(Her)’를 언급하며 “(GPT-4o가) 영화에 나오는 AI처럼 느껴지고 그것이 현실이라는 게 놀랍다”고 적었지만 AI의 본격 진화는 초기 단계인 셈이다.

공상과학(SF) 영화인 ‘Her’에서 AI의 사랑을 받는 남자 주인공의 모습. /영화 갈무리

궁극적으로는 AI가 감정·윤리·상상력까지 갖추고 유머 능력도 구사하는 등 범용인공지능(AGI)으로 진화할 것으로 예측된다. 김 교수는 “AI가 나중에 인간을 웃길 수 있는 개그 능력까지 갖추면 그야말로 AGI가 되는 것”이라고 평가했다. 김동환 포티투마루 대표는 “AI가 텍스트·이미지·오디오·비디오를 동시에 처리하는 멀티모달 능력이 커지면서 인지능력이 급속히 발전하고 있다”며 “여기에 추론 능력까지 고도화하면 머지않은 미래에 인류는 ‘AI’라고 하는 신(新)인류를 맞이할 준비를 해야 할 것”이라고 했다. 손종수 CGV 디지털혁신담당은 “앞으로 컴퓨팅 방식도 빨간펜으로 컴퓨터에 첨삭 지도할 수 있게 되는 등 생성형 AI 기반으로 바뀔 것”이라며 “컴퓨터가 일하면 사람은 평가·지도하는 형태로 세상이 변할 것”이라고 예측했다. 그러면서 생성형 AI를 소유한 국가와 기업이 더욱 많은 부를 차지하게 될 것이라고 했다.

서정연 LG AI연구원 인재육성위원장은 “회사에서 생성형 AI 모델 개발·응용뿐 아니라 무인공장을 지향하는 공장 자동화, 신약과 신물질 개발, 수요·재고·가격 예측 등을 위한 다양한 AI 연구를 하고 있다”며 “AI 인재 육성과 윤리 확립에 더 많은 노력을 기울여야 한다”고 했다.

고광본 논설위원·선임기자