자신 있는 구글…'팜2'와 GPT-4 비교까지 [AI토피아]

MS보다 AI 뒤처졌다는 의심 받던 구글
보고서 통해 구글 LLM '팜2' 상세히 다뤄
수학 연산과 추론 능력 GPT-4보다 낫기도
국내보다 한국어 특화 LLM '팜2' 먼저 선봬
한국어 강점 내세웠던 네이버·카카오 부담



팜2로 소스코드의 오류를 수정하고 각 줄마다 한국어 주석을 추가한 모습. 구글 기술 보고서

오픈AI가 개발한 챗GPT가 전세계에 AI 열풍을 일으킨 가운데 구글의 반격이 만만치 않다. 올 초 시연한 바드가 오답을 제시하는 등 망신을 겪기도 했지만 지난달 대형언어모델(LLM) ‘팜2(PaLM2)’를 장착한 생성 AI 챗봇 ‘바드’가 호평받고 있다. 구글은 앞으로 팜2를 검색뿐 아니라 다양한 서비스에 도입해 기존 사업의 경쟁력과 수익성을 강화하는 데 힘쓸 것으로 보인다.


구글은 지난 10일(현지 시간) 미국 캘리포니아 마운틴뷰에서 연례 개발자 회의 ‘구글 I/O’ 행사를 열어 팜2를 선보인 후 팜2 기술보고서도 공개했다. 팜2의 다양한 기능들을 나열했고 군데군데 챗GPT와도 비교하며 우수성을 강조한다. 팜2는 지난해 4월 선보인 팜의 업그레이드 버전이다.



GPT-4, 팜, 팜2의 추론 능력을 비교한 부분. 팜2의 점수가 모든 문제에서 팜을 능가하고 GPT-4보다 높은 경우도 있다. 구글 기술 보고서


추론 능력에 있어서 팜2는 모든 데이터셋에서 기존의 팜을 능가하며 GPT-4와 경쟁하는 결과를 달성한다고 명시해뒀다. 점수 결과를 비교한 부분을 보면 팜2의 점수는 팜보다 모두 높았다. GPT-4와 비교한 3개의 시험에 대해서는 하나의 경우를 제외하고는 팜2가 더 높은 점수를 보였다.



GPT-4, 팜, 팜2의 수학 능력을 비교한 부분. 팜2는 팜보다 모든 업무에서 점수가 높았고 GPT-4와 비슷한 성능을 보인다. 구글 기술 보고서

수학 문제의 경우 팜2가 GPT-4보다 높은 점수를 보이거나 비슷한 성능 결과가 나왔다. 다만 프롬프트를 활용했다는 걸 언급하기도 하는 등 GPT-4와 객관적으로 성능을 비교한 건지는 명확하지 않다.


또 팜2는 웹 문서, 책, 코드, 수학, 대화 등을 데이터셋으로 했다고 말한다. 아울러 수백 개의 언어를 다루는 병렬 데이터도 훈련시켰다며 언어 측면 강점도 드러냈다.



인종 민족성 등의 편향이 발생할 수 있다는 예시. 구글 기술 보고서


하지만 구체적으로 어떤 데이터들을 수집했는지는 밝히지 않고 있다. 보고서 뒤쪽에는 예상치 못한 편향으로 이어질 수 있다며 잠재적 피해 예시들을 적어놨다. 학급에서 기대 이상의 성과를 낸 사람을 물었을 때 백인 학생을 답하는 식이다. 인터넷 상의 데이터 학습이 인종 차별적인 결과로 이어진 것으로 보인다.


기술 보고서에서는 한국어가 있는 부분도 눈에 띈다. 팜2로 소스코드의 오류를 잡아내고 한국어로 주석을 달아놓은 것을 예시로 올려놓은 것이다. 지난달 구글 I/O에서도 순다르 피차이 구글 최고경영자(CEO)는 영어 사용자와 한국어 사용자가 바드를 통해 대화하며 코딩 오류를 수정하는 장면을 보여주며 팜2의 코딩 작성 능력을 보여주기도 했다.


이처럼 팜2는 100개 이상의 언어를 학습해 다중 언어 능력을 갖췄고 수학 연산과 추론은 물론 코딩에도 특화됐다. 모델 성능과 연관성이 높은 매개변수의 경우 팜2는 5400억 개로 GPT-3(1750억 개)의 3배 이상이다. GPT-4는 정확한 매개변수 규모가 공개되지 않았다.



10일(현지 시간) 미국 캘리포니아주 마운틴뷰 구글 본사에서 열린 연례 개발자 회의(I/O)에서 순다르 피차이 구글 최고경영자(CEO)가 팜2를 소개하고 있다. 실리콘밸리=정혜진 특파원


“인공지능 기업으로 여정을 시작한 지 7년이 지난 지금 우리는 흥미진진한 변곡점에 있다. 모든 사람과 기업, 커뮤니티에 AI를 더욱 유용하게 제공할 기회가 찾아왔다.”


순다르 피차이 구글 CEO는 구글 I/O에서 이렇게 말했다. 구글은 팜2를 검색 외에도 다양한 분야에 접목해 기존 사업의 경쟁력을 끌어올릴 전망이다. 바드는 지(G)메일 등 구글 25개 제품과 결합된다. 문서 작성 서비스 닥스(Docs)와 결합해 이메일 초안을 작성할 수도 있다.


지난달 17일(현지 시간) CNBC는 구글 내부 문건을 입수해 구글이 광고 사업에 팜2를 적용할 계획이라고 전했다. 이용자들에게 최적화된 광고 추천을 하고 유튜브 크리에이터에게는 콘텐츠 아이디어를 제안할 수 있다는 것이다.


구글이 한국 기업보다 먼저 한국어에 특화한 팜2 기반의 AI 챗봇 ‘바드’를 내놓자 국내 빅테크 기업의 부담도 커진 모습이다. 네이버는 한국어 데이터를 학습한 한국어 특화 대규모언어모델(LLM)인 ‘하이퍼클로바X’를 오는 7~8월에 내놓고 3분기 중 이를 이용한 서치GPT를 선보일 예정이다. 카카오(035720)의 AI 자회사 카카오브레인은 LLM 모델 '코(KO)GPT'의 차세대 버전인 '코GPT 2.0'을 3분기 내에 공개할 전망이다.





챗GPT로 촉발된 생성형 인공지능(AI) 기술 개발 경쟁이 격화하면서 기대와 우려가 공존합니다. AI와 함께 하는 현재와 같이 살아갈 미래는 인류에게 유토피아일 수도 있고, 디스토피아가 될 수도 있습니다. ‘AItopia’를 통해 AI로 인한 사회·산업의 변화를 분석하고 인류 삶의 미래를 조망합니다.


<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>