네이버와 인텔이 엔비디아의 인공지능(AI) 반도체 독점에 맞서 자체 AI 생태계를 넓히기 위한 협력에 속도를 낸다. 개발자들이 인텔 AI반도체에 최적화한 AI 서비스들을 개발하는 데 필요한 개발도구를 연내 상용화하는데 네이버가 힘을 보태는 동시에 조만간 출시될 인텔의 차세대 AI반도체 ‘가우디3’ 기반의 협력 계획도 공식화했다.
하정우 네이버클라우드 AI이노베이션센터장은 5일 서울 서초구 JW메리어트호텔에서 열린 ‘인텔 AI 서밋’에 참석해 “연내 인텔 AI반도체 ‘가우디2’에서 잘 구동되는 버추얼(가상) 대형언어모델(vLLM) 오픈소스를 만들어 공개하는 게 목표”라며 “관련 테스트 결과를 공개하고 (vLLM이) 가우디3에서도 돌아갈 수 있도록 인텔은 물론 국내 파트너사와 협력할 계획”이라고 밝혔다.
vLLM은 개발자들이 LLM을 활용해 다양한 소프트웨어(SW)를 효율적으로 개발하는 데 필요한 개발도구로, 개발자들이 ‘프레임워크(개발 틀)’라고 부르는 SW 개발 플랫폼의 일종이다. vLLM의 성능은 LLM을 구동하는 데 쓰이는 AI반도체에 따라 달라지며 현재 대부분의 vLLM은 엔비디아 그래픽처리장치(GPU)를 썼을 때 성능이 가장 잘 발휘되도록 만들어졌다. 즉 AI 개발사들이 네이버 ‘하이퍼클로바X’ 같은 자체 LLM을 가졌는지와 무관하게 vLLM을 쓰는 과정에서 AI반도체 시장을 장악한 엔비디아 생태계에 종속될 수 밖에 없다. 하 센터장은 발표 후 서울경제신문과 만나 “지금의 vLLM을 그냥 LLM 위에 올리면 성능이 비효율적으로 나온다”며 “인텔 AI반도체에 특화한 vLLM 구축 작업을 해보니 그 성능이 경쟁력 있게 나타나고 있다”고 설명했다.
양사와 한국과학기술원(KAIST)는 다음달 AI공동연구센터를 출범하고 관련 연구개발(R&D)을 시작한다. 네이버는 AI 경량화 전문기업 스퀴즈비츠와 함께 R&D에 필요한 ‘베이스 SW’를 개발하는 사전작업을 진행 중이다. 네이버는 또 4월 가우디3 공개 당시 “가우디2 테스트에 집중한다”는 입장이었지만 이날 가우디3를 활용한 협력도 제품 출시 직후인 연말부터 시작될 것이라고 전했다. 하 센터장은 “AI반도체 시장이 특정(엔비디아) GPU에 독점되는 상황은 개선할 필요가 있다”며 “경쟁력 있는 대안이 나와야 AI 기업들이 더 많은 혁신을 이뤄낼 수 있다”고 했다.
인텔의 데이터센터·AI 부문을 총괄하는 저스틴 호타드 수석부사장도 기조연설과 기자간담회를 통해 “가우디3는 경쟁사 GPU보다 최대 2배 나은 가격 대비 성능과 개방형 생태계를 제공한다는 장점이 있다”며 “강력한 개방형 생태계를 구축하기 위해 클라우드, 자체 파운데이션모델, 광범위한 활용 사례를 가진 네이버와 협력해나갈 것”이라고 말했다. 그러면서 “한국 기업과 파트너십은 인텔 AI 미래 비전의 중심에 있다”고 강조했다.
인텔은 가우디에 쓰이는 고대역폭메모리(HBM) 적용을 위해 삼성전자와 SK하이닉스, AI PC 분야에서는 삼성전자와 LG전자, 6세대 이동통신(6G)와 관련해서 SK텔레콤 등 다양한 한국 기업과 협력을 강화할 방침이다. 특히 삼성전자는 전날 대만 ‘컴퓨텍스 2024’에서 팻 겔싱어 인텔 최고경영자(CEO)가 삼성메디슨과의 AI 헬스케어 협력 계획을 밝혔고, 네이버와도 별도로 AI반도체 ‘마하’ 시리즈를 개발 중이다. 겔싱어 CEO는 당초 이날 행사에도 참석하려던 계획이 최근 취소됐는데, 이를 두고 업계에서는 그가 삼성전자 경영진을 만나려다가 반도체(DS) 부문 수장이 교체되면서 일정 조정이 필요해졌을 것이라는 추측이 나온다. 이날 인텔 AI 서밋에 배용철 삼성전자 메모리사업부 상품기획실장(부사장)이 비공개 세션에 참석해 관련 논의를 진행한 것으로 전해졌다.