인공지능(AI) 반도체로 널리 쓰이는 그래픽처리장치(GPU)의 메모리 용량 한계를 극복할 기술이 국내에서 개발됐다.
한국과학기술원(KAIST)은 정명수 전기및전자공학부 교수 연구팀이 차세대 인터페이스 기술인 컴퓨트익스프레스링크(CXL)이 활성화한 고용량 GPU 장치의 메모리 읽기·쓰기 성능을 최적화하는 기술을 개발했다고 8일 밝혔다.
GPU의 내부 메모리 용량은 수십GB에 불과해 스스로 추론·학습하는 데는 한계가 있는 상황이다. 대규모 AI 모델을 구동하기 위해 여러 GPU를 연결하는 방식이 쓰이지만 이는 비용 부담의 문제로 이어진다.
연구팀은 중앙처리장치(CPU)와 GPU, 저장장치 등을 효율적으로 연결해주는 CXL을 활용해 대용량 메모리를 GPU에 직접 연결시키는 ‘CXL-GPU’를 대안으로 제시했다. CXL-GPU의 기존 성능 저하 문제를 개선해 효율적으로 설계하는 기술을 개발했다. 연구팀은 반도체 팹리스 스타트업 파네시아의 CXL-GPU 시제품을 활용한 기술 실효성 검증을 통해 기존 GPU 메모리 확장 기술보다 2.36배 빠르게 AI 서비스를 실행할 수 있음을 확인했다.
연구성과는 이달 산타클라라 USENIX 연합학회와 핫스토리지의 연구 발표장에서 공개된다. 정 교수는 “CXL-GPU의 시장 개화 시기를 가속해 대규모 AI 서비스를 운영하는 빅테크 기업의 메모리 확장 비용을 획기적으로 낮추는 데 기여할 수 있을 것”이라고 기대했다.