국내 연구진이 고성능 그래픽처리장치(GPU) 같은 고비용 인프라 없이도 저렴하게 인공지능(AI) 모델을 학습시킬 수 있는 기술을 개발했다.
한국과학기술원(KAIST)은 한동수 전기및전자공학부 교수 연구팀이 일반 소비자용 GPU를 활용해 AI 모델 학습을 수십배에서 수백배 가속할 수 있는 ‘스텔라트레인’ 분산 학습 프레임워크를 개발했다고 19일 밝혔다. 연구성과는 지난달 호주 시드니에서 열린 ‘ACM SIGCOMM 2024’에서 발표됐다.
기존에는 AI 모델 학습을 위해 개당 수천만 원에 달하는 고성능 GPU가 필요했다. 엔비디아의 H100이 대표적이다. 이 같은 인프라는 소수의 빅테크를 제외하면 대수의 AI 개발사가 도입하기에 비용 부담이 큰 실정이다.
연구팀은 H100보다 10~20배 저렴한 일반 소비자용 GPU와 일반 인터넷 환경을 활용해서도 AI 모델 학습을 효율화할 수 있는 기술을 개발했다. 저가 GPU는 메모리 용량과 네트워크 속도의 한계로 AI 학습 속도가 느리다는 문제가 있었다. 연구팀은 여러 GPU를 병렬로 구성하고 맞춤 알고리즘을 개발해 이 문제를 해결했다. 연구팀의 스텔라트레인 기수은 기존 대비 최대 104배 빠른 학습 성능을 내는 것으로 나타났다.
한 교수는 "이번 연구가 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있게 하는 데 기여하겠다”며 “앞으로도 저비용 환경에서도 대규모 AI 모델을 학습할 수 있는 기술 개발을 계속할 계획”이라고 말했다.