금융 메인프레임 시장 최강자 IBM이 삼성전자(005930) 5나노(nm) 공정에서 제조한 신형 인공지능(AI) 칩셋을 공개했다. 중앙처리장치(CPU)는 신뢰성이 중요한 금융·공공 시장에 최적화해 데이터 입출력(I/O) 성능을 대폭 강화했고, 외부 AI 가속기를 더해 AI 시대에도 대응하겠다는 전략이다.
IBM은 26일(현지 시간) 미 스탠퍼드대에서 열린 반도체 학회 ‘핫칩스(Hot Chips) 2024’에서 메인프레임용 칩셋 ‘텔럼2’ 프로세서와 ‘스파이어(Spyre)’ AI 가속기를 공개했다. 두 칩셋은 각각 삼성전자 파운드리 5HPP, 5LPE 공정에서 생산된다. IBM은 “AI 도입 확대로 효율적이고 강력한 보안을 지닌 한편 확장 가능한 칩셋에 대한 요구가 커졌다”며 “신형 모델은 AI 시대를 맞아 처리할 수 있는 용량을 크게 확장했다”고 설명했다.
텔럼2는 인텔·AMD·퀄컴 등 주요 CPU 제조사들의 서버용 제품과는 다른 설계 사상을 보인다. 우선 전력 소모 감소를 위해 저전력 효율 코어와 고성능 코어를 분리하는 최근 추세와 달리 최대 5.5GHZ로 작동하는 8개 CPU만을 지녔다. 전체 칩셋 크기도 600㎟로 최근 소형화 기조에 역행한다.
대신 CPU와 외부를 연결하는 캐시 메모리 면적이 40% 늘었다. 캐시메모리 영역이 총 10개로 CPU 개수보다 많고, L2 캐시는 36MB, 가상 L3 캐시는 360MB, 가상 L4 캐시는 2.8GB에 달한다. 또 신경망처리장치(NPU) 대신 I/O를 전담하는 데이터처리장치(DPU) 개념을 도입했다. 넉넉한 캐시와 DPU를 통해 I/O 관리 전력을 70% 줄이고 입출력 밀도를 50% 증가시켜 결과적으로 칩 외부 대역폭을 30% 늘릴 수 있었다고 한다. IBM은 “DPU로 복잡한 데이터 입출력 과정을 가속화해 전체 성능을 개선했다”고 설명했다.
함께 선보이는 스파이어는 IBM의 첫 독립 AI 가속기다. 총 32개 코어에 260억개 트랜지스터를 집적해 초당 300조 개의 연산(TOPS)이 가능하다. 메모리는 128GB에 전력 소모는 75W로 적은 편이다. 역시 칩당 2MB의 ‘스크래치패드’를 장착해 데이터 입출력 속도를 높였다. 텔럼2을 탑재한 메인프레임 시스템에 ‘옵션’으로 추가 도입할 수 있다.
독특한 CPU 설계는 IBM 텃밭인 금융·공공 시장을 겨냥한 것으로 해석된다. IBM은 보안과 안전성이 생명인 금융 분야의 70%를 점유하고 있다. 공공기관, 특히 안보 관련 분야도 IBM의 주요 고객이다. 기존에도 대용량 데이터를 일상적으로, 안정적으로 처리해야 했던 IBM 주요 고객사는 AI 시대 도래로 그 부담이 타 업종 대비 더욱 커진 상태다. 이에 따라 데이터 입출력 속도를 높이는 한편, 고성능 CPU와 넉넉한 캐시 메모리로 연산의 안전성 또한 확보하겠다는 전략이다. 실제 IBM은 “이전 세대에 비해 칩당 컴퓨팅 용량을 4배 증가시키는 한편 금융 거래 중 사기 탐지를 강화할 수 있었다”고 했다.
삼성전자는 텔럼1을 생산한 데 이어 텔럼2와 스파이어를 수주하며 IBM과 끈끈한 관계를 이어가게 됐다. IBM은 “오랜 파트너인 삼성전자 파운드리의 고성능, 고효율 공정에서 제조돼 CPU 면적을 20% 줄이고 전력소모도 15% 줄일 수 있었다”고 강조했다. 두 칩셋은 2025년 출하돼 IBM 차세대 Z 시리즈 메인프레임에 적용된다.