암을 치료하고 지구 온난화를 늦추며 핵 저장고의 안전 확보 등 해결해야 할 문제가 넘쳐나는 세상에서 늘어나는 데이터 양에 대응하고 그 데이터를 활용할 수 있는 기술을 갖추는 것은 매우 중요하다. 단순히 데이터 처리 속도뿐만 아니라, 처리할 수 있는 데이터 양과 프로세서를 지원하는 메모리 속도도 중요하다.
우고나 에체루오(Ugonna Echeruo) 인텔 디자인 엔지니어링 그룹(DEG) 수석 엔지니어 겸 인텔 제온 CPU 맥스 시리즈(코드명 사파이어 래피즈 HBM) 총괄 아키텍트는 “기본적으로 CPU는 메모리에서 정보를 가져와 처리하고 업데이트한다. 결국 CPU가 처리할 수 있는 정보량은 데이터를 가져오는 ‘파이프’의 크기에 의해 제약을 받는다. 파이프가 클수록 CPU로 처리할 수 있는 정보가 더 많아져 더 많은 작업을 수행할 수 있다”고 설명했다.
에체루오는 인텔이 메모리 대역폭에 제한을 받는 워크로드를 위한 새로운 솔루션 카테고리를 구현하는 데 중점을 뒀다. 현재로서는 제한된 데이터에 대한 해답은 고대역폭 메모리(HBM)를 사용하는 것이지만, 그는 앞으로 솔루션은 변할 수 있다고 생각한다. 이 솔루션은 CPU가 더 많은 데이터를 처리하도록 지원해 고객들의 요구도 만족시킬 수 있다. 에체루오는 4세대 인텔 제온 스케일러블 프로세서는 대용량 워크로드를 자체적으로 처리할 수 있지만, HBM이 메모리 대역폭 또는 메모리 대역폭과 연산 제한 모두에 의해 성능이 제한된 워크로드 부하에 특히 적합하도록 설계되었다고 설명했다.
에체루오는 인텔에서 20년 이상 근무하면서 가장 기억에 남는 순간으로 맥스 시리즈 CPU 출시를 꼽았다. 인텔 제온 CPU 맥스 시리즈 프로세서는 칩에 HBM이 내장된 최초의, 그리고 유일한 x86 기반 프로세서이기 때문이다.
에체루오는 정부 연구소, 연방 기관 및 대학과 같은 고객이 오늘날 맥스 시리즈 CPU 존재의 이유를 쥐고 있다며, "고객들은 많은 메모리 대역폭을 필요로 하는 애플리케이션을 실행하고 있지만 기존 제품의 대역폭에 제한을 받고 있다"고 말했다. 해당 고객들은 인텔이 자신들의 요구에 맞춰 대역폭을 늘려달라고 요청해왔다.
방대한 양의 데이터를 처리하는 고성능 컴퓨팅을 수행하는 연구실을 예로 들면, 연구원은 HBM이 없는 일반적인 설정에서 해결책을 얻기 위해 많은 컴퓨팅 노드를 활용해야 한다. 맥스 시리즈 CPU는 HBM으로 인해 성능과 메모리 대역폭을 향상시키고 코드 변경 없이도 연구원들이 더 적은 리소스로 동일한 작업을 수행할 수 있도록 지원한다. 이로 인해 연구실의 전반적인 생산성과 에너지 효율성이 증가한다.
HBM 101: 기본 개념으로 돌아가기
CPU를 자동차의 내연기관이라고 상상해보자. 자동차의 성능은 연소실에 연료와 혼합되는 공기 유입량으로 인해 제한된다. 따라서, 더 많은 공기를 주입하기 위해 터보와 슈퍼차저를 추가한다. CPU의 경우 고대역폭 메모리에 해당된다. 이를 통해 강제로 더 많은 공기를 주입할 수 있고 최고 속도도 올라가는 것이다.
CPU의 ‘파이프’는 시간이 지남에 따라 더 많은 공기를 연소실로 비유했던 곳으로 이동시킨다. 파이프가 더 넓어짐에 따라 메모리와 CPU 사이의 인터페이스 처리량이 증가한다. 파이프가 넓어지면 더 강력해진 CPU가 더 많은 데이터를 처리할 수 있고 고객들은 더 만족하게 된다. HBM을 통해 CPU의 성능은 한 단계 더 도약한다.
해결 가치가 있는 도전 과제
에체루오는 CPU와 HBM의 물리적인 거리가 성공의 열쇠라고 설명했다. HBM은 프로세서와 가까운 회로 기판에 납땜돼 필요한 정보를 빠르고 편리하게 가져올 수 있다. 이러한 근접성 덕분에 전력을 절약할 수 있다.
다만, HBM을 CPU패키지에 그냥 갖다 붙이는 건 간단한 작업이 아니다.
에체루오는 “관련 모든 팀이 많은 어려움을 겪었다”고 말한다. 해당 팀들은 4세대 인텔 제온 프로세서 설계가 확정된 후 작업에 투입되며 수많은 테스트와 검증을 진행해야 했다. 그는 “향상된 메모리 시스템을 인텔 최고의 컴퓨팅 코어인 인텔 제온 코어과 결합하고 싶었다고”고 덧붙였다.
그는 “제품 내 개별 IP를 살펴보고 HBM과 충돌하는 부분이 없는지 확인해야 했으며, 최대한 넓은 대역폭을 활용할 수 있는지 봤다”며 “표준 제품 일정과 제공에 영향을 주지 않으면서도 HBM이 성공적으로 작동하는 데 필요한 변경사항을 적용하는 방법을 찾아야 했다”고 말했다.
경쟁 제품과 비교
에체루오는 맥스 시리즈 CPU의 또다른 장점으로 전력효율성을 꼽았다. CPU와 HBM의 근접성으로 전력을 절약할 수 있을 뿐만 아니라, HBM 없이도 사용자가 일반적으로 필요로 하는 시스템과 용량을 줄일 수 있기 때문이다. 여러 개의 RAM을 꽂던 시대가 지나고 이제 HBM의 시대가 도래한 것이다.
인텔은 x86프로세서에 HBM을 최초로 추가했다. 에체루오는 이를 “인텔의 주요 이점”이라며, “소프트웨어 스택을 활용해 고객이 HBM을 더 쉽게 이용할 수 있고 사용자 친화적으로 만드는 것”이 핵심이라고 말했다.
사용자 친화적 관점에서 HBM이 탑재된 GPU와 달리 맥스 시리즈 CPU는 인력이 많이 투입되는 코드 변경이 필요하지 않으므로 시간과 노력을 절약할 수 있다. 에체루오는 “고객은 직접 처리해야 할 작업이 적어질수록 더 행복해진다”며 “그리고 궁극적으로 이런 점이 인텔에게도 좋다”라고 밝혔다.
혁신은 여기서 멈추지 않고, 인텔은 ISC 하이 퍼포먼스 ’23(ISC High Performance ’23) 컨퍼런스에서 곧 출시될 고메모리대역폭 제품인 차세대 인텔 코드명 그래나이트 래피즈와 멀티플렉서 결함 랭크(MCR)를 갖춘 미래의 인텔 제온 프로세서를 선보였다.
제온 맥스는 앞으로 세상에 필요한 과학적 지식에 기여할 것으로 예상된다. 에체루오는 부분적으로는 이 제품이 자신을 앞으로 나아가게 하는 원동력이라며, “해당 제품은 기업과 국립 연구소에서 작업하고 있는 기본적인 과학, 의학 그리고 클라우드 인프라를 연구에 필요한 서버에 탑재될 것이다”라고 밝혔다.