엔비디아-ARM, 슈퍼컴퓨팅 성능 26배 향상
2020년 11월 20일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

엔비디아(www.nvidia.co.kr , CEO 젠슨 황)와 Arm은 지난 18개월간 고성능컴퓨팅(HPC) 분야에서 Arm 기반 플랫폼의 성능을 25.5배 향상시켰다고 밝혔다. 

 

Arm 네오버스 N1(Neoverse N1) 코어는 암페어 컴퓨팅(Ampere Computing)의 알트라(Altra)와 같은 시스템온칩(SoC)의 성능을 작년 디자인 대비 약 2.3배 향상시켰다. 엔비디아의 A100 텐서 코어(Tensor Core) GPU는 단일 세대에서 역대 최고의 성능 향상을 달성했으며, 최신 Arm 기반 플랫폼은 코어, 입출력 레인과 메모리 속도를 개선시켰다. 또한, 애플리케이션 개발자들은 새로운 최적화 기능들을 통해 소프트웨어를 조정했다. 

 

그 결과, 2개의 암페어 컴퓨팅의 알트라 SoC와 2개의 A100 GPU로 구성된 엔비디아의 HPC용 Arm 기반 레퍼런스 디자인은 연구원들이 2019년 6월에 사용했던 듀얼-SoC 서버의 25.5배에 달하는 성능을 구현했다. 엔비디아와 Arm은 GPU로 가속화된 Arm 기반 레퍼런스 플랫폼에 한해서만 1년 만에 2.5배의 성능 개선을 달성했다. 

 

이 같은 성과는 코로나19 팬데믹 상황에서 최우선 과제로 꼽히는 신약 개발의 핵심이 되는 그로맥스(GROMACS), 램스(LAMMPS), MILC, NAMD, 퀀텀 에스프레소(Quantum Espresso)와 같은 주요 HPC 애플리케이션에도 해당된다. 이 외에도, Arm 기반 시스템 운영체제에서 실행될 수 있는 다양한 애플리케이션은 엔비디아의 GPU 가속 소프트웨어 허브인 NGC 컨테이너에서 이용할 수 있다. 

 

분자역학, 양자화학 등의 분야에서 한계를 극복해 나가고 있는 기업과 연구원들은 이러한 애플리케이션들을 활용해 기초과학뿐 아니라 헬스케어 등과 같은 분야의 발전을 이끌 수 있다. 

 

Arm과 HPC의 결합

최신 레퍼런스 아키텍처는 2U 크기의 서버 플랫폼인 암페어 컴퓨팅의 마운틴 제이드(Mt. Jade)의 에너지 효율적인 처리량과 이미 전 세계의 주요 슈퍼컴퓨터를 가속화하고 있는 엔비디아의 HGX A100가 결합된 것이다. 이 아키텍처는 마벨(Marvell) 썬더X2(ThunderX2)와 엔비디아 V100 GPU를 기반으로 지난해 첫 선을 보인 디자인의 후속작이다. 

 

마운틴 제이드는 Arm 네오버스 N1 코어를 기반으로 각각 80개의 코어가 탑재된 암페어 알트라 SoC 2개로 구성되어 있으며, 모두 최대 3GHz 속도로 실행된다. 2개의 A100 GPU를 위해 무려 192개의 PCIe 4세대 레인과 최대 8TB의 메모리를 제공한다.

 

190129e89c4cec99c9bd3cfbf2ec8168_1605820418_5242.jpg

<마운틴 제이드 서버 플랫폼은 192개의 PCIe 4세대 레인을 지원한다.> 

 

이러한 조합으로 차세대 슈퍼컴퓨터용 노드의 성능이 극대화됐다. 암페어 컴퓨팅은 이미 기가바이트(Gigabyte), 레노버(Lenovo), 위윈(Wiwynn) 등 9개의 기존 장비 및 디자인 제조업체와 시스템 통합업체의 지원을 받고 있다. 

 

Arm HPC 생태계의 부상

Arm HPC 유저 그룹(ARM HPC User Group)은 생태계 확대를 위해 아마존웹서비스(AWS), HPE, 율리히 슈퍼컴퓨팅센터(Juelich Supercomputing Center), 일본 이화학연구소(RIKEN), 미국 오크리지국립연구소(Oak Ridge National Laboratory)와 샌디아국립연구소(Sandia National Labs) 등 대부분의 기관과 슈퍼컴퓨팅 2020(SC20) 행사 이전에 30여 차례 이상 가상회의를 개최했다. 

 

올해 6월 Arm은 슈퍼컴퓨팅 분야에서 가장 큰 도약을 이뤄냈다. 일본 후가쿠(Fugaku) 시스템은 후지쯔(Fujitsu)의 Arm 기반 A64FX CPU를 사용해 415.5페타플롭(PF)이라는 놀라운 성능 기록을 세우며 세계에서 가장 빠른 슈퍼컴퓨터 상위 500대 리스트에서 1위로 등극했다. 

 

후가쿠 시스템은 상위 500대 리스트에 오른 4개의 Arm 기반 슈퍼컴퓨터 중에 하나였다. 또한, 엔비디아가 소프트웨어상에서 지원할 예정인 Arm의 차세대 네오버스 디자인에 내장된 기술인 Arm SVE(Scalable Vector Extension)을 최초로 사용한 슈퍼컴퓨터이다. 

 

AWS는 이미 유전체학, 금융 리스크 모델링, 유체역학과 같은 클라우드 HPC 작업을 Arm 기반 그래비톤2(Graviton2) 프로세서에서 수행하고 있다. 

 

엔비디아, Arm의 HPC 분야 성장 가속화

Arm의 HPC 분야 성장은 스마트폰 및 슈퍼컴퓨터 분야에 종사하는 1,300만여 개발자들로 구성된 방대한 생태계를 기반으로 한다. 엔비디아는 세계 최고의 AI 선도기업으로 자리매김하기 위해 Arm을 인수함으로써 이러한 생태계를 확장하는 것을 목표로 하고 있다. 

 

엔비디아는 AI, HPC, 네트워킹과 그래픽 소프트웨어 분야에 걸쳐 Arm의 지원을 통해 생태계를 확대하고 있다. 작년 슈퍼컴퓨팅 행사에서, 젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 IBM 파워(POWER)와 x86아키텍처에 대한 지속적인 지원 외에도 HPC 분야에서 Arm의 성장을 가속화하는 계획을 발표했다.

 

190129e89c4cec99c9bd3cfbf2ec8168_1605820374_714.jpg

<엔비디아는 Arm 생태계에 대한 지원을 확대했다.> 

 

이후, Arm 지적재산권(IP)을 사용해 클라우드, 임베디드 및 엔터프라이즈 애플리케이션을 위한 안전한 네트워킹과 스토리지 작업을 가속화하는 블루필드-2(BlueField-2) DPU를 발표했다. 엔비디아는 10년이 넘는 기간 동안 로보틱스 및 임베디드 시스템용 젯슨 나노(Jetson Nano) 모듈과 같은 제품에 Arm 디자인을 적극 사용해왔다.

그래픽 / 영상
많이 본 뉴스