AMD, 탁월한 HPC 및 AI 성능으로 엑사스케일 컴퓨팅 지원하는 AMD 인스팅트 MI200 시리즈 발표
2021년 11월 10일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

AMD 가 자사 최초의 엑사스케일급 GPU 액셀러레이터인 AMD 인스팅트 MI200 (AMD Instinct MI200) 시리즈를 발표했다. AMD 인스팅트 MI200 시리즈는 세계에서 가장 빠른 고성능 컴퓨팅(High Performance Computing, 이하 HPC) 및 인공지능(Artificial Intelligence, 이하 AI) 액셀러레이터인 AMD 인스팅트 MI250X(AMD Instinct MI250X)를 포함한다. 

 

AMD 인스팅트 MI200 시리즈 액셀러레이터는 AMD CDNA 2 아키텍처를 기반으로 설계되어 선도적인 애플리케이션 성능으로 광범위한 HPC 워크로드를 지원한다. AMD 인스팅트 MI250X 액셀러레이터는 배정밀도(FP64) HPC 애플리케이션에서 경쟁 제품 대비 최대 4.9배 높은 성능을 제공하며, AI 워크로드에서 380 테라플롭스(teraflops) 이상의 반정밀도(FP16)를 지원, 데이터 기반 연구를 가속한다. 

 

AMD 데이터 센터 및 임베디드 솔루션 비즈니스 그룹 총괄 수석 부사장 포레스트 노로드(Forrest Norrod)는 "AMD 인스팅트 MI200 액셀러레이터는 선도적인 HPC 및 AI 성능으로 전 세계 과학자들이 보다 빠르게 연구 가설에 대한 결론에 도달할 수 있도록 돕는다”라고 밝혔다. 또한, “AMD 인스팅트 MI200 액셀러레이터는 혁신적인 아키텍처, 패키징, 시스템 설계를 갖춘 최고의 데이터 센터용 GPU”라며, “슈퍼컴퓨터와 데이터 센터를 통해 세계에서 가장 복잡한 난제를 해결할 수 있도록 지원할 것”이라고 전했다. 

 

엑사스케일 컴퓨팅 

AMD는 미국 에너지부(U.S. Department of Energy), 오크리지 국립연구소(Oak Ridge National Laboratory),  휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, 이하 HPE)와 함께 1.5엑사플롭스(exaflops) 이상의 최대 컴퓨팅 성능을 지원하는 프론티어(Frontier) 슈퍼컴퓨터를 설계했다. 3세대 AMD EPYC™ 프로세서 및 AMD 인스팅트 MI250X 액셀러레이터를 탑재한 프론티어 슈퍼컴퓨터는 대폭 향상된 AI, 분석, 시뮬레이션 성능을 기반으로 더 빠른 연산 속도, 새로운 데이터 패턴 포착 기능, 혁신적인 데이터 분석 기법 등을 제공하며 과학자들의 더욱 빠른 과학적 발견을 도울 예정이다. 

 

오크리지 국립연구소 디렉터 토마스 자카리아(Thomas Zacharia)는 “프론티어 슈퍼컴퓨터는 AMD와 HPE, 미국 에너지부의 협업으로 탄생한 최고의 결과물”이라며, “AI, 분석 및 시뮬레이션 성능을 획기적으로 향상해 과학적 발견의 경계를 넓히고, 엑사스케일급 성능을 제공하도록 설계됐다”고 전했다. 

 

HPC에서의 AMD 영향력 확산

AMD EPYC 프로세서와 ROCm 5.0 개방형 소프트웨어 플랫폼이 결합된 인스팅트 MI200 시리즈 액셀러레이터는 기후 변화부터 백신 연구까지 오늘날 사회가 직면하는 시급한 과제를 해결하도록 설계됐다. 

 

AMD 인스팅트 MI200 시리즈 엑셀러레이터의 주요 특징은 다음과 같다.

  • AMD CDNA 2 아키텍처 – 2세대 매트릭스 코어(2nd Gen Matrix Cores)로 배정밀도(FP64) 및 단일 정밀도(FP32) 매트릭스 연산을 가속화하여 이론상 이전 세대 GPU 대비 최대 향상된 4배 성능을 제공한다.
  • 업계 선도적인 패키징 기술 – 2.5D EFB(Elevated Fanout Bridge) 기술을 탑재한 업계 최초의 다중 다이 GPU(multi-die GPU) 설계로 이전 세대 GPU 대비 1.8배 더 많은 코어와 2.7배 더 높은 메모리 대역폭을 제공, 이론상 업계 최고의 초당 3.2 테라바이트의 메모리 대역폭을 지원한다.
  • 3세대 AMD 인피니트 패브릭(AMD Infinity Fabric) 기술 – 최대 8개의 인피니티 패브릭 링크는 AMD 인스팅트 MI200과 노드 내 3세대 EPYC CPU 및 GPU를 연결하여 통합된 CPU/GPU 메모리 일관성(memory coherency)을 제공하고 시스템 처리량을 극대화하여 CPU 코드에서 가속기의 성능을 쉽게 활용할 수 있도록 지원한다. 

 

엑사스케일급 과학 연구를 위한 소프트웨어

AMD ROCm™은 AMD 인스팅트 엑셀러레이터에서 과학 연구를 돕는 개방형 소프트웨어 플랫폼으로 다양한 가속기 및 아키텍처 환경을 마련한다. AMD는 ROCm 5.0 지원으로 인스팅트 MI200 시리즈 엑셀러레이터를 통해 최상의 HPC 및 AI 애플리케이션을 위한 개방형 플랫폼을 확장하고 ROCm에 대한 개발자의 접근성을 높여 주요 워크로드 전반에서 선도적인 성능을 제공한다. 

 

연구원 및 데이터 과학자를 포함한 모든 사용자는 AMD 인피니티 허브(Infinity Hub)에서 인스팅트 엑셀러레이터와 ROCm에 최적화된 컨테이너형 HPC 어플리케이션과 ML 프레임워크를 설치 가능하다. 현재 인피니트 허브는 라데온 인스팅트 MI100, MI150, 및 MI200 엑셀러레이터를 지원하는 크로마(Chroma), CP2k, 램스(LAMMPS), NAMD, OpenMM 등 다양한 컨테이너를 제공 중이며, ML 프레임워크 텐서플로우(ML frameworks TensorFlow) 및 파이토치(PyTorch) 등 애플리케이션도 지원한다. 향후 새로운 컨테이너는 허브에 지속 추가될 예정이다. 

 

사용 가능한 서버 솔루션

AMD 인스팅트 MI250X 및 MI250은 오픈 하드웨어 컴퓨팅 가속기 모듈 또는 OAM(OCP Accelerator Module) 형식으로 구매 가능하며, 인스팅트 MI210은 OEM 서버의 PCIe 카드 형식으로 만나볼 수 있다. 

 

AMD MI250X 엑셀러레이터는 현재 HPE 크레이 EX(Cray EX) 슈퍼컴퓨터를 통해 이용 가능하며, 그 외 AMD 인스팅트 MI200 시리즈는 에이수스(ASUS), ATOS, 델(Dell), 기가바이트(Gigabyte), HPE, 레노버(Lenovo), 팽귄컴퓨팅(Penguin Computing), 슈퍼마이크로(Supermicro)를 포함한 엔터프라이즈 시장의 주요 OEM 및 ODM 파트너사를 통해 구매 가능하다.

그래픽 / 영상
많이 본 뉴스