AMD, 혁신 기술 앞세워 엑사스케일 슈퍼컴퓨팅 선도한다
2021년 06월 30일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

e9c55b2107da5e74189a0f55e1cd0275_1624990662_7603.jpg


AMD 가 인터내셔널 슈퍼컴퓨팅 2021(International Supercomputing 2021, 이하 ISC 2021) 디지털 행사에서 고성능 컴퓨팅(High Performance Computing, 이하 HPC)을 위한 AMD EPYC 프로세서 및 AMD 인스팅트 엑셀러레이터(AMD Instinct Accelerator) 관련 업데이트를 발표한다. AMD는 ISC 2021에서 ROCm 오픈 소프트웨어 플랫폼 업데이트에 대해 설명하고, AMD 인스팅트 교육 및 연구(AMD Instinct Education and Research, 이하 AIER) 이니셔티브에 대해 발표할 예정이다. AMD EPYC 프로세서는 최근 벤치마크 점수를 기반으로 전 세계 슈퍼컴퓨터 순위를 월간으로 제공하는 탑500(Top500) 리스트에 오르는 등 HPC 시스템 분야에서 지속적으로 영향력을 확장하고 있다. AMD EPYC 프로세서를 채택한 HPC 시스템의 숫자는 2020년 6월 대비 약 5배, 동년 11월 대비 약 2배 증가했으며, 2021년 6월 탑500 리스트에 추가된 58개의 슈퍼컴퓨터 중 절반가량이 EPYC 프로세서를 채택했다. 

 

AMD 데이터 센터 및 임베디드 솔루션 비즈니스 그룹 총괄 수석 부사장 포레스트 노로드(Forrest Norrod)는 “HPC 기술은 전 세계가 직면하고 있는 주요 난제들을 해결하기 위해 꼭 필요하다”며 “AMD는 전 세계 HPC 시스템에 AMD EPYC 프로세서 제품군 및 AMD 인스팅트 엑셀러레이터를 공급하는 등 HPC 기술 발전을 위한 핵심 파트너로 자리매김하고 있다. AMD는 엑사스케일 슈퍼컴퓨팅의 장벽을 낮추고, 지속적인 혁신을 위한 성능과 다양한 기능을 제공하기 위해 노력할 것”이라고 밝혔다. 

 

AMD의 HPC 모멘텀 확장 

AMD는 최근 HPC 워크로드를 위한 선도적인 성능을 제공하는 AMD EPYC 7003 시리즈 프로세서를 출시하는 등 주요 파트너사 및 고객들이 제조, 생명 과학, 금융 서비스, 기후 조사 등 여러 분야의 연구를 위한 HPC 클러스터를 구축해나갈 수 있도록 지원하고 있다. 

 

지난해 시장조사기관 인터섹트360(Intersect360)가 진행한  HPC 사용자들의 CPU 인식에 대한 조사 결과에 따르면, 응답자 중 무려 78%가 AMD EPYC 프로세서에 대한 선호도를 나타냈으며, 이는 2016년 조사에서 밝혀졌던 선호도(36%)의 두 배를 상회하는 수치다. 2021년 조사 결과에 따르면, HPC 기관 관계자 중 23%가 AMD EPYC 프로세서로 시스템을 구동하고 있다고 답했으며, 47%는 현재 테스트를 진행 중이거나 부분적으로 사용하고 있다고 응답했다. 

 

AMD 솔루션을 채택한 최신 HPC 시스템은 아래와 같다:

  • 불가리아 아토스 불세쿼나 XH2000 불가리아 유로HPC 슈퍼컴퓨터(EuroHPC Atos BullSequana XH2000 supercomputer): AMD EPYC 프로세서를 탑재하여 생물정보학, 약학, 인공지능(AI), 기상학 등 과학 기술 개발을 지원한다.
  • 케임브리지 대학교(The University of Cambridge): 케임브리지 데이터 기반 탐색 서비스 시스템(Cambridge Service for Data Driven Discovery system, CSD3)은 3세대 AMD EPYC 프로세서를 탑재한 델 EMC 파워엣지 XE8545 (Dell EMC PowerEdge XE8545) 서버를 기반으로 작동한다.
  • 더럼 대학교(Durham University): 2세대 및 3세대 AMD EPYC 프로세서를 탑재한 델 파워엣지 C6525 서버를 기반으로 COSMA8 슈퍼컴퓨터를 구동한다.
  • 영국 기상청 마이크로소프트 애저 컴퓨터(microsoft Azure supercomputers for UK Met office): 3세대 AMD EPYC 프로세서 탑재 마이크로소프트 애저 슈퍼컴퓨터와 차세대 AMD EPYC 프로세서 기반 HPE 크레이 EX(HPE Cray EX) 슈퍼컴퓨터가 제공하는 60 페타플롭스의 성능으로 날씨 및 기후 연구를 진행한다.
  • 국립 기상 연구센터(National Center for Atmospheric Research): 3세대 AMD EPYC 프로세서를 탑재한 슈퍼컴퓨터와 HPE 크레이 EX 슈퍼컴퓨터를 통해 지질 과학 등 첨단 연구를 지원한다.
  • 펄머터(Perlmutter) 슈퍼컴퓨터: 미국 국립 에너지 연구 과학 컴퓨팅 센터(NERSC) 및 로렌스 버클리 국립 연구소(Lawrence Berkeley National Laboratory) 소재 슈퍼컴퓨터로, HPE 크레이 EX에 3세대 AMD EPYC 프로세서 기반 노드를 탑재하여 NERSC에서 사용 가능한 컴퓨팅 파워를 4배 향상시킨다.
  • 싱가포르 국립 슈퍼컴퓨팅 센터(National Supercomputing Centre, NSCC): 3세대 AMD EPYC를 탑재한 HPE 설계 슈퍼컴퓨터로 최대 10 페타플롭스의 성능을 지원할 것으로 기대된다. 

 

AMD ROCm 소프트웨어 업데이트

AMD는 과학자, 연구진 및 여러 석학들에게 AMD 인스팅트 엑셀러레이터에서 향상된 코드 성능을 제공하는 AIER 이니셔티브를 발표했다. 회원들을 대상으로 솔루션을 제공하는 AIER 이니셔티브는 AMD 인스팅트 기술, AMD ROCm 러닝 센터(ROCm Learning Center), 그리고 ROCm 소프트웨어에 대한 원격 엑세스를 제공하며, AMD 소프트웨어 및 하드웨어 솔루션에 대한 기술 가이드도 제공한다. AIER  솔루션 파트너에는 지역별 파트너뿐만 아니라 델 테크놀로지스(Dell Technologies), 기가바이트(Gigabyte), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise) 및 슈퍼마이크로(Supermicro) 등 글로벌 파트너 또한 포함되어 있다. 

 

ROCm 오픈 소프트웨어 플랫폼은 애플리케이션, 서드 파티 라이브러리 및 프레임워크 등 AMD 엑셀러레이터를 지원하는 여러 솔루션에 적용되어 호환성 및 모멘텀을 확장 중이다. HPC 커뮤니티는 그로맥스(Gromacs), 텐서플로우(TensorFlow), 그리드툴(GridTools) 등 개발자가 AMD GPU 가속을 위한 코드를 생성하고 적용하는 이기종 프로그래밍 모델(heterogenous programming model) HIP를 채택한 바 있다. 

 

ROCm 전용 파이토치(PyTorch)는 현재 설치형 파이썬(Python) 패키지로 제공되며 AMD의 MIOpen와 RCCL(커뮤니케이션) 라이브러리 기반의 혼합 정밀 및 대규모 교육 기능 전체를 포함한다. 이러한 혁신적인 솔루션은 데이터 과학자, 연구진, 학생, 커뮤니티 등 여러 사용자가 AMD GPU로 가속화된 파이토치를 사용할 수 있도록 지원한다. 최근에는 파이썬의 오픈 소스 어레이(open-source array) 라이브러리인 CuPy가 GPU 가속 컴퓨팅을 위한 ROCM 스택을 지원하는 버전 9.0을 출시하며 기존의 GPU 지원을 확대했다. 

 

연구 발전에 대한 기여

AMD는 2020년 COVID-19 연구를 위한 HPC 펀드(HPC Fund for COVID-19 research)를 출범하고, 팬데믹 대응 연구에 매진하고 있는 연구진들에게 AMD EPYC 및 AMD 인스팅트 엑셀러레이터를 기반으로 페타플롭스 규모의 컴퓨팅 성능을 지원하는 시스템을 기증했다. AMD는 현재까지 매사추세츠 공과대학교(MIT), 뉴욕 대학교(NYU), 라이스 대학교(Rice University), 텍사스 대학교 오스틴 캠퍼스(University of Texas at Austin), 토론토 대학교(University of Toronto) 등 7개국에 위치한 23개 연구 기관에 HPC 솔루션을 제공하고 총 12 페타플롭스 이상의 성능을 지원했다. 

 

피터 로스키(Peter Rossky) 라이스 대학교 와이스 자연 과학 대학(Wiess School of Natural Sciences) 교수는 “AMD의 CPU와 GPU는 교내 이론 생물물리학 센터(Center for Theoretical Biological Physics)가 진행하는 COVID-19 대응 연구, 게놈 아키텍처 분석 등 여러 연구 활동의 속도를 약 1,000배에서 10,000배까지 향상했다”며 “염색체 하나 당 소요되는 분석 시간을 수개월에서 20분까지 단축했으며, 향후 해당 솔루션을 도입하는 연구진들이 빠르게 늘어날 것으로 예상한다”고 전했다. 

 

AMD의 HPC 솔루션 관련 보다 자세한 사항은 ISC 21에 마련된 AMD 가상 부스에서 확인할 수 있다.

그래픽 / 영상
많이 본 뉴스