엔비디아, MLPerf HPC 벤치마크서 최고의 AI 성능 입증
2021년 11월 23일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

엔비디아(www.nvidia.co.kr, CEO 젠슨 황) 기반 시스템이 고성능컴퓨팅(HPC) 과학 애플리케이션에 대한 AI 성능에 대한 업계 벤치마크인 MLPerf HPC 1.0의 5개 테스트 중 4개에서 우위를 차지했다.

 

d80d7e0f866f3155634bbafe1cf6b112_1637607389_5861.jpg

<엔비디아는 모델 훈련 속도와 칩당 효율성에서 최고의 결과를 보여줬다> 

 

MLPerf는 2018년 5월에 처음 출시된 딥러닝에 대한 업계 공인 벤치마크 테스트이다. MLPerf HPC에서는 AI를 사용하여 슈퍼컴퓨터에서 시뮬레이션을 가속화하고 강화하는 컴퓨팅 스타일을 중점적으로 다룬다. 최근 과학 및 산업 분야의 사용자들은 엑사스케일 AI의 채택을 통해 분자 역학, 천문학 및 기후 시뮬레이션에서 HPC와 AI로 과학적 혁신을 이루고 있다. 

 

MLPerf HPC 1.0은 HPC 센터에 대한 세 가지 일반적인 워크로드에서 AI 모델의 훈련을 측정했다:

  • 코스모플로우(CosmoFlow)로 망원경의 이미지에 있는 물체의 세부 정보를 추정
  • 딥캠(DeepCAM)으로 기후 데이터에서 허리케인과 대기의 강(atmospheric river) 탐지를 테스트
  • 오픈 카탈리스트(OpenCatalyst)로 시스템이 분자 내 원자 간의 힘을 얼마나 잘 예측하는지 추적 

 

각 테스트는 시스템이 모델을 얼마나 빨리 훈련시키는지 측정하는 강력 스케일링(Strong Scaling)과 이에 상응하는 최대 시스템 처리량, 즉 주어진 시간에 시스템이 훈련할 수 있는 모델 수를 측정하는 약 스케일링(Weak Scaling)의 두 부문으로 구성되었다. 

 

엔비디아는 작년 MLPerf 0.7 라운드에 비해 5배 더 향상된 코스모플로우 성과를 냈다. 딥캠 테스트에서는 대략 7배 나아진 성능을 보였다. 로렌스 버클리 국립 연구소(Lawrence Berkeley National Lab)의 펄머터 페이즈1(Perlmutter Phase 1) 시스템은 6,144개의 엔비디아 A100 텐서코어 GPU 중 512개를 사용하여 오픈카탈리스트 테스트 내의 강력 스케일링 부문에서 우위를 뽐냈다. 

 

또한, 약 스케일링 부문에서는 작업당 16개의 노드와 256개의 동시 작업을 사용하여 딥캠 테스트를 주도하였다. 모든 테스트는 사내 시스템이자 엔비디아의 세계 최대 산업용 슈퍼컴퓨터인 엔비디아 셀린(Selene)에서 실행되었다. 

 

MLPerf의 최신 결과는 엔비디아 AI 플랫폼과 성능 리더십의 또 다른 차원을 보여준다. 엔비디아는 데이터센터, 클라우드 및 네트워크 엣지에서 AI 교육 및 추론을 포괄하는 MLPerf 벤치마크에서 8년 연속 최고 점수를 달성하였다. 

 

광범위한 생태계

이 라운드에 참가한 조직 8개 중 7곳이 엔비디아 GPU를 사용한 결과를 제출하였다. 이는 독일의 율리히 슈퍼컴퓨팅 센터(Jülich Supercomputing Center), 스위스 국립 슈퍼컴퓨팅 센터(Swiss National Supercomputing Center), 미국의 아르곤 및 로렌스 버클리 국립 연구소(Argonne and Lawrence Berkeley National Laboratories), 슈퍼컴퓨팅 애플리케이션 국립 센터(National Center for Supercomputing Applications) 및 텍사스 고급 컴퓨팅 센터(Texas Advanced Computing Center)를 포함한다. 

 

율리히 슈퍼컴퓨팅 센터(Jülich Supercomputing Center)의 토마스 리퍼트(Thomas Lippert) 이사는 "벤치마크 테스트를 통해 우리 기계가 실제로 잠재력을 발휘할 수 있고 AI와 관련하여 유럽이 계속 우위를 점할 수 있다는 것을 보여주었다"고 밝혔다. 

 

MLPerf 벤치마크는 알리바바, 구글, 인텔, 메타(구 페이스북), 엔비디아 등이 이끄는 산업 그룹인 ML커먼스(MLCommons)에서 주최하고 있다. 

 

이번 결과는 전체 소프트웨어 스택을 포함하는 완성된 엔비디아 AI 플랫폼을 통해 달성했다. MLPerf에서 엔비디아는 데이터 처리를 가속화하는 엔비디아 달리(DALI) 및 최대 1,024개 이상의 GPU를 효율적으로 확장하고, 소규모 배치 지연을 줄이기 위한 쿠다(CUDA) 그래프과 같은 기술로 모든 사람이 이용할 수 있도록 코드를 조정했다. 

 

또한 엔비디아 매그넘IO(MagnumIO)의 핵심 구성 요소인 엔비디아 샤프(SHARP)도 적용되었는데, 이는 네트워크 내 컴퓨팅을 제공하여 통신을 가속화하고 엔비디아 퀀텀 인피니밴드(Quantum InfiniBand) 스위치로 데이터 작업을 오프로드 할 수 있게 해준다. 

 

제출에 사용한 모든 소프트웨어는 MLPerf 저장소에서 이용 가능하다. 엔비디아는 사전 훈련된 AI 모델, 산업 애플리케이션 프레임워크, GPU 애플리케이션 및 기타 소프트웨어 리소스를 위한 소프트웨어 허브인 NGC 카탈로그에 이러한 코드를 정기적으로 추가하고 있다. 

그래픽 / 영상
많이 본 뉴스