엔비디아, DPU로 인네트워크 컴퓨팅의 미래 개척
2022년 06월 03일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기
c7c45c8f5f202140d89e86f10ddec622_1654193846_0792.jpg
 

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 아시아, 유럽, 미국 등의 슈퍼컴퓨팅 센터가 엔비디아 퀀텀 인피니밴드(NVIDIA Quantum InfiniBand) 네트워크에서 엔비디아 블루필드(BlueField) DPU를 통해 가속 컴퓨팅을 한 단계 끌어올린다고 발표했다. 


미국 로스 알라모스 국립연구소(Los Alamos National Laboratory, LANL)에서 NVIDIA와의 다년간 광범위한 협업의 한 부분으로, 전산 다중물리(Computational Multi-Physics) 애플리케이션의 30배 속도를 목표로 한다. LANL 연구원들은 엔비디아 퀀텀 인피니밴드(NVIDIA Quantum InfiniBand) 네트워크에서 실행되는 데이터 처리 장치(DPU)를 사용하여 엄청난 성능 향상을 예상하고 있다. 이들은 BlueField 및 NVIDIA DOCA 소프트웨어 프레임워크를 사용한 컴퓨팅 스토리지, 패턴 매칭 등의 기술을 개척할 것이다. 


이러한 노력을 통해 누구나 DPU를 활용하는 데 사용할 수 있는 애플리케이션 인터페이스인 OpenSNAPI를 정의할 수 있다. 이는 유니파이드 커뮤니케이션 프레임워크(Unified Communication Framework)의 프로젝트이다. 유니파이드 커뮤니케이션 프레임워크는 Arm, IBM, 엔비디아, 미국 국립 연구소(U.S. national labs) 및 미국 대학들을 포함한 HPC 애플리케이션을 위한 이기종 컴퓨팅(heterogeneous computing)을 가능하게 하는 컨소시엄이다. 


엑셀러레이티드 박스 오브 플래시(Accelerated Box of Flash, ABoF)는 솔리드 스테이트(solid state) 스토리지, DPU, 인피니밴드 가속기를 결합하여 리눅스(Linux) 파일 시스템의 성능에 중요한 부분을 가속화하는데 도움을 준다. 유사한 스토리지 시스템보다 최대 30배 더욱 빠르며, LANL 인프라의 핵심 구성 요소가 될 예정이다. 


미국 텍사스 첨단 컴퓨팅 센터(Texas Advanced Computing Center, TACC)는 델 파워엣지(Dell PowerEdge) 서버에 블루필드-2를 최근에 채택했다. 이는 인피니밴드 네트워크의 DPU를 사용하여 론스타6(Lonestar) 시스템을 클라우드 네이티브 슈퍼컴퓨팅을 위한 개발 플랫폼으로 만들 예정이다. 


미국 오하이오 주립 대학(Ohio State University)의 연구원들은 DPU가 어떻게 HPC의 가장 인기 있는 프로그래밍 모델 중 하나를 최대 21% 더 빠르게 실행할 수 있는지를 보여줬다. 메시지 전달 인터페이스(MPI)의 중요 부분을 오프로드하여, 많은 대규모 HPC 시뮬레이션에 사용되는 라이브러리인 P3DFFT를 가속화했다. 


유럽의 여러 연구팀이 블루필드DPU를 사용해 MPI 및 기타 HPC 워크로드를 가속화하고 있다. 예를 들면 영국 북부의 더럼 대학(Durham University)은 16노드의 델 파워엣지 클러스터에서 블루필드 DPU를 사용하여 MPI 작업의 로드 밸런싱을 위한 소프트웨어를 개발하고 있다. 케임브리지, 런던 및 뮌헨의 연구원들도 DPU를 사용하고 있다. 유니버시티 칼리지 런던(University College London)은 블루필드-2 DPU에서 호스트 시스템의 작업을 예약하는 방법을 연구하고 있다. 예를 들면 호스트 프로세서 간에 데이터를 이동하여 필요할 때 사용할 수 있는 기능이다. 


뮌헨 공과대학(Technical University of Munich)의 컴퓨터 아키텍처 및 병렬 시스템 그룹의 연구원들은 EuroHPC 프로젝트의 일부로 DPU를 사용해 MPI 및 운영 체제 작업을 오프로드하는 방법을 모색하고 있다. 미국 조지아텍(Georgia Tech)의 연구원들은 블루필드-2 DPU를 사용하여 분자 역학 연구를 가속화하기 위해 샌디아 국립연구소(Sandia National Laboratory)와 협력하고 있다. 지금까지의 이들의 연구를 설명하는 논문은 알고리즘이 시뮬레이션의 정확성을 잃지 않고 최대 20%까지 가속될 수 있다는 것을 보여준다.

그래픽 / 영상
많이 본 뉴스