엔비디아, 페타스케일급 워크그룹 서버
‘DGX 스테이션 A100’ 발표
2020년 11월 18일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

8ad136dd7923dd9d40a3ffd81876f829_1605653025_295.jpg


엔비디아(www.nvidia.co.kr , CEO 젠슨 황)는 세계 유일의 페타스케일급 워크그룹 서버 엔비디아 DGX 스테이션 A100(DGX Station A100)을 발표했다. 혁신적인 2세대 인공지능(AI) 시스템인 DGX 스테이션 A100은 기업 사무실, 연구시설은 물론, 가정에서 근무하는 직원들의 까다로운 머신러닝(ML) 및 데이터 사이언스 워크로드를 가속화하도록 설계됐다. 

 

2.5페타플롭스(PF)의 AI 성능을 제공하는 DGX 스테이션 A100은 엔비디아 NV링크(NVLink)로 완전히 상호 연결된 4개의 최신 엔비디아 A100 텐서 코어(Tensor Core) GPU를 탑재한 유일한 워크그룹 서버로, 최대 320GB의 GPU 메모리를 제공하여 기업의 데이터 사이언스 및 AI 혁신을 지원한다. 

 

엔비디아 DGX 스테이션 A100은 또한 엔비디아 멀티 인스턴스 GPU(MIG) 기술을 지원하는 유일한 워크그룹 서버이다. MIG 기술을 통해 단일 DGX 스테이션 A100은 최대 28개의 개별 GPU 인스턴스를 제공하여 시스템 성능에 영향을 미치지 않으면서 병렬 작업을 수행하고, 여러 사용자를 지원한다. 

 

엔비디아 DGX 시스템 총괄 부사장 찰리 보일(Charlie Boyle)은 "DGX 스테이션 A100은 어디에나 연결할 수 있는 서버급 시스템으로, 데이터센터에서 AI 성능을 제공한다. 데이터 사이언스 및 AI 연구진들은 엔비디아 DGX A100 시스템과 같은 소프트웨어 스택을 통해 개발부터 배포까지 이르는 광범위한 업무를 가속화할 수 있다”고 말했다. 

 

엔비디아 DGX 스테이션을 통한 AI 혁신

전세계 교육, 금융, 정부, 의료, 소매업 등 여러 산업에 걸친 주요 기업과 조직들이 AI 및 데이터 사이언스 혁신을 위해 엔비디아 DGX 스테이션을 도입하고 있다. 

 

●  BMW 그룹 프로덕션: 엔비디아 DGX 스테이션을 활용해 기업 운영을 개선하는 AI 모델을 개발 및 배포함에 있어 관련 인사이트를 더욱 신속하게 확보하고 있다.

 

●  독일 AI 연구센터(DFKI): 엔비디아 DGX 스테이션을 활용해 사회 및 산업 분야의 중요하고 다양한 과제를 해결하는 모델을 구축하고 있다. 이는 자연재해에 신속하게 대응하도록 하는 응급 서비스를 지원하는 컴퓨터 비전 시스템을 포함한다.

 

●  록히드마틴(Lockheed Martin): 엔비디아 DGX 스테이션을 통해 센서 데이터와 서비스 로그를 활용한 AI 모델을 개발했으며, 해당 모델은 생산 가동시간을 향상하고, 작업자의 안전을 높이며, 운영비를 절감하기 위한 유지보수 필요성을 예측하고 있다.

 

●  NTT도코모(NTT Docomo): 가입자 7천9백만 명 이상의 일본 대표 이동통신사인 NTT도코모는 엔비디아 DGX스테이션을 활용해 이미지 인식 솔루션 등 혁신적인 AI 기반 서비스를 개발하고 있다.

 

●  퍼시픽 노스웨스트 국립연구소(PNNL): 엔비디아 DGX 스테이션을 통해 국가안보를 지원하는 연방기금 연구를 실시하고 있다. PNNL은 에너지 회복탄력성 및 국가 보안 부문의 기술 혁신을 중점으로 과학적 발견, 에너지 회복탄력성, 화학, 지구 과학 및 데이터 애널리틱스를 담당하는 미국의 선도적인 HPC 센터이다. 

 

어느곳에서나 사용 가능한 AI 슈퍼컴퓨터

DGX 스테이션 A100은 데이터센터급 전력이나 쿨링을 요구하지 않지만, 엔비디아 DGX A100 데이터센터 시스템과 동일한 수준의 원격 관리 기능을 갖춘 서버급 시스템이다. 시스템 관리자는 데이터 사이언티스트와 연구자가 가정 및 연구실에서 작업할 때 원격 연결을 통해 모든 관리 작업을 쉽게 수행할 수 있다. 

 

DGX 스테이션 A100에는 80GB 또는 40GB의 엔비디아 A100 텐서 코어 GPU가 4개 탑재돼 있어 데이터 사이언스 및 AI 연구팀의 고유한 워크로드 및 예산에 맞춰 시스템을 선택할 수 있다. 

 

DGX 스테이션 A100은 BERT 라지 인퍼런스(BERT Large inference)와 같은 복잡한 대화형 AI 모델을 지원하기 위해 이전 세대 DGX 스테이션 대비 4배 이상 빠른 속도를 제공한다. 또한, BERT 라지 AI 훈련에 있어 약 3배 향상된 성능을 제공한다. 

 

두 배로 높아진 GPU 메모리 

향상된 데이터센터 워크로드를 지원하기 위해 DGX A100 시스템은 새로운 엔비디아 A100 80GB GPU를 탑재한다. 이를 통해 GPU 메모리 용량을 시스템당 두 배인 640GB으로 늘려 대규모의 데이터셋과 모델을 통해 정확성을 높일 수 있다. 

 

새로운 엔비디아 DGX A100 640GB 시스템은 엔터프라이즈용 엔비디아 DGX 슈퍼POD(SuperPOD) 솔루션에도 통합될 수 있다. 조직들은 20개의 DGX A100 시스템 유닛으로 제공되는 턴키 방식의 AI 슈퍼컴퓨터를 통해 대규모 AI 모델을 구축하고 교육 및 배포할 수 있다. 

 

DGX A100 640GB가 탑재된 DGX 슈퍼POD 시스템은 영국의 헬스케어 연구 발전을 위한 케임브리지-1 슈퍼컴퓨터와 미 플로리다 주 전역에서 AI를 통한 다양한 발견을 지원하는 플로리다 주립대학교의 하이퍼게이터(HiPerGator) AI 슈퍼컴퓨터에 최초로 도입됐다.

그래픽 / 영상
많이 본 뉴스