엔비디아 가속 컴퓨팅 및 AI 플랫폼, 코로나19 및 과학 발전 연구에 활용
2021년 11월 18일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

467852ed0c02164bf1ee268f24035228_1637175378_831.jpg


엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 자사의 가속 컴퓨팅 및 AI 플랫폼을 사용한 4개 연구팀이 코로나19 관련 연구를 통해 고든 벨(Gordon Bell) 상과 특별상의 최종 후보자로 선정됐다고 밝혔다. 

 

각 팀은 10억 개 원자에 대한 2개의 시뮬레이션, 제2형 중증급성호흡기증후군 코로나바이러스(SARS-CoV-2)의 작동 원리에 대한 두 건의 새로운 발견 및 신약 발견 속도를 높이는 최신 AI 모델 등 다양한 성과에 엔비디아의 AI 및 가속 컴퓨팅을 사용했다. 

 

코로나19 연구 관련 특별상 최종 후보자는 AI를 통해 여러 시뮬레이션을 연계하여 바이러스가 숙주 내에서 복제되는 방식을 고도의 정확성으로 증명했다. 

 

아르곤 국립연구소(Argonne National Laboratory)의 계산 생물학자인 아르빈드 라마나단(Arvind Ramanathan)이 이끄는 해당 연구는 단백질 구조를 연구하는 데 사용되던 툴의 해상도를 높이는 방법을 제시한다. 이는 바이러스 확산을 막는 방법에 대한 새로운 정보를 제공할 수 있다. 

 

미국과 영국에 위치한 십여 곳의 기관에서 파견된 이 연구팀은 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise)가 구축한 엔비디아 A100 구동 시스템인 펄머터(Perlmutter)와 아르곤 국립연구소의 엔비디아 DGX A100 시스템 등에서 실행되는 워크플로우를 설계했다. 

 

논문을 통해 연구팀은 “통합 생물학 분야에서 멀티사이트 데이터 분석과 시뮬레이션을 수행할 수 있다면 현재로서 전송하기 힘든 대규모 실험 데이터를 활용하는 데 매우 유용할 것"이라고 설명했다. 

 

연구팀은 연구의 일환으로 GPU에서 인기 있는 NAMD 프로그램을 사용해 분자 역학 연구를 가속화하는 기술을 개발했다. 또한, 엔비디아 NV링크(NVLink)를 활용해 “기존 HPC 네트워크 인터커넥트 또는 PCIe 전송이 제공했던 속도 이상으로 데이터 속도를 높였다”고 전했다. 

 

높은 충실도로 시뮬레이션 되는 10억 개의 원자

사우스 플로리다 대학(University of South Florida) 물리학 교수인 이반 올리닉(Ivan Oleynik)이 이끄는 연구팀은 최초로 10억 개의 원자를 매우 정확한 시뮬레이션으로 만든 공로로 고든 벨 상의 최종 후보자로 지명됐다. 연구팀은 작년 고든 벨 우승자보다 23배 높은 정확도로 기록을 갱신했다. 

 

이반 올리닉은 "전에는 볼 수 없었던 현상을 발견하게 되어 매우 기쁘며, 정말 큰 성과를 내게 되어 자랑스럽다"라고 소감을 전했다. 

 

극한의 온도와 압력 조건에서 실행된 탄소 원자에 대한 시뮬레이션은 새로운 에너지원을 개발하는 기회를 열어줄 뿐만 아니라 멀리 있는 행성의 구성을 밝히는 데 도움을 줄 수 있다. 더불어, 이번 시뮬레이션은 양자 수준의 정확도로 원자 간의 힘을 보여주었다는 점에서 주목할 만하다. 

 

이반 올리닉은 "이러한 정확도는 강력한 GPU 슈퍼컴퓨터에 머신 러닝 기술을 적용해야만 나올 수 있는 결과이다. AI는 과학 분야에 혁명을 가져오고 있다"고 말했다. 

 

이반 올리닉 연구팀은 세계에서 가장 강력한 슈퍼컴퓨터 중 하나이자 IBM이 구축한 미국 에너지부 서밋(Summit) 슈퍼컴퓨터에서 4,608개의 IBM 파워(Power) AC922 서버와 27,900개의 엔비디아 GPU를 사용했다. 이는 연구팀의 코드가 거의 100% 효율로 200억개 이상의 원자를 시뮬레이션할 수 있다는 것을 입증했다. 

 

해당 코드는 재료 과학의 지평을 넓이고자 하는 연구자라면 누구나 사용할 수 있다. 

 

치명적인 비말의 내부 분석

10억 개의 원자 시뮬레이션을 통한 코로나19 관련 연구로 두 번째 최종후보자로 선정된 또 다른 연구팀은 공중에 떠있는 비말(droplet)의 델타 변형을 증명했다. 이를 통해 에어로졸을 최초로 원자 수준으로 분석하며, 코로나19와 그 외 질병을 확산하는 생물학적 원인을 밝혔다. 

 

특별상 부분의 작년 우승자인 캘리포니아 샌디에이고 대학(University of California San Diego) 연구원 롬미 아마로(Rommie Amaro)가 이끄는 연구팀 논문에 따르면, 이 연구는 "폐의 깊숙한 내부에서 바이러스 결합과 공기 중에 떠다니는 다른 병원균에 대한 연구에 큰 의의를 준다"고 설명한다.

 

467852ed0c02164bf1ee268f24035228_1637175346_2133.jpg

<롬미 아마로 연구팀은 10억 개 이상의 원자가 담긴 호흡기 비말에 있는 SARS-CoV-2를 시뮬레이션했다.> 

 

롬미 아마로는 "이번 연구는 고성능컴퓨팅(HPC)과 다양한 수준에서 결합된 AI가 어떻게 성능을 효과적으로 크게 향상시켜 복잡한 생물학적 시스템을 이해하고 분석할 수 있는 지 입증한다"고 말했다. 

 

연구원들은 델 테크놀로지스(Dell Technologies)가 텍사스 첨단 컴퓨팅센터(Texas Advanced Computing Center)와 오라클 클라우드 인프라(OCI, Oracle Cloud Infrastructure)의 상용 시스템을 위해 구축한 슈퍼 컴퓨터인 서밋의 엔비디아 GPU를 사용했다. 

 

연구팀은 "고성능 컴퓨팅과 클라우드 리소스를 사용하면 핵심적인 과학 문제를 해결하기 위한 시간을 크게 단축하는 것은 물론 연구자들 간에 연결되고 복잡한 협업을 매우 효율적으로 개선할 수 있다"고 강조했다. 

 

신약 발견을 지원하는 엔비디아 기술

오크리지 국립연구소(Oak Ridge National Laboratory)의 코로나19관련 연구 상 최종 후보자는 신약 개발을 위한 화학 화합물 선별에 자연어 처리(NLP)를 적용했다. 

 

해당 연구팀은 지금까지 이 작업에 적용된 가장 큰 데이터 세트인 분자 96억개를 포함한 데이터 세트를 사용해 신약 발견 속도를 높이는 버트(BERT) NLP 모델을 단 2시간 만에 훈련시켰다. 기존에 분자 11억개의 데이터 세트로 모델을 훈련시키는데 가장 빨랐던 작업시간은 4일이었다. 

 

이번 연구는 뛰어난 603페타플롭의 성능을 내기 위해 서밋 슈퍼컴퓨터에서 24,000개 이상의 엔비디아 GPU를 사용했다. 현재 훈련 작업이 완료됐으며, 해당 모델은 단일 GPU에서 실행되면서 연구원들이 코로나19와 그 외 질병을 억제할 수 있는 화학 화합물을 찾는 데 기여하고 있다. 

 

오크리지 국립연구소의 계산 과학자 옌스 글레이저(Jens Glaser)는 "이 모델을 암 질병 신호 경로에 적용하고 싶어하는 협업자들이 있다”고 전했다. 

 

연구를 이끈 과학 연구원 앤드류 블랑카드(Andrew Blanchard)는 "이 정도 규모의 데이터 훈련은 이제 시작에 불과하며, 머지않아 분자 1조 개를 활용할 수 있기를 기대한다"고 말했다. 

 

풀-스택 솔루션 활용

AI와 가속 컴퓨팅을 위한 엔비디아 소프트웨어 라이브러리는 연구팀이 매우 신속하게 연구작업을 완료하도록 지원한다. 

 

옌스 글레이저는 "전문 코드 없이도 표준 스택을 사용할 수 있었기에 우리는 GPU의 텐서 코어(tensor cores)를 위해 작업을 완전히 최적화할 필요가 없었다"고 설명했다.

 

옌스 글레이저를 비롯한 여러 최종 후보자들은 이번 성과를 통해 "인간의 삶에 영향력을 줄 수 있는 의미 있는 연구를 할 기회를 갖는 것은 과학자로서 매우 감동스러운 일"이라고 소감을 전했다.

그래픽 / 영상
많이 본 뉴스