
엔비디아(www.nvidia.co.kr )가 생성형 AI를 통해 HPC(고성능 컴퓨팅) 작업을 가속화하며 코드 생성, 기상, 유전학, 재료 과학 분야의 연구를 지원하고 있다고 밝혔다.
샌디아 국립 연구소(Sandia National Laboratories)는 세계 최대 규모의 슈퍼컴퓨터에서 사용하도록 설계된 병렬 프로그래밍 언어인 코코스(Kokkos)로 코드를 자동으로 생성하는 야심찬 시도를 하고 있다. 여러 국립 연구소의 연구진들이 개발한 이 특수 언어는 수만 대의 프로세서에서 작업을 수행하는 데 필요한 미묘한 부분까지도 처리할 수 있다. 샌디아 국립 연구소의 연구진들은 검색 증강 생성(retrieval-augmented generation, RAG)을 사용해 코코스 데이터베이스를 생성하고 AI 모델과 연결하고 있다. 이들은 다양한 RAG 접근 방식을 실험하면서 초기 테스트에서 긍정적인 결과를 보여주고 있다.
기후 변화에 대한 선제적 대응
일기 예보 분야의 연구원과 기업들은 기상, 기후 연구를 위한 서비스와 소프트웨어 세트인 엔비디아 어스-2(Earth-2)의 생성형 AI 모델인 코디프(CorrDiff)를 채택하고 있다. 코디프는 기존 대기 모델의 25km 해상도를 2km까지 조정할 수 있다. 또한, 결합할 수 있는 예측 수를 100배 이상 확장해 예측 신뢰도를 향상시킬 수 있다.
미국 버지니아주 비엔나에 위치한 스파이어(Spire)는 자체 소형 위성 네트워크에서 데이터를 수집하는 기업이다. 스파이어의 머신러닝과 모델링 책임자인 톰 고완(Tom Gowan)은 “이는 유망한 혁신이다. 우리는 이러한 모델을 글로벌과 지역 AI 예보에 활용해 더욱 풍부한 인사이트를 제공할 계획이다”라고 말했다.
의료 서비스 개선을 위한 유전자 생성
아르곤 국립 연구소(Argonne National Laboratory)의 과학자들은 이 기술을 사용해 코로나19의 원인이 되는 바이러스를 더 잘 이해하도록 돕는 유전자 염기서열을 생성하고 있다. 수상 이력까지 있는 GenSLM 모델은 실제 SARS-CoV-2 변종과 매우 유사한 시뮬레이션을 생성했다.
아르곤 국립 연구소의 수석 연구원인 아르빈드 라마나단(Arvind Ramanathan)은 블로그에서 “게놈의 여러 부분이 어떻게 공진화하는지 이해하면 바이러스가 새로운 취약성이나 새로운 형태의 저항성을 개발할 수 있는 단서를 얻을 수 있다”고 전했다.
GenSLM은 엔비디아 A100 텐서 코어(Tensor Core) GPU 기반 슈퍼컴퓨터를 통해 1억 1천만 개 이상의 게놈 서열을 훈련했다. 이러한 슈퍼컴퓨터에는 아르곤 국립 연구소의 폴라리스 시스템(Polaris system), 미국 에너지부(U.S. Department of Energy)의 펄머터(Perlmutter), 엔비디아의 셀레네(Selene) 등이 있다.
신소재를 제안하는 마이크로소프트
마이크로소프트 연구는 생성형 AI가 재료 과학 분야의 작업을 가속화하는 방법을 보여준다. 마이크로소프트의 매터젠(MatterGen) 모델은 원하는 특성을 나타내는 새롭고 안정적인 물질을 생성한다. 이 접근 방식을 통해 화학, 자기, 전자, 기계 등의 기타 원하는 특성을 지정할 수 있다. 마이크로소프트 연구팀은 엔비디아 A100 GPU를 사용해 애저(Azure) AI 인프라에서 매터젠을 훈련했다. 그들은 “우리는 매터젠이 재료 설계를 위한 AI의 중요한 진전이라고 생각한다”고 말했다. 카본3D(Carbon3D)와 같은 기업들은 이미 상업용 3D 프린팅 작업에서 재료 과학에 생성형 AI를 적용하며 기회를 찾고 있다.
이는 연구자들이 생성형 AI를 통해 HPC와 과학 분야에서 할 수 있는 일의 시작에 불과하다. 현재 사용 가능한 엔비디아 H200 텐서 코어 GPU와 곧 출시될 엔비디아 블랙웰(Blackwell) 아키텍처 GPU는 새로운 차원의 작업을 실현시킬 것으로 기대된다.