엔비디아, 네모트론·코스모스 추론 모델 확장으로 AI 에이전트 혁신 가속
2025년 08월 14일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기
2032a89b65012423dfb2730088ebe0d2_1755109657_4925.jpg
 

엔비디아(www.nvidia.co.kr )가 글로벌 최대 컴퓨터 그래픽 콘퍼런스인 시그라프(SIGGRAPH)에서 추론 기능을 갖춘 2개의 모델 제품군인 엔비디아 네모트론(NVIDIA Nemotron)과 엔비디아 코스모스(Cosmos)의 확장을 발표했다. 


캡제미니(Capgemini)에 따르면 AI 에이전트는 2028년까지 매출 증가와 비용 절감을 통해 최대 4,500억 달러의 가치를 창출할 것으로 예상된다. 이러한 에이전트를 개발하는 개발자들은 AI 에이전트 플랫폼과 피지컬 AI 시스템을 개선하기 위해 성능이 더 우수한 추론 모델을 활용하고 있다. 


업계 선도 기업들은 AI 에이전트와 휴머노이드 로봇을 통해 생산성을 높이는 데 엔비디아의 확장된 모델 제품군을 활용하고 있다. 크라우드스트라이크(CrowdStrike), 우버(Uber), 마그나(Magna), 넷앱(NetApp), 줌(Zoom)이 그 대표적인 기업들이다. 


새로운 엔비디아 네모트론 나노 2(Nemotron Nano 2)와 라마 네모트론 슈퍼 1.5(Llama Nemotron Super 1.5) 모델은 과학적 추론, 수학, 코딩, 툴 호출, 명령어 준수, 채팅 분야에서 해당 크기 범주 내 최고 정확도를 제공한다. 이 새로운 모델은 AI 에이전트가 더 깊이 생각하고 효율적으로 작업할 수 있도록 지원한다. 이를 통해 더 폭넓은 옵션을 탐색하고, 연구 속도를 높이며, 설정된 시간 내에서 더 우수한 결과를 제공한다. 


모델은 AI 에이전트의 두뇌와 같다. 핵심 지능을 제공하는 것이다. 그러나 이 두뇌가 비즈니스에 유용하려면 특정 워크플로우뿐 아니라 산업과 비즈니스 용어를 파악하고 안전하게 작동하는 에이전트에 탑재돼야 한다. 엔비디아는 선도적인 라이브러리와 AI 블루프린트(AI Blueprint)를 제공해 기업이 AI 에이전트를 대규모로 도입하고 맞춤화하며 관리할 수 있도록 지원한다. 


코스모스 리즌(Cosmos Reason)은 피지컬 AI 애플리케이션을 위해 개발된 새로운 추론 비전 언어 모델(vision language model, VLM)이다. 이는 구조화된 추론을 통해 물리학, 객체 영속성, 시공간 정렬과 같은 개념을 이해하는 데 탁월하다. 


코스모스 리즌은 로봇 비전언어행동(vision language action, VLA) 모델의 추론 기반 구조로 설계됐으며, 로보틱스와 자율주행 차량을 위한 훈련 데이터의 평가와 캡션 생성에 활용된다. 또한 공장이나 도시와 같은 환경에서 물리적 작업에 대한 시공간 이해와 추론 능력을 런타임 시각 AI 에이전트에 제공한다. 


엔비디아 네모트론은 선도적인 모델과 엔비디아가 선별한 오픈 데이터세트 그리고 첨단 AI 기술을 활용해 AI 에이전트에 정확하고 효율적인 출발점을 제공하는 고급 오픈 추론 모델 제품군이다. 최신 네모트론 모델은 세 가지 방식으로 업계 최고의 효율성을 제공한다. 새로운 하이브리드 모델 아키텍처, 소형 양자화 모델 그리고 토큰 생성 과정을 개발자가 제어할 수 있는 구성 가능한 사고 예산(thinking budget)이다. 이를 통해 추론 비용을 약 60% 절감할 수 있다. 이 조합은 모델이 더 깊이 추론하고 더 빠르게 응답할 수 있도록 하며, 추가적인 시간이나 컴퓨팅 파워를 요구하지 않는다. 즉, 더 낮은 비용으로 더 나은 결과를 제공하는 것이다. 네모트론 나노 2는 동급의 다른 주요 모델 대비 최대 6배 높은 토큰 생성 성능을 제공한다. 


라마 네모트론 슈퍼 1.5는 동급 최고 성능과 가장 높은 추론 정확도를 달성해, AI 에이전트가 더 뛰어난 추론을 수행하고, 더 현명한 결정을 내리며, 복잡한 작업을 독립적으로 처리할 수 있도록 한다. 현재 NVFP4(4비트 부동소수점) 버전으로 제공되며, 엔비디아 B200 GPU에서 엔비디아 H100 GPU 대비 최대 6배 높은 처리량을 제공한다. 


두 개의 새로운 네모트론 모델과 함께 엔비디아는 첫 번째 오픈 VLM 훈련 데이터세트인 라마 네모트론 VLM 데이터셋 v1도 발표했다. 이 데이터세트는 광학 문자 인식, 시각적 질의응답, 캡션 데이터 등 300만 개의 샘플을 포함하며, 이전에 공개된 라마 3.1 네모트론 나노 VL 8B 모델을 구동하는 데 사용된다.

핫 뉴스
많이 본 뉴스