엔비디아, 실시간 대화형 AI 지원하는 추론 소프트웨어 ‘텐서RT’ 최신 버전 공개
2019년 12월 20일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 실시간 대화형 AI를 지원하는 추론 소프트웨어의 최신 버전인 엔비디아 텐서RT 7(NVIDIA TensorRT 7)을 발표했다. 이는 전세계 개발자들이 대화형 AI 애플리케이션을 제공하는데 사용되어, 그간 인간과 AI간 상호작용에 걸림돌이 됐던 추론 레이턴시(지연시간)를 크게 개선할 것으로 기대된다.

 

엔비디아 텐서RT 7은 엔비디아의 7세대 추론 소프트웨어 개발 키트로, 보다 스마트한 인간과 AI간 상호작용을 가능케 해, 음성 에이전트(voice agent), 챗봇, 추천 엔진 등의 애플리케이션을 실시간으로 구현할 수 있게 됐다.

 

미국 시장조사기관 주니퍼 리서치(Juniper Research)에 따르면, 전세계 디바이스에서 약 32억5천만 개의 디지털 음성 비서가 사용되고 있는 것으로 추정된다. 2023년까지 그 숫자가 세계 총 인구 수를 뛰어 넘는 80억 개까지 증가할 것으로 예상된다.

 

텐서RT 7은 AI 음성 애플리케이션을 구현하는데 필요한 트랜스포머(transformer) 기반 RNN(Recurrent Neural Network, 순환신경망)을 자동으로 최적화하고 가속화하도록 설계된 최신 딥 러닝 컴파일러를 제공한다. 이를 통해, 대화형 AI의 구성요소가 CPU에서 실행될 때 보다 10배 이상 빨라진다. 동시에, 지연시간은 실시간 상호작용에 필요한 수준인 300 밀리 초 임계값 미만으로 단축된다.

 

엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 GTC 차이나 기조연설에서 “우리는 기계가 인간의 언어를 실시간으로 이해할 수 있게 된 새로운 AI 시대에 들어섰다. 텐서RT 7은 전 세계 개발자들에 인간과 AI간의 보다 자연스러운 상호작용을 가능케하는 빠르고 스마트한 대화형 AI 서비스를 구축 및 배포할 수 있는 툴을 제공한다”고 말했다.

 

세계 유수의 혁신적인 기업들은 이미 엔비디아의 AI 가속화 기술을 활용하고 있다. 세계에서 가장 많이 쓰이는 모바일 애플리케이션인 위챗(WeChat)에 서치 서비스를 제공하는 소구(Sogou)도 그 중 하나다.

 

소구의 CTO 양 홍타오(Yang Hongtao)는 “소구는 음성, 이미지, 번역, 대화, Q&A등의 고품질 AI 서비스를 날마다 수억 명의 사용자들에게 제공하고 있다. 엔비디아 텐서RT 추론 플랫폼을 활용해 온라인 서비스에 실시간으로 대응할 수 있게 됐다. 이와 같은 선도적인 AI 성능들을 통해 소구의 사용자 경험을 크게 향상시킬 수 있었다”고 말했다.

그래픽 / 영상
많이 본 뉴스