키사이트의 새로운 KAI 아키텍처 기반 테스트 솔루션으로 AI 성능 최적화
2025년 04월 03일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기
b3f537a2dacfab36d67169975b75dba1_1743614908_9945.jpg
 

AI 시장은 2030년까지 35.7%의 높은 성장률을 기록할 것으로 전망되고 있다. 산업 전반에 걸쳐 AI가 급속히 확산하면서 기술적 요구사항도 빠르게 진화하고 있다. 이더넷 속도와 메모리 용량, 구리 및 광통신, PCIe 및 CXL, 무선 등에 이르기까지 현재 수준에서 4배에서 10배에 이르는 성능 요건을 필요로 하게 될 것이다. 


이러한 성능 요건을 충족하기 위해 복잡한 계층 구조로 진화하고 있는 데이터센터의 성능을 최적화하기 위해서는 모든 칩과 케이블, 인터커넥트, 스위치, 서버, GPU등의 부품 레벨은 물론, 시스템 전반에 대한 통합적인 검증이 이뤄져야 한다. 물리 계층 테스트를 보완하는 모든 스택 워크로드에 대한 에뮬레이션을 통해 부품 테스트만으로는 파악할 수 없는 통찰력을 확보할 수 있다. 이를 통해 고객은 AI 성능을 조기에 극대화하고, 클러스터 투자 수익을 빠르게 높일 수 있다.


b3f537a2dacfab36d67169975b75dba1_1743614832_4041.jpg

▲ 컴퓨팅, 네트워크 및 데이터 집약적인 AI는 시스템 규모의 검증이 필요하다 


키사이트 테크놀로지스는 AI 클러스터 구성 요소를 실제 워크로드로 에뮬레이션하여 데이터 센터 내 AI 처리 역량을 확장할 수 있는 엔드투엔드 솔루션 포트폴리오인 KAI(Keysight AI) 아키텍처를 출시했다. 이와 함께 KAI 데이터 센터 빌더와 인터커넥트 및 네트워크 성능 테스터, DCA-M 샘플링 오실로스코프 등 3종의 신제품을 통해 AI 네트워크 설계 및 구축 속도를 획기적으로 개선할 수 있도록 지원한다. 특히, 1.6T 구성 요소의 특성 분석 및 테스트를 가능하게 하여 AI 데이터 센터 네트워크의 신뢰성과 성능 최적화를 보장한다. 


KAI 아키텍처는 AI 공급업체, 반도체 제조사, 네트워크 장비 제조사가 설계, 개발, 운영 전반에서 속도를 높일 수 있도록 지원한다. 먼저, 설계 단계에서는 최첨단 고속 디지털 설계를 디버깅하고, 최신 PCIe, DDR, CXL 표준을 충족하거나 이를 초과 달성할 수 있도록 돕는다. 개발 단계에서는 고속 인터커넥트, 케이블, 칩셋 등 구성 요소의 규격을 검증하고, 시스템 수준에서 워크로드 성능을 검증할 수 있게 해준다. 마지막으로, 배포 및 운영 단계에서는 데이터 센터 전체의 시스템 성능을 검증하고 조율함으로써, 실제 운영 전에 성능 문제를 사전에 파악하고 실패 위험을 줄일 수 있도록 한다.


b3f537a2dacfab36d67169975b75dba1_1743614770_1128.jpg

▲ 향후 5년내 변곡점에 도달하게 될 것으로 예상되는 AI 


키사이트 AI(KAI) 데이터 센터 빌더

AI 운영자들은 AI 모델 학습을 가속화하기 위해 모델 분할이라 불리는 병렬 처리 전략을 다양하게 사용한다. 모델 분할 방식이 AI 클러스터의 토폴로지 및 구성과 잘 맞을수록 학습 성능이 향상된다. 


KAI 데이터 센터 빌더는 LLM을 포함한 다양한 AI 모델 학습 워크로드를 에뮬레이션하여, 네트워크, 호스트, 가속기 등 AI 인프라 구성 요소 설계와 검증에 통합할 수 있다. 이 솔루션은 하드웨어 설계, 프로토콜, 아키텍처, AI 학습 알고리즘 간의 시너지를 높여 시스템 성능을 향상시킨다. 


실제 AI 학습 작업의 네트워크 통신 패턴을 재현하는 이 워크로드 에뮬레이션 솔루션은 실험을 가속화하고 학습 곡선을 줄이며, 실제 AI 학습 작업으로는 파악하기 어려운 성능 저하 원인을 더 깊이 있게 분석할 수 있도록 한다.


b3f537a2dacfab36d67169975b75dba1_1743614707_3669.jpg

▲ 좌측부터, KAI 데이터 센터 빌더, 인터커넥트 및 네트워크 성능 테스터, DCA-M 샘플링 오실로스코프 


인터커넥트 및 네트워크 성능 테스터

수십 년간 네트워크 인터커넥트 성능 검증은 수동적이고 시간이 많이 소요되는 방식으로 진행되어 왔으며, 자동화 시스템 구축이 어려웠고, 고급 스크립팅 기술이 요구되었다. 또한 데이터와 리포트를 중앙에서 관리할 시스템이 없어 테스트 추적과 재현이 어려웠다. AI와 데이터 센터 인터커넥트의 다양성과 규모가 커짐에 따라 기존의 테스트 방식은 현재의 복잡한 프로덕션 네트워크의 신뢰성을 정확히 예측하거나 측정할 수 없다. 


새로운 INPT-1600GE 인터커넥트 및 네트워크 성능 테스터와 ITS 소프트웨어를 포함한 인터커넥트 테스트 시스템은 데이터를 지능적으로 관리·저장·활용할 수 있는 통합 시스템으로서, 고속 이더넷 네트워크 및 AI 데이터 센터에서의 인터커넥트 검증을 자동화한다. 


DCA-M 샘플링 오실로스코프

1.6T 광 인터커넥트를 사용하는 AI 데이터 센터 네트워크의 빠른 구축은 매우 높은 데이터 속도와 신호 무결성 요건으로 인해 측정에서 큰 과제를 안긴다. 엔지니어는 다양한 조건에서 트랜시버 성능을 특성 분석하고 검증할 수 있어야 하며, 이를 위해서는 탁월한 대역폭, 낮은 노이즈, 높은 감도를 갖춘 정밀한 테스트 장비가 필요하다. 제조 현장에서는 자동화된 테스트가 효율적이고 확장 가능하며 정밀해야 하며, 대량 생산 시에도 데이터 센터 기준을 충족하고 산업 표준을 준수해야 한다. 


새로운 DCA-M 샘플링 오실로스코프는 최대 240Gbps/레인 광 신호 분석을 지원하며, 최대 120 GBaud의 통합 클럭 복구 기능과 함께 업계 최고 수준의 광 측정 감도를 제공한다. 이 장비는 R&D 및 제조 현장에서 1.6T 트랜시버의 광 테스트 요구를 충족하도록 설계되었다.

진선옥 기자 (jadejin@all4chip.com)
그래픽 / 영상
많이 본 뉴스