
키사이트테크놀로지스가 헤비리딩(Heavy Reading)과 공동으로 AI 클러스터 네트워킹 보고서 2025(Beyond the Bottleneck: AI Cluster Networking Report 2025)를 발표했다. 이 보고서는 인공지능(AI) 채택 속도가 인프라 확충 속도를 앞서고 있음을 보여주며, 차세대 AI 워크로드를 지원하기 위해 통신 및 클라우드 서비스 제공업체들이 단순한 확장이 아닌 ‘최적화’로의 전환이 필요하다는 점을 강조한다.
산업 전반에서 AI의 활용이 가속화되면서 데이터 센터 인프라에 대한 요구도 빠르게 증가하고 있다. 단순히 인프라를 확충하는 것만으로는 부족하며, 응답자의 62%는 추가 투자 없이 기존 인프라를 최대한 활용하려 한다고 밝혔다. 운영자들은 성능 검증은 물론 효율성 향상과 차세대 AI 클러스터의 빠른 구축을 위해, 실제 AI 워크로드를 모사(emulate)하는 전략을 도입하고 있다.
보고서에 따르면 응답자의 약 89%는 내년에도 AI 인프라에 대한 투자를 유지하거나 확대할 계획이라고 답했으며, 주요 성장 동력으로는 클라우드 통합(51%), 더 빠른 GPU 도입(49%), 고속 네트워크 업그레이드(45%) 등이 꼽혔다.
투자 기조는 유지되고 있지만 많은 운영자들이 기존 인프라를 최대한 활용하려는 경향을 보이고 있다. 전체 응답자의 62%는 신규 자본 지출 없이 기존 인프라에서 더 많은 가치를 끌어내는 것이 목표라고 밝혔다.
또한, 실제로 응답자의 62%는 새로운 투입 없이 기존 인프라에서 더 큰 가치를 창출하는 것을 목표로 한다고 밝혔다. 또한 AI 워크로드 에뮬레이션의 중요성이 부각되고 있다.
전체 응답자의 95%가 현실적인 AI 워크로드 모사가 중요하다고 답했으나, 상당수는 실제 운영 규모의 환경을 효과적으로 시뮬레이션할 수 있는 도구의 부족을 지적했다. AI 인프라 확장의 주요 걸림돌로는 예산 제약(59%), 인프라 용량 부족(55%), 인재 확보의 어려움(51%)이 꼽혔다.고속 네트워킹 기술 도입도 점차 확산되고 있다. 응답자의 34%는 800G 기술 도입을 고려하고 있으며, 22%는 1.6T 기술을 시험하고 있다고 답했다. 이와 함께, 고성능 네트워킹 옵션으로 울트라 이더넷(Ultra Ethernet)을 평가 중인 응답자는 58%에 달했다.
특히, 네트워크 병목 현상은 AI 확장의 다음 과제로 떠오르고 있다. 전체 응답자의 55%가 400G 인터커넥트를 이미 구축했으며, 1.6T에 대한 관심도 점점 커지고 있다. 이에 따라 네트워크 용량 확보는 향후 AI 확장성과 관련된 결정적인 요소로 부각되고 있다.
이 연구는 업계가 단순 용량 확장을 넘어 효율성, 성능, 신뢰성 중심으로 인프라 전략을 바꾸고 있음을 보여준다. AI 모델이 고도화될수록 실제 AI 워크로드 에뮬레이션과 같은 도구는 비용을 관리하면서 인프라의 잠재력을 극대화하는 데 핵심적인 역할을 하게 된다.
키사이트 네트워크 애플리케이션 & 보안 그룹 부사장이자 총괄 매니저인 램 페리야카루판(Ram Periakaruppan)은 “AI 데이터 센터는 이제 단순한 성능이나 규모만으로는 부족하며, 운영자들은 더 깊은 인사이트와 정교한 검증, 더 스마트한 인프라 선택이 필요하다”고 말하며, “이번 연구는 현장에서 우리가 목격한 현실을 뒷받침하며, AI 시대의 성공은 네트워크의 모든 계층을 최적화하는 데 달려 있기 때문에 키사이트는 고객이 대규모 AI 인프라를 에뮬레이션, 검증하고 미래에도 대응할 수 있도록 지속적으로 지원하고 있다”고 덧붙였다.
이번 조사는 헤비 리딩이 2025년 3월부터 4월까지 실시한 글로벌 설문조사 결과를 바탕으로 작성되었으며, 북미, 아시아태평양, 유럽의 주요 통신 및 클라우드 서비스 업체 전문가들이 응답에 참여했다.