
Arm이 2026년 이후를 내다본 기술 전망을 발표했다. Arm은 컴퓨팅이 중앙화된 클라우드 구조에서 벗어나 디바이스, 공간, 시스템 전반으로 분산되는 인텔리전스로 확장되고 있다고 분석하며, 향후 컴퓨팅은 모듈화와 전력 효율성 강화를 중심으로 클라우드·엣지·피지컬 AI 전반을 유기적으로 연결하는 방향으로 진화할 것으로 전망했다.
반도체 설계 측면에서는 단일 칩 구조의 한계를 넘어 칩렛 기반 모듈형 설계가 본격 확산될 것으로 예상된다. 컴퓨팅, 메모리, I/O를 재사용 가능한 빌딩 블록으로 분리함으로써 서로 다른 공정 노드를 조합하고 비용과 개발 기간을 동시에 줄일 수 있으며, SoC를 처음부터 다시 설계하지 않고도 다양한 워크로드에 맞춰 빠르게 최적화할 수 있다. Arm은 개방형 칩렛 표준의 발전으로 서로 다른 벤더의 칩렛을 신뢰성과 보안성을 갖춘 형태로 결합하는 환경도 성숙해질 것으로 내다봤다.
AI 컴퓨팅 영역에서는 도메인 특화 가속기와 시스템 수준 공동 설계가 핵심 흐름으로 제시됐다. CPU, 가속기, 메모리, 인터커넥트를 하나의 플랫폼으로 통합한 설계는 개발자 접근성과 확장성, 전력 효율을 동시에 높이며, 이러한 변화는 단위 면적당 AI 컴퓨팅 밀도를 극대화하고 전력 소비와 비용을 줄이는 컨버지드 AI 데이터센터의 부상으로 이어지고 있다.
AI 추론은 점차 클라우드에서 디바이스로 이동하고 있다. Arm은 2026년을 전후로 엣지 AI가 단순 분석을 넘어 실시간 추론과 적응 단계로 진화할 것으로 전망했다. 알고리즘 고도화와 모델 양자화, 특화 실리콘 발전으로 복잡한 AI 모델도 엣지 환경에서 구현되며, 현장 추론과 로컬 학습이 표준으로 자리 잡아 지연 시간과 클라우드 의존도를 동시에 낮출 것으로 예상된다.
기업 환경에서는 소형 언어 모델(SLM)의 중요성이 더욱 커질 것으로 보인다. 모델 압축과 지식 증류 기술 발전으로 SLM은 적은 파라미터로도 높은 추론 성능을 제공하며, 엣지 배포와 미세 조정에 유리하고 전력 제약 환경에도 적합하다. Arm은 학습 효율성이 AI 모델의 핵심 경쟁 지표로 부상하며 ‘줄(joule)당 추론’과 같은 지표가 표준화될 가능성도 제시했다.
Arm은 또한 차세대 AI 플랫폼으로 피지컬 AI를 지목했다. 멀티모달 모델과 효율적인 학습·추론 파이프라인을 기반으로 의료, 제조, 운송, 광업 등 다양한 산업에서 자율 기계와 로봇이 확산될 것으로 전망되며, 차량용으로 개발된 칩이 로보틱스 분야로 확장 적용되면서 자동화를 공통적으로 지원하는 컴퓨팅 플랫폼과 규모의 경제 역시 강화될 것으로 예상된다.
Arm은 이번 전망을 통해 2026년 이후의 컴퓨팅 경쟁은 단순한 성능을 넘어 효율, 확장성, 시스템 수준의 통합 역량이 핵심 차별 요소가 될 것이라고 강조했다.