Arm, 모바일 경험을 재정의할 AI 최적화 클라이언트용 소프트웨어 발표
2024년 05월 31일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기
2333a1ba59d89628c11e700bcb646347_1717107833_4173.jpg
 

Arm은 선도적인 AI 기반 경험을 제공하고 실리콘 파트너가 Arm 기반 솔루션을 더 쉽고 빠르게 구축하여 시장 출시 기간을 단축할 수 있도록 지원하는 클라이언트용 Arm 컴퓨팅 서브시스템(CSS)을 발표했다. 


클라이언트용 Arm CSS는 플래그십 모바일 시스텝온칩(SoC)를 위한 기본 컴퓨팅 요소를 제공하며, 최신 Armv9 CPU, Immortalis GPU, 3nm(나노미터)에서 생산 가능한 CPU 및 GPU용 물리적 구현과 최신 Corelink 시스템 메모리 관리 유닛(SMMU)을 특징으로 한다. 또한, 소프트웨어 개발자가 Arm CPU에서 가능한 최고의 성능을 원활하게 이용할 수 있도록 지원하는 Arm Kleidi를 함께 발표했으며, Arm Kleidi에는 AI 워크로드를 위한 KleidiAI와 컴퓨터 비전 애플리케이션을 위한 KleidiCV가 포함된다. 


Arm 클라이언트 사업부 수석 부사장 겸 총괄 매니저인 크리스 버기(Chris Bergey)는 “전력 효율성을 핵심으로 하는 Arm 플랫폼은 AI 시대가 가속화됨에 따라 차세대 컴퓨팅 수요를 위한 기반을 제공하고 있다”며 “클라이언트용 Arm CSS는 프리미엄 모바일 경험의 한계를 계속 확장시킬 수 있는 플랫폼 기능에 획기적인 변화를 제공한다”고 말했다. 


전례 없는 CPU 및 GPU 성능과 효율성

클라이언트용 Arm CSS는 30% 이상 향상된 컴퓨팅 및 그래픽 성능을 통해 광범위한 AI, 머신러닝 및 컴퓨터 비전(CV) 워크로드를 위한 59%의 더 빠른 AI 추론으로 까다로운 실제 Android 워크로드를 처리하는 가장 빠른 Arm 컴퓨팅 플랫폼이다. 


클라이언트용 CSS의 핵심은 성능과 전력 효율을 극대화하기 위한 Arm의 역대 최고 성능, 효율, 다용도 CPU 클러스터다. 새롭게 출시된 Arm Cortex-X925는 Cortex-X 역사상 전년 대비 가장 높은 성능 향상을 제공한다. 3.8GHz 클럭 속도와 최대 캐시 크기를 기준 하여 최첨단 3nm 공정 노드를 활용할 경우 2023년 스마트폰 플래그십 4nm SoC와 비교했을 때 단일 스레드 성능이 36% 향상되는 엄청난 결과를 얻을 수 있다. AI의 경우, Cortex-X925는 41%의 놀라운 성능 향상을 제공하여 LLM(대규모 언어 모델)과 같은 온디바이스 생성 AI의 응답성을 획기적으로 개선한다. 


최첨단 성능을 위한 추진은 Arm의 새로운 Cortex-A725 CPU를 통한 최첨단 효율성과 결합되어 AI 및 모바일 게임 사용 사례를 대상으로 35%의 성능 향상을 제공한다. 이는 최신의 Armv9 CPU 클러스터를 채택하는 소비자 기기를 위해 전력 효율성과 확장성을 개선하는 새로워진 Arm Cortex-A520 CPU와 업데이트된 DSU-120에 의해 지원된다. 


현재까지 최고의 성능과 효율성을 갖춘 GPU인 새로운 Arm Immortalis-G925 GPU는 광범위한 주요 모바일 게임 애플리케이션에서 37% 더 높은 성능을 제공하며, 여러 AI 및 머신러닝 네트워크에서 측정할 경우 34% 더 높은 성능을 제공한다. Immortalis-G925는 플래그십 스마트폰 시장을 위해 출시된 반면, 확장성이 뛰어난 새로운 GPU 제품군인 Arm Mali-G725 및 Mali-G625 GPU는 프리미엄 모바일 핸드셋부터 스마트워치 및 XR 웨어러블에 이르기까지 광범위한 소비자 기기 시장을 대상으로 한다 


뛰어난 개발자 혁신을 위한 소프트웨어 최적화

Arm은 전 세계 수백만 명의 개발자가 차세대 AI 지원 애플리케이션을 개발하는 데 필요한 성능, 툴 및 소프트웨어 라이브러리에 지원하는 데 전념하고 있다. 개발자들이 이러한 혁신을 최고의 성능으로 빠르게 구현할 수 있도록 Arm은 AI 워크로드를 위한 KleidiAI와 컴퓨터 비전 애플리케이션을 위한 KleidiCV를 포함하는 Arm Kleidi를 출시한다. 


KleidiAI는 AI 프레임워크 개발자를 위한 컴퓨팅 커널 세트로, NEON, SVE2 및 SME2와 같은 주요 Arm 아키텍처 기능을 지원하여 다양한 디바이스에서 Arm CPU에서 설정 가능한 최고의 성능을 원활하게 이용할 수 있도록 한다. KleidiAI는 파이토치(PyTorch), 텐서플로우(Tensorflow), 미디어파이프(MediaPipe) 및 메타 라마 3(Meta Llama 3)와 같은 인기 있는 AI 프레임워크와 통합되며, 이후 Arm이 새롭게 출시할 추가 기술과도 적합하도록 이전 버전과 호환이 가능하다.

그래픽 / 영상
많이 본 뉴스