미씩(Mythic), 최초의 아날로그 컴퓨팅 솔루션으로 프로세서 시장의 새로운 장을 열다
2021년 01월 19일
트위터로 보내기페이스북으로 보내기구글플러스로 보내기

가정과 사무실, 공장, 자동차는 물론, 각종 인프라와 클라우드에 이르기까지 AI 프로세서를 기반으로 한 지능형 커넥티드 시장이 폭발적으로 성장하고 있다. 가트너에 따르면 AI 신경망 프로세싱 반도체의 매출은 오는 2024년까지 130억 달러 규모에 이를 것으로 예상되고 있다. 이미 AI 프로세서는 비디오 감시 카메라, 네트워크 비디오 리코더, 스마트 홈 기기 및 산업용 머신 장비에 이르기까지 다양한 애플리케이션에 적용되고 있으며, 드론이나 AR/VR 애플리케이션 및 컨수머 및 리테일 로보틱스에 이르기까지 확산되고 있다.

 

AI 추론 시장이 빠르게 확장하면서 탁월한 연산 성능을 제공하는 프로세싱 반도체에 대한 요구도 폭발적으로 증가하고 있다. 반도체 특히 프로세서의 성능과 전력소모의 발전은 미세선폭 프로세스 기술로의 이행을 통해 진화해 왔다. 하지만 무어의 법칙에서 주장하는 새로운 공정 노드로의 이전을 통한 성능, 전력, 크기 개선은 더 이상 시장과 기술의 발전에 부합하지 못하고 있으며, 기존의 범용 프로세서와 컴퓨팅의 발전을 주도해 왔던 데나드(Dennard) 트랜지스터 스케일링, RISC 아키텍처 및 멀티 스레딩 기반의 멀티 코어 프로세서 등과 같은 기술 원리들도 그 동력의 한계에 봉착하고 있다.


이러한 가운데 전통적인 디지털 프로세싱 방식에서 벗어나 아날로그 프로세싱을 통해 최상의 성능과 전력을 제공하는 최초의 아날로그 컴퓨팅 솔루션이 등장했다. 미틱(Mythic)은 업계 최초로 특허받은 획기적인 아날로그 컴퓨팅 인메모리(In-memory) 기술에 기반한 아날로그 AI 프로세서인 아날로그 매트릭스 프로세서(AMP: Analog Matrix Processor), M1108을 출시했다.


592e72810c9862101b105c932d809abc_1611050049_2069.jpg

M1108 AMP는 프로세서 칩 또는 PCIe M.2 및 PCIe 카드 폼팩터로 제공되기 때문에 애플리케이션 요건에 따라 적용이 가능하다. 또한 M1108 PCIe 평가 키트도 제공된다.


미씩 코리아의 기훈재 상무는 “디지털 프로세싱은 많은 외부 메모리를 필요로 하기 때문에 전력소모가 크고, 소형화에도 한계에 직면하고 있다. 미씩의 아날로그 컴퓨팅 엔진인 ACE(Analog Compute Engine)는 플래시 메모리 셀에서 직접 아날로그 프로세싱을 수행하기 때문에 디지털 솔루션에서 제기되는 메모리 병목현상을 제거하는 것은 물론, 저전력, 소형화가 모두 가능하기 때문에 AI 기술을 보다 다양한 애플리케이션 분야로 확장하고, 디지털 솔루션으로는 접근할 수 없었던 제품 개발을 가능하게 할 것이다.”고 밝혔다.


미씩의 아날로그 매트릭스 프로세서는 아날로그와 임베디드 플래시를 결합한 획기적인 아키텍처를 기반으로 8bit 온칩 SRAM에 해당하는 연산을 단 하나의 플래시 메모리 셀로 처리할 수 있어 기존 디지털 솔루션에 비해 크기를 50배까지 줄일 수 있다. 또한 SRAM 사이즈를 줄이기 위해 고가의 복잡한 미세공정을 사용할 필요가 없기 때문에 부품원가를 크게 절감할 수 있다.


592e72810c9862101b105c932d809abc_1611050087_1283.jpg

M1108은 108개의 ACE 타일이 통합되어 있으며, 각 ACE 타일은 플래시 셀과 DAC/ADC, 32bit RISC-V 나노 프로세서, SIMD 벡터 엔진, SRAM 및 NoC(Network-on-Chip) 라우터를 갖추고 있다.


기훈재 상무는 “미씩의 솔루션은 아날로그 프로세싱의 장점 외에도 확장 가능한 아키텍처 구조를 갖추고 있어 각기 다른 신경망 네트워크를 별도로 구현하여 동시에 프로세싱이 가능하기 때문에 웨어러블에서 엣지 서버에 이르기까지 다양한 애플리케이션에 유연하게 적용이 가능하다.”고 설명했다.


M1108은 108개의 ACE 타일과 4개의 제어 타일로 구성되어 있으며, 각 ACE 타일은 플래시 셀과 DAC/ADC, 32bit RISC-V 나노 프로세서, SIMD 벡터 엔진, SRAM을 비롯해 뛰어난 처리량의 NoC(Network-on-Chip) 라우터를 갖추고 있다. 또한 4개의 제어 타일은 시스템의 호스트 프로세서와 인터페이스할 수 있는 고대역폭 PCIe 2.0을 제공한다.


108개의 AMP 타일을 탑재한 M1108은 최대 35TOPS(Trillion-Operations-per-Second)의 성능을 제공하며, 단일 칩으로 매우 짧은 지연시간과 전력 효율적으로 ResNet-50, YOLOv3, OpenPose Body25와 같은 복잡한 AI 모델을 실행할 수 있다. 이러한 복잡한 AI 모델을 최대 처리량으로 실행하는 동안 M1108의 일반적인 전력소모는 약 4W에 불과하다. 또한 안정적인 40nm CMOS 기술을 활용함으로써 기본적인 비용 이점을 제공하는 것은 물론, 외부 DRAM이나 SRAM이 필요하지 않기 때문에 M1108은 유사한 디지털 아키텍처에 비해 비용을 최대 10배까지 절감할 수 있다.


592e72810c9862101b105c932d809abc_1611050143_2604.jpg

미씩은 자사의 아날로그 매트릭스 프로세서와 엔비디아 자비에(Xavier) AGX에 대한 예비 평가를 통해

데이터센터 컴퓨팅 애플리케이션에서 전력소비는 10배, 비용은 20배까지 줄일 수 있다고 밝혔다.

 

진선옥 기자 (jadejin@all4chip.com)
그래픽 / 영상
많이 본 뉴스