사피온, 데이터센터용 AI 추론 NPU ‘X330’ 출시
자율주행 SoC용 AI NPU, IP로 내년 중 공급
2023-11-17 온라인기사  / 윤범진 기자_bjyun@autoelectronics.co.kr

사피온(SAPEON, 대표 류수정)은 16일 대만 TSMC의 7나노(nm) 공정에서 생산된 데이터센터용 AI 가속기 칩 ‘X330’을 언론에 공개했다.

사피온은 자사의 2세대 AI 칩인 X330이 올해 출시된 경쟁사의 5나노 공정 제품보다 두 배 빠른 추론 성능과 1.3배 이상의 전력효율을 제공한다고 소개했다. 사피온은 주요 고객사를 대상으로 X330 시제품 테스트와 신뢰성 검증을 마치는 대로 2024년 상반기부터 양산을 시작할 계획이다.
 


류수정 사피온 대표가 지난 15일 서울 중구 SK-T타워에서 진행된 기자간담회에서
2세대 AI 가속기 칩 ‘X330’을 소개하고 있다. [사진=사피온]


사피온 류수정 대표는 “사피온은 지난 2020년 국내 최초로 데이터센터용 AI 반도체 X220을 발표한 이후 다수의 기반 서비스 제공을 통해 시장 검증을 완료했고 자동차, 보안, 미디어 등 다양한 분야로 상용 서비스 분야를 지속적으로 확대하고 있다."며 "X220의 장점을 극대화한 X330을 통해 AI 서비스 모델 개발 기업과 데이터센터 시장 공략에 박차를 가할 전략이다. 산업 전 분야에서 AI 반도체 활용도를 높여 고도의 AI 기술을 누구나 저렴하게 이용할 수 있게 제공함으로써 모두가 첨단 기술 발전의 혜택을 향유할 수 있는 사회를 만드는 데 공헌하고자 한다.”라고 말했다.

X330은 4개의 AI 코어와 16개의 RISC-V 기반 CPU가 탑재됐다. AI 코어는 64K MXC와 4개의 NVP로 구성돼 있다. 메모리는 SK하이닉스의 GDDR6 D램 8개가 내장돼 있으며, 입출력은 PCIe Gen 5를 지원한다.

사피온에 따르면, X330은 기존 X220 대비 4배 이상의 연산 성능과 2배 이상의 전력효율을 확보했다. 사피온은 대규모 언어 모델(Large Language Model, LLM) 지원을 추가해 전반적인 총소유비용(TCO)을 개선함으로써 AI 서비스 모델 개발 회사와 데이터센터 시장을 적극적으로 공략할 계획이다. 
 

마이클 쉐바노우 사피온 CTO [사진=사피온]

사피온 마이클 쉐바노우(Michael C. Shebanow) 최고기술책임자(CTO)는 “내부 분석 결과, X330은 동급 GPU와 비교해 최대 1.9배의 전력 효율을 달성했다.”며 “경쟁사 GPU를 X330 칩으로 교체한다면 소나무 1,180만 그루를 심는 것과 같은 효과를 얻을 수 있다.”라고 말했다. 

사피온은 풀스택 접근 방식을 추구한다. X330 장착 서버의 경우, 성능을 최적화할 수 있는 개방형 신경망 교환(Open Neural Network Exchange, ONNX) 기반 소프트웨어 스택을 지원하고 AI 추론 플랫폼 소프트웨어와 소프트웨어 개발 도구(SDK)도 함께 제공한다.

사피온 제로터치(Zero-touch™) AI 풀스택 [출처=사피온]


X330은 비디오 코덱과 비디오 후처리 IP를 내장하고 있어 동영상 관련 프로그램의 처리속도를 높여준다. 또한, 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다.
 

X330 사양과 제품 라인업 [출처=사피온]


이날 사피온은 X330의 차기 제품인 X430(2025년 말 양산 계획)에는 고대역폭메모리(HBM)3 탑재와 칩렛 적용을 고려하고 있다고 밝혔다.
류 대표는 칩렛의 경우, 어떤 칩투칩(chip-to-chip) 인터페이스를 가져갈지 고민 중이며 I/O 인터페이스 역시 확장 가능성을 고려해 어떤 프로토콜도 지원하게끔 검토 중이라고 말했다. 사피온은 CXL(Compute eXpress Link)을 비롯해 다양한 형태의 인터페이스를 고려하고 있다.

내년에는 자율주행 자동차용 SoC(System on chip) 회사에 X330의 배리언트(Variant) 제품인 AI NPU를 IP(Intellectual Property: 반도체 설계자산)로 공급할 계획이다. 
 

사피온 AI 반도체 로드맵 [출처=사피온]


소프트(Soft) IP로 제공되는 자율주행 자동차용 AI NPU는 X330과 기본적인 코어 아키텍처는 동일하다. 다만, 기능안전(Functional Safety) 요구사항에 맞춰 안전 기능이 다수 추가됐으며 차량용 실시간 처리에 적합하도록 설계 구성이 변경됐다. 
류 대표는 "ISO 26262 기능안전을 고려한 상태에서 안전 분석(Safety Analysis)를 통해 안전 설계를 진행하였고, 이를 기반으로 한 NPU IP에 대한 ISO 26262 Product 인증을 올해 확보할 예정이다."라고 말했다. 그는 이어 "앞으로 모빌리티 분야의 자율주행 기술은 다양한 영역에서 활용될 것"이라며 "그에 발맞춰 기술적으로 필요한 부분을 차근차근 풀어갈 수 있는 계기를 만듦으로써 다가올 미래 디바이스에 활용할 수 있는 가능성을 확보해가고자 한다."라고 덧붙였다. 

한편, 사피온은 지난해 12월 SK브로드밴드 가산 IDC 내에 X220 장착 서버를 사용해 7.6Peta OPS 처리량에 달하는 대규모 NPU Farm을 구축했다. 이를 통해 실제 데이터센터 환경에서 서비스를 상용화하고 운영하는 프로젝트를 추진한 바 있다. 사피온은 NPU Farm 프로젝트를 통해 이미지 분석, 자연어 처리, 화질 개선 등 다양한 분야에서의 상용화 테스트를 성공적으로 수행함으로써 비즈니스 모델 확대 가능성을 확인했다.



AEM_Automotive Electronics Magazine


<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>


  • 100자평 쓰기
  • 로그인


  • 세미나/교육/전시

TOP