ARM, 수학적 계산 가속 64비트 ARM 기반 HPC 시스템용 퍼포먼스 라이브러리 발표
64비트 ARM 시스템온칩 성능 강화 위해 실리콘 파트너사와 협력
2015-11-25 온라인기사  / 편집부

영국 반도체 설계자산(IP) 기업 ARM이 ‘고성능 컴퓨팅(HPC: High-performance computing)’ 서버에 대한 지원을 강화하기 위해 64비트 ‘ARM®v8-A 프로세서’를 위한 새로운 ‘ARM 퍼포먼스 라이브러리(Performance Libraries)’를 발표했다.

‘ARM 퍼포먼스 라이브러리’는 ARM 기반의 HPC 서버와 시스템 상에서 실행되는 전산 소프트웨어의 성능을 최상으로 끌어올릴 수 있도록 설계된 핵심적인 수학 루틴이다. ARM 수학 라이브러리는 ‘ARMv8-A 아키텍처’를 기반으로 한 파트너들의 시스템온칩(SoC) 내에서 최고 시스템 성능을 보장하기 위해 각 실리콘 파트너의 특정 마이크로 아키텍처의 구조과 특징들을 이용한다. ‘ARM 퍼포먼스 라이브러리’는 최근 HPC, 네트워킹, 스토리지 및 분석 등의 주제로 열린 국제 컨퍼런스인 ‘27회SC15 컨퍼런스’에서 처음으로 공개 시연돼 참가자들의 주목을 끌었다.

홉슨 불맨(Hobson Bullman) ARM 개발자 시스템 그룹 사업 부장은 “’ARM 퍼포먼스 라이브러리’는 ARM 서버와 HPC 에코시스템의 발전에 있어서 또 하나의 중요한 성과이다. HPC 커뮤니티는 ARM 기반 서버의 얼리어답터(early adopters)들로 최적화된 수학 루틴을 도입하여 64비트 ARM 기반의 전산 플랫폼에서 과학적 컴퓨팅을 가능하게 하는 기반을 구축하고 있다. ‘ARM 퍼포먼스 라이브러리’는 소프트웨어 성능과 일관된 라이브러리 인터페이스 모두를 만족시켜 ‘ARMv8-A’ 서버 플랫폼에 대한 소프트웨어 개발 용이성과 이식성을 가능하게 한다”고 말했다. 

실리콘 파트너에 최적화된 ARM 퍼포먼스 라이브러리 제공

ARM은 HPC 커뮤니티를 위해 가능성의 영역을 급진적으로 확장하고 있는 서버 플랫폼과, 워크로드 최적화된 실리콘을 가능하게 하고 있다. 최종 고객이 ‘ARMv8-A 아키텍처’에 의한 차별화되고 주목할 만한 결과를 얻기 위해 ARM 은 모든 64비트 ARM 시스템온칩(SoC)의 성능이 향상될 수 있도록 실리콘 파트너들과 협력하고 있다. 이러한 접근법은 메모리 계층구조와 전산 작업의 처리량에 직접적으로 영향을 미칠 수 있는 파이프라인(pipeline) 구성과 같은 혁신과 디자인 선택권의 이점을 최대한 활용한다.

‘ARM 퍼포먼스 라이브러리’의 핵심은 수치 알고리즘 그룹

‘수치 알고리즘 그룹( NAG: Numerical Algorithms Group) 라이브러리’와 검증된 관련 제품군은 상업적 이용이 가능한 세계 최대 규모의 수치(numerical) 및 통계 알고리즘 컬렉션이다. ‘NAG’라이브러리는 ‘ARMv8-A 아키텍처’용으로 디자인된 변형을 구축하도록 시험 검증된 기준을 제시하고 있다. ‘NAG’의 업계 검증된 ‘BLAS’상에 구축함으로써, ARM은 ‘LAPACK’ 및 ‘FFT’ 수학 루틴을 통해 시장에 정확하고 검증된 핵심 라이브러리를 신속하게 선보일 수 있다. ‘ARM 퍼포먼스 라이브러리’는 ‘고급 SIMD’에 최적화됨과 동시에 멀티 스레드(multithreaded)를 지원하고 있다. 또한 64비트 ARM 시스템온칩(SoC) 설계 상에서 최고 쓰루풋(thgoughput)을 가능하게 하는 업계 최신 컴파일러의 사용을 구축한다.

마이크 듀어(Mike Dewar) NAG의 최고기술책임자(CTO)는 “NAG의 핵심에 있는 ‘선형 대수(Linear Algebra)’와 ‘FFT 알고리즘’을 활용한 ‘ARM 퍼포먼스 라이브러리’는 고도의 과학적 컴퓨팅 애플리케이션을 위한 완벽한 빌딩 블록이다. ‘ARM 퍼포먼스 라이브러리’에 의해 가능해진 하드웨어 관련 성능 튜닝은 수학적 정확성에 대한 NAG의 엄격한 기준에 부합한다. 성능 튜닝으로 ARM의 에코 시스템을 위한 가장 빠르고 정확한 전산 수학 루틴이 산출될 것”이라고 말했다.

에코시스템 및 파트너 인준사인 캐비엄(Cavium)의 래리 와이캘리어스(Larry Wikelius) 이사는 “캐비엄은 가장 까다로운 ‘고성능 컴퓨팅’과 빅데이터 분석 소프트웨어 애플리케이션에 요구되는 최적화된 라이브러리를 제공하기 위해 ARM과 NAG의 파트너가 된 것을 기쁘게 생각한다. 듀얼소켓 지원과 함께 캐비엄의 48코어 ‘ARMv8-A’ 기반 워크로드 최적화 프로세서인 ‘ThunderX™’는 ‘ARM 퍼포먼스 라이브러리’를 활용하는 고성능 컴퓨팅 애플리케이션에 동급 최고 성능을 제공할 수 있는 이상적인 플랫폼이다. 캐비엄과 ARM은 고성능 컴퓨팅, 기업 및 하이퍼 스케일 서버 시장에 주요 솔루션을 제공하고 있는 소프트웨어 및 업계 선도 시스템 파트너들과 함께 ‘ARMv8-A’ 서버 에코시스템을 적극적으로 이끌어 나갈 것”이라고 밝혔다.  

ARM HPC용 오픈 소스 활성화

64비트 ‘ARM Cortex® 프로세서’ 기반 서버를 포함한 ‘ARMv8-A 아키텍처’ 기반 플랫폼으로의 소프트웨어 이식을 가속화하기 위해, ‘ARM 퍼포먼스 라이브러리’는 ‘ATLAS’, ‘OpenMPI’, ‘NumPy’ 및 ‘TAU’를 포함한 고성능 컴퓨팅용의 인기 있는 오픈 소스 애플리케이션의 검증된 바이너리 배포판을 제공한다. HPC 커뮤니티의 개발과 협업을 가능하게 하기 위해 이들 오픈 소스 애플리케이션을 ARM에 이식(port)하는 데 필요한 모든 변경사항들은 오픈 소스 레포지토리(repositories)에 피드백될 것이다.

상용 라이선스

‘ARM 퍼포먼스 라이브러리’는 무제한 이용, 광범위한 지원, 무료 로열티 및 유지 개발 플랫폼 제공과 함께 상용 라이선스 가능하며 ARM에 의해 지원된다.  사전 탑재 및 오픈 소스 패키지는 각각의 라이선스 계약에 따라 제공된다. 



<저작권자 © AEM. 무단전재 및 재배포, AI학습 이용 금지>


  • 100자평 쓰기
  • 로그인


  • 세미나/교육/전시

TOP