AMD, 7nm 공정 기반 데이터센터용 GPU 공개

라데온 인스팅트 MI60 및 MI50, 딥러닝, HPC, 클라우드, 렌더링에 탁월한 성능 제공

AMD는 세계 최초의 7nm 공정 기반 데이터센터용 GPU인 라데온 인스팅트(Radeon Instinct) MI60 및 MI50 가속 카드를 공개했다. 새로운 제품들은 모두 차세대 딥러닝, 고성능 컴퓨팅(HPC), 클라우드 컴퓨팅, 렌더링 응용 프로그램 구동을 위한 탁월한 컴퓨트 성능을 제공한다.

AMD 라데온 테크놀로지 그룹 엔지니어링 부문 수석 부사장인 데이비드 왕(David Wang)은 “오늘날의 클라우드 데이터센터에서 발생하는 엄청난 양의 데이터를 분석하고 처리함에 있어, 기존 GPU 아키텍처는 한계가 있다”며, “AMD가 새롭게 선보인 라데온 인스팅트 가속 카드는 세계 최고 수준의 성능과 유연한 아키텍처를 기반으로 견고한 ROCm 소프트웨어 플랫폼을 지원한다. 업계를 선도하는 ROCm 오픈 소프트웨어 생태계에서 클라우드 컴퓨팅 분야 내 가장 복합적인 작업을 수행하는 데 중요한 역할을 하게 될 것”이라고 덧붙였다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 고성능 컴퓨트 유닛이 내장되어 유연한 혼합 정밀도(mixed-precision)를 제공한다. 이를 바탕으로 고성능 컴퓨팅, 딥러닝 응용 프로그램 등 신형 가속 카드가 지원하는 작업의 유형을 확장할 수 있다. 이와 더불어 빠른 속도의 복합 신경망 훈련, 높은 수준의 부동소수점(floating-point) 성능, 향상된 효율성, 데이터센터 전체 혹은 부분 적용을 위한 새로운 기능을 지원하는 등 다양한 작업을 효율적으로 처리하도록 고안됐다.

AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 초고속 부동수소점 성능과 최대 1TB/s의 처리 속도를 제공하는 초고속 HBM2 메모리(2세대 고대역폭 메모리)를 제공한다. 차세대 PCle 4.0을 지원하는 최초의 GPU로, x86 기반에서 CPU와 GPU를 연결하는 데 기존 기술보다 최대 2배 빠른 속도를 제공한다. AMD 인피니트 패브릭(AMD Infinite Fabric) 기술이 GPU 간 연결을 지원하며, 3세대 PCle 대비 최대 6배 향상된 속도를 제공한다.

AMD는 신형 가속 카드의 기능과 호환되는 새로운 버전의 ROCm 오픈 소스트웨어 플랫폼도 함께 발표했다. 새로운 ROCm 플랫폼은 고객이 고성능의 에너지 효율성이 높은 이종 컴퓨팅 플랫폼을 개방형 생태계에 적용할 수 있도록 돕는다.

구글 텐서플로우(TensorFlow)의 라잣 몬가(Rajat Monga) 엔지니어링 담당 디렉터는 “구글은 오픈 소스가 모든 이에게 유용할 것으로 판단한다”며, “오픈 소스 기반 머신 러닝 기술의 유용성은 충분히 입증되었으며, AMD는 이를 입증해 나가고 있다. ROCm 개방형 소프트웨어 플랫폼 기반에서 텐서플로우를 사용하는 고객들이 GPU 가속 카드와 오픈 소스 머신러닝 생태계에서 보다 많은 혜택을 누릴 수 있을 것으로 기대한다”고 밝혔다.

새롭게 공개되는 AMD 라데온 인스팅트 MI60 및 MI50 가속 카드는 다음과 같은 기능과 이점을 제공한다.

최적화된 딥러닝 실행(Optimized Deep Learning Operations): FP16 및 FP32의 혼합 정밀도 연산 성능과 더불어 INT8 및 INT4의 다중 정밀도를 지원한다. 복합 신경망 훈련에서부터 추론에 이르기까지 다양하고 변동성이 큰 작업 수행에 필요한 성능을 제공하는 데 최적화됐다.

현존 최고 속도의 배정밀도(double precision) 성능을 제공하는 PCle 가속 카드: AMD 라데온 인스팅트 MI60 가속 카드는 PCle 4.0 와 호환되며 세계에서 가장 빠른 속도의 배정밀도 성능을 제공한다. 최대 7.4 테라플롭스(TFLOPS)의 최대 FP64의 연산 성능을 기반으로 생명 과학, 에너지, 금융, 오토모티브, 항공우주, 학문, 정부 부처, 군사방어 등의 다양한 영역의 고성능 컴퓨팅 응용 프로그램을 더욱 효율적으로 운용할 수 있도록 지원한다. AMD 라데온 인스팅트 MI50 가속 카드는 최대 6.7 테라플롭스의 최대 FP64 배정밀도 성능을 제공하며, 관리 효율성은 물론 비용 효율성까지 갖춰 딥러닝 워크로드 수행 뿐 아니라, 데스크톱 가상화(VDI), 서비스로서의 데스크톱(DaaS), 클라우드 환경에서도 유용하게 활용될 수 있다.

△최대 6배 더 빠른 데이터 전송 속도: 각 GPU 당 2개의 AMD 인피니티 패브릭 링크(Infinity Fabric Links)로 최대 200GB/s의 속도로 메모리 대역을 직접 연결할 수 있으며, 이는 PCle 3.0을 단독으로 사용한 경우와 비교 시 최대 6배 이상 향상된 수준이다. 한번에 최대 4개의 GPU를 연결해 사용할 수 있으며, 이를 기반으로 총 8개의 GPU가 탑재된 서버를 구성할 수 있다.

△초고속 HBM2 메모리: AMD 라데온 인스팅트 MI60와 MI50 가속 카드에는 각각 32GB의 ECC 메모리와16GB의 HBM2 ECC 메모리가 탑재되어 있다. 신형 가속 카드 2종 모두 풀 칩 형태의 ECC 메모리는 물론, 업그레이드된 RAS(Reliability, Accessibility, and Serviceabolity) 기능을 지원해 대규모의 고성능 컴퓨팅 시스템 적용 시 보다 더 정확한 컴퓨트 성능을 제공한다.

△안전한 가상화 워크로드 지원: AMD MxGPU 기술은 업계 유일의 하드웨어 기반 GPU 가상화 솔루션으로, 업계 표준의 싱글 루트 I/O 가상화(SR-IOV) 기술을 기반으로 하고 있다. 하드웨어 단계에서부터 외부 해킹 시도를 방어하고, 가상 클라우드 적용 시 요구되는 높은 수준의 보안성을 제공한다.

향상된 ROCm 오픈 소프트웨어 플랫폼

AMD는 ROCm 오픈 소프트웨어 플랫폼도 새롭게 선보였다. 새로운 ROCm 소프트웨어 플랫폼은 고성능 및 에너지 효율성이 높은 이종 컴퓨팅 시스템에서 더욱 빠른 속도를 제공할 수 있도록 설계됐다. 신형 라데온 인스팅트 가속 카드 지원과 더불어, 새로운 딥러닝 오퍼레이션을 위한 최신 라이브러리를 제공한다. 센트OS(CentOS), 레드햇엔터프라이즈리눅스(RHEL), 우분투(Ubuntu) 등 64비트 리눅스 기반 운영 체제와 호환되며, 기존 구성요소에 대한 최적화, 텐서플로우 1.11 및 파이토치(PyTorch), 카페2(Caffe2)와 같은 최신 버전의 딥러닝 프레임 워크도 지원한다.

상단영역

본문영역

SNS 기사보내기

AMD, 7nm 공정 기반 데이터센터용 GPU 공개

개의 댓글

댓글 정렬

내 댓글 모음