뉴스

“애저 구동 가능”...엔비디아, GPU 가속 '슈퍼컴퓨터' 공개

  • 박지우 기자
    • 기사
    • 크게
    • 작게

    입력 : 2019-11-19 11:32:51

    - 복잡한 AI 및 HPC 애플리케이션 처리

    엔비디아가 마이크로소프트(Microsoft)의 클라우드 컴퓨팅 플랫폼 애저(Azure)에서 구동되는 새로운 GPU 가속 슈퍼컴퓨터를 공개했다고 19일 밝혔다.

    인공지능(AI) 및 고성능 컴퓨팅(HPC) 애플리케이션을 처리하도록 설계된 애저의 새로운 NDv2 인스턴스는 세계에서 가장 빠른 슈퍼컴퓨터 중 하나로, 단일 멜라녹스 인피니밴드 백엔드 네트워크에서 상호 연결된 최대 800개의 엔비디아 V100 텐서 코어 GPU를 제공한다.

    < 엔비디아 V100 텐서 코어 GPU >

    복잡한 AI, 머신러닝 및 HPC 워크로드에 이상적인 이 새로운 제품은 기존 CPU 기반 컴퓨팅과 비교해 성능과 비용 모든 측면에서 상당한 이점을 제공한다. 빠른 성능을 제공하는 솔루션이 필요한 AI 연구진은 여러 NDv2 인스턴스를 신속하게 스핀업하고 복잡한 대화형 AI 모델을 단 몇 시간 만에 교육할 수 있다.

    마이크로소프트와 엔비디아 엔지니어들은 시험판 버전의 클러스터에서 64개의 NDv2 인스턴스를 사용하여 구글의 AI 언어모델인 버트를 약 3 시간 만에 훈련시켰다. 여기에는 NCCL, 엔비디아 쿠다 X 라이브러리, 그리고 고속 멜라녹스 인터커넥트에서 제공되는 다중 GPU 최적화가 활용됐다.

    고객들은 또한 여러 NDv2 인스턴스를 사용하여 LAMMPS와 같은 복잡한 HPC 워크로드를 실행할 때에도 이점을 얻을 수 있다.

    LAMMPS는 약물 개발 및 발견과 같은 영역에서 원자 규모로 물질을 시뮬레이션하는데 사용되는 분자 역학 애플리케이션이다. 단일 NDv2 인스턴스는 딥 러닝과 같은 특정 유형의 애플리케이션에 GPU 가속없이 기존 HPC 노드보다 훨씬 빠른 결과를 제공할 수 있다. 이 같은 성능은 대규모 시뮬레이션을 위해 백 개의 인스턴스로 선형적으로 확장할 수 있다.

    모든 NDv2 인스턴스는 GPU에 최적화된 HPC 애플리케이션, 머신러닝 소프트웨어, 그리고 엔비디아 NGC 컨테이너 레지스트리 및 애저 마켓플레이스에서 이용가능한 텐서플로우, 파이토치, MxNet 등과 같은 딥 러닝 프레임워크의 지원을 받는다. 



    • 기사보내기
    • facebook
    • twitter
    • google
    • e-mail
  • Copyrights ⓒ BetaNews.net