뉴스

인텔, '2세대 하바나 가우디2' 공개...“엔비디아 'A100' 성능 뛰어 넘어”

  • 박지우 기자
    • 기사
    • 크게
    • 작게

    입력 : 2022-07-01 17:17:59

    - 하바나 가우디 2, ResNet 및 버트(BERT) 모델 학습에서 향상된 머신러닝 성능 기록

    인텔의 차세대 인공지능 프로세서가 엔비디아 동급 제품 성능을 넘어선 것으로 나타났다.

    인텔은 1일 자사 2세대 하바나 '가우디2' 딥 러닝 프로세서와 엔비디아 'A100'의 AI 총 학습 시간(TTT) 성능을 MLPerf 산업 벤치마크 상에서 측정한 결과, '가우디2' 딥 러닝 프로세서의 성능이 월등했다고 밝혔다.

    < 하바나 가우디2 메자닌 카드 /=인텔 제공. >

    인텔은 지난 5월 인텔 비전에서 발표한 가우디 2 프로세서가 비전 (ResNet-50) 및 언어(BERT) 부문에서 뛰어난 TTT를 기록했다.

    하바나 가우디2는 1세대 가우디 제품 대비 TTT 부문에서 큰 폭의 발전을 이뤄냈다.

    ResNet-50 모델의 경우, 가우디2는 엔비디아 A100-80G 제품 대비 학습 시간이 36% 단축됐다. 델(Dell)이 진행한 8개의 가속기 서버에서 진행한 ResNet-50 모델 및 BERT 모델 학습 테스트 결과 가우디2가 엔비디아 A100-40GB 대비 학습 시간을 45% 단축했다.

    가우디2는 1세대 가우디 대비, ResNet-50 및 BERT 모델에서 각각 3배와 4.7배 높은 학습 처리량을 기록했다.

    < MLCommons에서 발표한 지표, 2022년 6월 >

    인텔은 해당 프로세서를 기존 16나노 공정에서 7나노 공정으로 전환해 텐서 프로세서 코어 수를 3배 증가했다. GEMM 엔진 컴퓨팅 용량 증설, 패키지 내 고대역폭 메모리 용량 3배 확대, 대역폭 및 SRAM 크기 2배 확장을 통해 이번 성과를 달성했다.

    비전 모델의 경우 가우디2는 독립적으로 작동해 AI 학습에 필요한 데이터 증강을 포함, 압축 영상화를 위한 전반적인 전처리 파이프를 처리할 수 있는 통합 미디어 엔진 형태의 기능을 갖췄다.

    MLPerf을 통해 측정된 가우디2 제품의 성능 외에도, 가우디1은 고효율 시스템 스케일링을 지원하는 128-가속기 및 256-가속기를 위한 ResNet 모델에서 강력한 성능 및 선형 스케일을 제공했다.



    • 기사보내기
    • facebook
    • twitter
    • google
    • e-mail
  • Copyrights ⓒ BetaNews.net