대규모 클라우드 구축 위해 맞손…수만 개 엔비디아 GPU 및 엔비디아 퀀텀-2 등 애저 제공
(씨넷코리아=윤현종 기자) 엔비디아가 세계에서 가장 강력한 AI 슈퍼컴퓨터 중 하나를 구축하기 위해 마이크로소프트(Microsoft)와 다년간 협력한다고 17일 밝혔다.
해당 슈퍼컴퓨터는 엔비디아(NVIDIA) GPU, 네트워킹 및 AI 소프트웨어 풀 스택과 결합된 마이크로소프트 애저(Azure)의 고급 슈퍼컴퓨팅 인프라로 기업의 대규모 최신 모델을 포함한 AI 훈련과 배포 및 확장을 지원한다.
애저 클라우드 기반 AI 슈퍼컴퓨터에는 AI 분산 훈련 및 추론에 최적화된 강력하고 확장 가능한 ND 및 NC 시리즈 가상 머신이 포함된다. 이는 엔비디아의 고급 AI 스택을 통합한 최초의 퍼블릭 클라우드로, 수만 개의 엔비디아 A100 및 H100 GPU, 엔비디아 퀀텀-2 400Gb/s 인피니밴드(Quantum-2 400Gb/s InfiniBand) 네트워킹 및 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 제품군이 플랫폼에 추가됐다.
협업 일환으로 엔비디아는 애저의 확장 가능한 가상 머신 인스턴스를 활용해 생성형 AI(Generative AI)의 발전을 연구하고 더욱 가속화할 것이다. 생성형 AI는 메가트론 튜링 NLG 530B(Megatron Turing NLG 530B)와 같은 기본 모델이 새로운 텍스트, 코드, 디지털 이미지, 비디오 또는 오디오를 생성하는 자율 학습 알고리즘의 기반이 되며 AI 분야에서 빠르게 부상하고 있는 분야이다.
양사는 또 마이크로소프트 딥스피드(DeepSpeed) 딥 러닝 최적화 소프트웨어의 활용성을 높이기 위해 협력할 예정이다. 애저 엔터프라이즈 고객에게는 애저에 최적화된 엔비디아의 전체 AI 워크플로우 및 소프트웨어 개발 키트 스택이 제공된다.
엔비디아 엔터프라이즈 컴퓨팅 부사장인 마누비르 다스(Manuvir Das)는 “AI 기술 발전과 산업 채택이 가속화되고 있다. 기초 모델의 혁신은 연구의 물결을 촉발시켰고, 신생 스타트업을 육성했으며, 새로운 엔터프라이즈 애플리케이션을 가능하게 했다. 마이크로소프트와의 협력은 연구원들과 기업들에게 AI의 혁신적인 힘을 활용할 수 있는 최첨단 AI 인프라와 소프트웨어를 제공할 것이다"라고 말했다.
스콧 거스리(Scott Guthrie) 마이크로소프트 클라우드 및 AI 그룹 수석 부사장은 "AI는 기업과 산업용 컴퓨팅 전반에 걸쳐 차세대 자동화 물결을 촉진하고 있으며, 조직이 경제적 불확실성을 다루면서 더 적은 것으로 더 많은 일을 할 수 있도록 한다. 엔비디아와의 협력을 통해 마이크로소프트 애저를 사용하는 모든 기업에 최첨단 AI 기능을 제공하며, 세계에서 가장 확장성이 뛰어난 슈퍼컴퓨터 플랫폼을 구축할 수 있었다"라고 전했다.
현재 애저 인스턴스는 엔비디아 A100 GPU와 함께 엔비디아 퀀텀 200Gb/s 인피니밴드 네트워킹을 제공한다. 미래에는 엔비디아 퀀텀-2 400Gb/s 인피니밴드 네트워킹 및 엔비디아 H100 GPU와 통합될 예정이다. 애저의 고급 컴퓨팅 클라우드 인프라, 네트워킹 및 스토리지와 결합된 이러한 AI 최적화 제품은 모든 규모의 AI 교육과 딥 러닝 추론 워크로드에 대해 확장 가능한 최고 성능을 제공한다.
해당 플랫폼은 마이크로소프트 딥스피드와 엔비디아 AI 엔터프라이즈 소프트웨어 제품군을 포함한 광범위한 AI 애플리케이션과 서비스를 지원할 예정이다.