Escala para dezenas de milhares de superchips Blackwell Grace usando a rede NVIDIA mais avançada, software NVIDIA Full-Stack AI e recursos de armazenamento de até 576 GPUs Blackwell conectadas como uma só com NVIDIA NVLink
Especialistas em sistemas NVIDIA aceleram a implantação para infraestrutura de IA imediata
SAN JOSE, Califórnia – GTC – 18 de março de 2024 – A NVIDIA anuncia seu supercomputador de IA de última geração – o NVIDIA DGX SuperPOD™ equipado com NVIDIA GB200 Grace Blackwell Superchips – para processar modelos de trilhões de parâmetros com tempo de atividade constante para cargas de trabalho de inferência e treinamento de IA generativa em superescala.
Apresentando uma nova arquitetura em escala de rack, altamente eficiente e com refrigeração líquida, o novo DGX SuperPOD é construído com os sistemas NVIDIA DGX™ GB200 e fornece 11,5 exaflops de supercomputação de IA com precisão FP4 e 240 terabytes de memória rápida – escalonando para mais com racks adicionais.
Cada sistema DGX GB200 apresenta 36 superchips NVIDIA GB200 – que incluem 36 CPUs NVIDIA Grace e 72 GPUs NVIDIA Blackwell – conectados como um supercomputador por meio do NVIDIA NVLink® de quinta geração. Os superchips GB200 oferecem um aumento de desempenho de até 30 vezes em comparação com a GPU NVIDIA H100 Tensor Core para grandes cargas de trabalho de inferência de modelos de linguagem (LLM).
“Os supercomputadores NVIDIA DGX AI são as fábricas da revolução industrial da IA”, afirma Jensen Huang, fundador e CEO da NVIDIA. “O novo DGX SuperPOD combina os mais recentes avanços em computação acelerada, rede e software da NVIDIA para permitir que todas as empresas, setores e países refinem e gerem sua própria IA.”
O DGX SuperPOD com tecnologia Grace Blackwell apresenta oito ou mais sistemas DGX GB200 e pode ser dimensionado para dezenas de milhares de superchips GB200 conectados via NVIDIA Quantum InfiniBand. Para obter um enorme espaço de memória compartilhada para alimentar modelos de AI de última geração, os clientes podem implementar uma configuração que conecta as 576 GPUs Blackwell em oito sistemas DGX GB200 conectados via NVLink.
Nova arquitetura DGX SuperPOD em escala de rack para a era da IA generativa
O novo DGX SuperPOD com sistemas DGX GB200 apresenta uma estrutura de computação unificada. Além do NVIDIA NVLink de quinta geração, a estrutura inclui DPUs NVIDIA BlueField®-3 e será compatível com a rede NVIDIA Quantum-X800 InfiniBand, anunciada separadamente hoje. Essa arquitetura fornece até 1.800 gigabytes por segundo de largura de banda para cada GPU na plataforma.
Além disso, a tecnologia NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™ de quarta geração fornece 14,4 teraflops de computação em rede, um aumento de 4 vezes na arquitetura DGX SuperPOD de última geração em comparação com a geração anterior.
Arquitetura turnkey emparelhada com software avançado para um tempo de atividade sem precedentes
O novo DGX SuperPOD é um supercomputador de IA completo, em escala de data center, que se integra ao armazenamento de alto desempenho de parceiros certificados pela NVIDIA para atender às demandas de cargas de trabalho de IA generativas. Cada um é construído, cabeado e testado na fábrica para acelerar drasticamente a implantação nos data centers dos clientes.
O DGX SuperPOD com tecnologia Grace Blackwell apresenta recursos inteligentes de gerenciamento preditivo para monitorar continuamente milhares de pontos de dados em hardware e software para prever e interceptar fontes de tempo de inatividade e ineficiência, economizando tempo, energia e custos de computação.
O software pode identificar áreas de preocupação e planejar a manutenção, ajustar com flexibilidade os recursos de computação e salvar e retomar automaticamente os trabalhos para evitar tempo de inatividade, mesmo sem a presença de administradores de sistema.
Se o software detectar a necessidade de substituição de um componente, o cluster ativará a capacidade de espera para garantir que o trabalho seja concluído a tempo. Qualquer substituição de hardware necessária pode ser programada para evitar tempo de inatividade não planejado.
“Essa última geração de supercomputador possibilitará o processamento de cargas de trabalho de inferência e treinamento de IA generativa, contribuindo no desempenho do mercado como um todo, em diversos setores”, ressalta Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Sistemas NVIDIA DGX B200 promovem a supercomputação de IA para os setores
A NVIDIA também apresentou o sistema NVIDIA DGX B200, uma plataforma unificada de supercomputação de IA para treinamento, ajuste fino e inferência de modelos de IA.
O DGX B200 é a sexta geração de projetos DGX tradicionais montados em rack e resfriados a ar, usados pelos setores em todo o mundo. O novo sistema DGX B200 com arquitetura Blackwell inclui oito GPUs NVIDIA B200 Tensor Core e dois processadores Intel® Xeon® de 5ª geração. Os clientes também podem montar o DGX SuperPOD usando sistemas DGX B200 para criar Centros de Excelência em IA que podem potencializar o trabalho de grandes equipes de desenvolvedores que executam muitos trabalhos diferentes.
Os sistemas DGX B200 incluem o recurso de precisão FP4 na nova arquitetura Blackwell, proporcionando até 144 petaflops de desempenho de IA, um enorme 1,4 TB de memória de GPU e 64 TB/s de largura de banda de memória. Isso proporciona uma inferência em tempo real 15 vezes mais rápida para modelos de trilhões de parâmetros em comparação com a geração anterior.
Os sistemas DGX B200 incluem redes avançadas com oito NICs NVIDIA ConnectX™-7 e duas DPUs BlueField-3. Elas fornecem até 400 gigabits por segundo de largura de banda por conexão, proporcionando rápido desempenho de IA com as plataformas de rede NVIDIA Quantum-2 InfiniBand e NVIDIA Spectrum™-X Ethernet.
Software e suporte especializado para ampliar a produção de IA
Todas as plataformas NVIDIA DGX incluem o software NVIDIA AI Enterprise para desenvolvimento e implantação de nível empresarial. Os clientes da DGX podem acelerar seu trabalho com os modelos de base, frameworks, kits de ferramentas e novos microsserviços NVIDIA NIM pré-treinados incluídos na plataforma de software.
Os especialistas em NVIDIA DGX e os parceiros selecionados da NVIDIA certificados para oferecer suporte às plataformas DGX auxiliam os clientes em todas as etapas da implantação, para que eles possam mover rapidamente a IA para a produção. Quando os sistemas estiverem operacionais, os especialistas em DGX continuarão a dar suporte aos clientes na otimização de seus pipelines e infraestrutura de IA.
Disponibilidade
Espera-se que os sistemas NVIDIA DGX SuperPOD com DGX GB200 e DGX B200 estejam disponíveis ainda este ano nos parceiros globais da NVIDIA.
Para obter mais informações, assista a um replay da palestra do GTC ou visite o estande da NVIDIA na GTC, realizada no Centro de Convenções de San Jose até 21 de março.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de infraestrutura de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://www.nvidia.com/pt-br/.
Acesse também:
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Instagram: @NVIDIABrasil
Certas declarações neste comunicado de imprensa, incluindo, entre outras, declarações sobre: benefícios, impacto, desempenho, recursos e disponibilidade de produtos e tecnologias da NVIDIA, incluindo NVIDIA DGX SuperPOD, NVIDIA GB200 Grace Blackwell Superchips, sistemas NVIDIA DGX GB200, Superchips NVIDIA GB200, CPUs NVIDIA Grace, GPUs NVIDIA Blackwell, NVIDIA NVLink, GPU NVIDIA H100 Tensor Core, DPUs NVIDIA BlueField-3, rede NVIDIA Quantum-X800 InfiniBand, tecnologia NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP), sistema NVIDIA DGX B200 , GPUs NVIDIA B200 Tensor Core, placas de rede NVIDIA ConnectX-7, NVIDIA Quantum-2 InfiniBand, NVIDIA Spectrum-X Ethernet, software NVIDIA AI Enterprise e NVIDIA NIM; o novo DGX SuperPOD que permite a cada empresa, indústria e país refinar e gerar a sua própria IA; e o uso ou adoção de nossos produtos, plataformas e tecnologias por terceiros e os benefícios e impactos dos mesmos são declarações prospectivas que estão sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas. Factores importantes que podem fazer com que os resultados reais difiram materialmente incluem: condições económicas globais; nossa dependência de terceiros para fabricar, montar, embalar e testar nossos produtos; o impacto do desenvolvimento tecnológico e da concorrência; desenvolvimento de novos produtos e tecnologias ou melhorias em nossos produtos e tecnologias existentes; aceitação no mercado dos nossos produtos ou dos produtos dos nossos parceiros; defeitos de projeto, fabricação ou software; mudanças nas preferências ou demandas dos consumidores; mudanças nos padrões e interfaces da indústria; perda inesperada de desempenho de nossos produtos ou tecnologias quando integrados em sistemas; bem como outros fatores detalhados periodicamente nos relatórios mais recentes que a NVIDIA arquiva com a Securities and Exchange Commission, ou SEC, incluindo, entre outros, seu relatório anual no Formulário 10-K e relatórios trimestrais no Formulário 10-Q . Cópias dos relatórios arquivados na SEC são publicadas no site da empresa e estão disponíveis gratuitamente na NVIDIA. Estas declarações prospectivas não são garantias de desempenho futuro e referem-se apenas à data deste documento e, exceto conforme exigido por lei, a NVIDIA se isenta de qualquer obrigação de atualizar essas declarações prospectivas para refletir eventos ou circunstâncias futuras.
Muitos dos produtos e recursos aqui descritos permanecem em vários estágios e serão oferecidos quando e se estiverem disponíveis. As declarações acima não pretendem ser e não devem ser interpretadas como um compromisso, promessa ou obrigação legal, e o desenvolvimento, lançamento e prazo de quaisquer recursos ou funcionalidades descritos para nossos produtos estão sujeitos a alterações e permanecem de responsabilidade exclusiva. critério da NVIDIA. A NVIDIA não será responsável pela falha na entrega ou atraso na entrega de qualquer um dos produtos, recursos ou funções aqui estabelecidos.
© 2024 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo NVIDIA, BlueField, ConnectX, DGX, NVIDIA DGX SuperPOD, NVIDIA Spectrum, NVLink e Scalable Hierarchical Aggregation and Reduction Protocol (SHARP) são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos podem ser marcas registradas das respectivas empresas às quais estão associados. Recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso prévio.