As empresas podem usar microsserviços para acelerarem o processamento de dados, personalização de LLM, inferência, geração aumentada por recuperação e proteções
Adotados por um amplo ecossistema de IA que inclui os principais provedores de plataformas de aplicações: Cadence, CrowdStrike, SAP, ServiceNow, entre outros
SAN JOSE, Califórnia — GTC — 18 de março de 2024 — A NVIDIA anuncia dezenas de microsserviços de IA generativa de nível corporativo que as empresas podem usar para criarem e implantarem aplicações personalizadas em suas próprias plataformas enquanto detêm propriedade e controle plenos de suas propriedades intelectuais.
Criado com base na plataforma NVIDIA CUDA®, o catálogo de microsserviços nativos da nuvem inclui microsserviços NVIDIA NIM™ para inferência otimizada em mais de duas dúzias de modelos de IA populares da NVIDIA e de seu ecossistema de parceiros. Além disso, ferramentas, bibliotecas e kits de desenvolvimento de software acelerados da NVIDIA agora podem ser acessados como microsserviços NVIDIA CUDA-X™ para geração aumentada por recuperação (RAG), proteções, processamento de dados, HPC e muito mais. A NVIDIA também anuncia separadamente mais de duas dúzias de microsserviços para assistência médica NIM e CUDA-X.
A seleção de microsserviços com curadoria acrescenta uma nova camada à plataforma de computação full-stack da NVIDIA. Essa camada conecta o ecossistema de IA de desenvolvedores de modelos, provedores de plataformas e empresas a um caminho padronizado para execução de modelos de IA personalizados otimizados para a base instalada CUDA da NVIDIA de centenas de milhões de GPUs em nuvens, data centers, estações de trabalho e PCs.
Entre os primeiros a acessarem os novos microsserviços de IA generativas da NVIDIA disponíveis no NVIDIA AI Enterprise 5.0, estão os principais provedores de aplicações, dados e plataformas de segurança cibernética, incluindo Adobe, Cadence, CrowdStrike, Getty Images, SAP, ServiceNow e Shutterstock.
“As plataformas empresariais estabelecidas estão sentadas em uma mina de ouro de dados que podem ser transformados em copilotos da IA generativa”, ressalta Jensen Huang, fundador e CEO da NVIDIA. “Criados com o ecossistema de nossos parceiros, esses microsserviços de IA em contêineres são os componentes para que empresas de todos os setores se tornem empresas de IA.”
Microsserviços de inferência de NIM aceleram as implantações de semanas para minutos
Os microsserviços de NIM fornecem contêineres pré-construídos equipados com o software de inferência da NVIDIA – incluindo Triton Inference Server™ e TensorRT™-LLM – que permitem que os desenvolvedores reduzam os tempos de implantação de semanas para minutos.
Eles fornecem APIs padrão do setor para domínios como linguagem, fala e descoberta de medicamentos para permitir que os desenvolvedores criem aplicações de IA rapidamente usando seus dados proprietários hospedados com segurança em suas próprias infraestruturas. Essas aplicações podem se expandir sob demanda, fornecendo flexibilidade e desempenho para a execução de IA generativa na produção em plataformas de computação aceleradas pela NVIDIA.
Os microsserviços NIM fornecem o contêiner de IA de produção mais rápido e de melhor desempenho para a implantação de modelos da NVIDIA, A121, Adept, Cohere, Getty Images, e Shutterstock, bem como modelos abertos da Google, Hugging Face, Meta, Microsoft, Mistral AI e Stability AI.
ServiceNow anuncia que está usando NIM para desenvolver e implantar novos copilotos específicos de domínio e outras aplicações generativas de IA de forma mais rápida e econômica.
Os clientes poderão acessar os microsserviços NIM do Amazon SageMaker, Google Kubernetes Engine e Microsoft Azure AI e integrá-los a estruturas de IA populares como Deepset, LangChain e LlamaIndex.
“Os microsserviços de IA generativa surgem como uma inovação ágil e personalizada. Por meio dessa tecnologia, os desenvolvedores têm o poder de moldar o futuro das aplicações empresariais e poderão auxiliar as companhias na revolução da IA”, afirma Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Microsserviços CUDA-X para RAG, processamento de dados, proteções e HPC
Os microsserviços CUDA-X fornecem componentes de ponta a ponta para preparação, personalização e treinamento de dados para acelerar o desenvolvimento de IA de produção em todos os setores.
Para acelerar a adoção da IA, as empresas podem usar microsserviços CUDA-X, incluindo NVIDIA Riva, para IA personalizável de fala e tradução, NVIDIA cuOpt™, para otimização de roteamento, além de NVIDIA Earth-2, para simulações climáticas e meteorológicas de alta resolução.
Os microsserviços NeMo Retriever™ permitem que os desenvolvedores vinculem suas aplicações de IA a seus dados de negócios – incluindo texto, imagens e visualizações como gráficos de barras, de linhas e de pizza – para a geração de respostas contextualmente relevantes e altamente precisas. Com esses recursos de RAG, as empresas podem oferecer mais dados a copilotos, chatbots e ferramentas de produtividade de IA generativa para elevar a precisão e os insights.
Outros microsserviços NVIDIA NeMo serão disponibilizados em breve para desenvolvimento de modelos personalizados. Eles incluem NVIDIA NeMo Curator, para a criação de conjuntos de dados limpos para treinamento e recuperação, NVIDIA NeMo Customizer, para ajuste de LLMs com dados específicos de domínio, NVIDIA NeMo Evaluator, para análise de desempenho de modelos de IA, bem como NVIDIA NeMo Guardrails para LLMs.
O ecossistema potencializa plataformas empresariais com microsserviços de IA generativa
Além de liderarem fornecedores de aplicações, os provedores de plataformas de computação, infraestrutura e dados de todo o ecossistema da NVIDIA estão trabalhando com microsserviços da NVIDIA para levar a IA generativa para as empresas.
Os principais provedores de plataformas de dados, incluindo Box, Cloudera, Cohesity, Datastax, Dropbox e NetApp, estão trabalhando com microsserviços NVIDIA para ajudarem os clientes a otimizarem seus pipelines RAG e a integrarem seus dados proprietários a aplicações de IA generativa. Snowflake usa o NeMo Retriever para dominar dados empresariais e usá-los na criação de aplicações de IA.
As empresas podem implantar microsserviços da NVIDIA incluídos no NVIDIA AI Enterprise 5.0 na infraestrutura que preferirem, como as principais nuvens Amazon Web Services (AWS), Google Cloud, Azure e Oracle Cloud Infrastructure.
Os microsserviços da NVIDIA também são compatíveis com mais de 400 NVIDIA-Certified Systems™, incluindo servidores e estações de trabalho da Cisco, Dell Technologies, Hewlett Packard Enterprise (HPE), HP, Lenovo e Supermicro. Em um anúncio a parte, a HPE informa a disponibilidade da solução de computação empresarial da HPE para IA generativa, com integração planejada do NIM e de modelos-base de IA NVIDIA ao software de IA da HPE.
Os microsserviços NVIDIA AI Enterprise estão chegando a plataformas de software de infraestrutura, incluindo VMware Private AI Foundation com NVIDIA. Red Hat OpenShift oferece suporte aos microsserviços NVIDIA NIM para ajudar as empresas a integrarem mais facilmente recursos de IA generativa em suas aplicações com recursos otimizados para segurança, conformidade e controles. A Canonical está adicionando suporte ao Charmed Kubernetes para microsserviços da NVIDIA por meio do NVIDIA AI Enterprise.
O ecossistema da NVIDIA de centenas de parceiros de IA e MLOps, incluindo Abridge, Anyscale, Dataiku, DataRobot, Glean, H2O.ai, Securiti AI, Scale.ai, OctoAI e Weights & Biases, está acrescentando suporte para microsserviços da NVIDIA por meio do NVIDIA AI Enterprise.
Apache Lucene, Datastax, Faiss, Kinetica, Milvus, Redis e Weaviate estão entre os provedores de pesquisas de vetor trabalhando com microsserviços NVIDIA NeMo Retriever para capacitar recursos de RAG responsivos para empresas.
Disponibilidade
Os desenvolvedores podem experimentar os microsserviços da NVIDIA em ai.nvidia.com gratuitamente. As empresas podem implantar microsserviços NIM de nível de produção com o NVIDIA AI Enterprise 5.0 executado em NVIDIA-Certified Systems e nas principais plataformas de nuvem.
Para mais informações, assista à reapresentação da palestra de abertura de Huang no GTC e visite o estande da NVIDIA no GTC, que acontece no San Jose Convention Center até 21 de março.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de infraestrutura de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://www.nvidia.com/pt-br/.
Acesse também:
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Instagram: @NVIDIABrasil
Certas declarações neste comunicado de imprensa, incluindo, entre outras, declarações sobre: benefícios, impacto, desempenho, recursos e disponibilidade de produtos e tecnologias da NVIDIA, incluindo a plataforma NVIDIA CUDA, microsserviços NVIDIA NIM, microsserviços NVIDIA CUDA-X, NVIDIA AI Enterprise 5.0, software de inferência NVIDIA incluindo Triton Inference Server e TensorRT-LLM, NVIDIA Riva, NVIDIA cuOpt, NVIDIA Earth-2, NeMo Retriever, NVIDIA NeMo Curator, NVIDIA NeMo Customizer, NVIDIA NeMo Evaluator, NVIDIA NeMo Guardrails, modelos NVIDIA AI Foundation e microsserviços NVIDIA AI Enterprise; e as plataformas empresariais estabelecidas, posicionadas em uma mina de ouro de dados que podem ser transformados em copilotos de IA generativa, são declarações prospectivas que estão sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas. Os fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes incluem: condições econômicas globais; a confiança da NVIDIA em terceiros para manufaturarem, montarem, empacotarem e testarem produtos NVIDIA; o impacto do desenvolvimento tecnológico e da concorrência; o desenvolvimento de novos produtos e tecnologias NVIDIA ou melhorias nos já existentes; a aceitação de produtos NVIDIA ou de produtos de parceiros NVIDIA no mercado; defeitos de software, projeto ou manufatura; mudanças nas preferências ou nas demandas do consumidor; mudanças nas interfaces e nos padrões do setor; perda inesperada de desempenho de produtos ou tecnologias NVIDIA quando integrados a sistemas; e outros fatores detalhados regularmente nos relatórios mais atuais apresentados pela NVIDIA à Comissão de Valores Mobiliários e Câmbio (SEC – Securities and Exchange Commission), incluindo, mas não limitados a, seu relatório anual no Formulário 10-K e os relatórios trimestrais no Formulário 10-Q. As cópias dos relatórios apresentados à SEC são publicadas no site da empresa e estão disponíveis na NVIDIA gratuitamente. Essas declarações prospectivas não são garantias de desempenho futuro e são baseadas em fatos até esta data, e, salvo por determinação legal, a NVIDIA isenta-se de qualquer obrigação de atualizar tais declarações para refletirem circunstâncias ou eventos futuros.
Muitos dos produtos e recursos aqui descritos estão em vários estágios de desenvolvimento e serão oferecidos quando e se estiverem disponíveis. As declarações acima não pretendem ser e não devem ser interpretadas como um compromisso, promessa ou obrigação legal, e o desenvolvimento, lançamento e prazo de quaisquer recursos ou funcionalidades descritos para nossos produtos estão sujeitos a alterações e permanecem de responsabilidade exclusiva da NVIDIA. A NVIDIA não terá nenhuma responsabilidade por falha na entrega ou atraso na entrega de qualquer um dos produtos, recursos ou funções aqui estabelecidos.
© 2024 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo NVIDIA, CUDA, CUDA-X, NVIDIA NeMo, NVIDIA NeMo Retriever, NVIDIA NIM, NVIDIA Triton Inference Server, NVIDIA-Certified Systems e TensorRT são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos podem ser marcas comerciais das respectivas empresas com as quais estão associadas. Os recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso.