LAS VEGAS – AWS re:Invent – 28 de novembro de 2023 – A NVIDIA anuncia um microsserviço de IA generativa que permite que as empresas conectem grandes modelos de linguagem personalizados a dados corporativos para fornecer respostas altamente precisas para suas aplicações de IA.
NVIDIA NeMo™ Retriever – uma nova oferta na família NVIDIA NeMo de frameworks e ferramentas para criar, personalizar e implantar modelos de IA generativa – ajuda as organizações a aprimorar suas aplicações de IA generativa com recursos de geração aumentada de recuperação (RAG) de nível empresarial.
Como um microsserviço de recuperação semântica de nível empresarial, o NeMo Retriever ajuda as aplicações de IA generativa a fornecer respostas mais precisas por meio de algoritmos otimizados pela NVIDIA. Os desenvolvedores que usam o microsserviço podem conectar suas aplicações de IA aos dados comerciais, onde quer que eles residam, em nuvens e data centers. Ele adiciona recursos RAG otimizados pela NVIDIA às fundições de IA e faz parte da plataforma de software NVIDIA AI Enterprise, disponível no AWS Marketplace.
Cadence, Dropbox, SAP e ServiceNow estão entre os pioneiros que trabalham com a NVIDIA para criar recursos RAG prontos para produção em suas aplicações e serviços personalizados de IA generativa.
“As aplicações de IA geradora com recursos RAG são a próxima aplicação matadora da empresa”, afirma Jensen Huang, fundador e CEO da NVIDIA. “Com o NVIDIA NeMo Retriever, os desenvolvedores podem criar chatbots, copilotos e ferramentas de ferramentas de resumo que podem acessar seus dados comerciais para transformar a produtividade com inteligência de IA geradora precisa e valiosa.”
Líderes globais aprimoram a precisão do LLM com o NeMo Retriever
A Cadence, líder em design de sistemas eletrônicos, atende empresas de computação em hiperescala, comunicações 5G, automotivo, móvel, aeroespacial, consumidor e mercados de saúde. Ela está trabalhando com a NVIDIA para desenvolver recursos RAG para aplicações de IA generativa no design de eletrônicos industriais.
“A IA generativa apresenta abordagens inovadoras para atender às necessidades dos clientes, como ferramentas para descobrir possíveis falhas no início do processo de design”, afirma Anirudh Devgan, presidente e CEO da Cadence. “Nossos pesquisadores estão trabalhando com a NVIDIA para usar o NeMo Retriever para aumentar ainda mais a precisão e a relevância das aplicações de IA generativa para revelar problemas e ajudar os clientes a obter produtos de alta qualidade para o mercado mais rapidamente.”
Decifrando o código para aplicações precisas de IA generativa
Ao contrário dos kits de ferramentas RAG de código aberto, o NeMo Retriever oferece suporte à IA generativa pronta para produção com modelos comercialmente viáveis, estabilidade de API, patches de segurança e suporte empresarial.
Os algoritmos otimizados pela NVIDIA geram os resultados de maior precisão nos modelos de incorporação do Retriever. Os modelos de incorporação otimizados capturam as relações entre as palavras, permitindo que os LLMs processem e analisem dados textuais.
Com o NeMo Retriever, as empresas podem conectar seus LLMs a várias fontes de dados e bases de conhecimento, para que os usuários possam interagir facilmente com os dados e receber respostas precisas e atualizadas usando prompts simples de conversação. As empresas que usam aplicações com o Retriever podem permitir que os usuários tenham acesso seguro a informações que abrangem várias modalidades de dados, como texto, PDFs, imagens e vídeos.
As empresas podem usar o NeMo Retriever para obter resultados mais precisos com menos treinamento, acelerando o tempo de lançamento no mercado e apoiando a eficiência energética no desenvolvimento de aplicações de IA generativa.
“Com a precisão do NeMo Retriever, será possível acelerar o desenvolvimento de aplicações de IA generativa. Isso trará benefícios para as indústrias de diversos setores”, destaca Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Implantação confiável, simples e segura com o NVIDIA AI Enterprise
As empresas podem implantar aplicações com o NeMo Retriever para serem executados durante a inferência na computação acelerada da NVIDIA em praticamente qualquer data center ou nuvem. O NVIDIA AI Enterprise suporta inferência acelerada e de alto desempenho com NVIDIA NeMo, NVIDIA Triton Inference Server™, NVIDIA TensorRT™, NVIDIA TensorRT-LLM e outros softwares de IA da NVIDIA.
Para maximizar o desempenho da inferência, os desenvolvedores podem executar seus modelos nos superchips NVIDIA GH200 Grace Hopper Superchips com o software TensorRT-LLM.
Disponibilidade
Os desenvolvedores podem se inscrever para obter acesso antecipado ao NVIDIA NeMo Retriever.
Sobre a NVIDIA
Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de computação full-stack com soluções em escala de data center que estão revolucionando o setor. Mais informações em: https://blog.nvidia.com.br/.
Acesse também:
Site oficial da NVIDIA no Brasil: https://www.nvidia.com/pt-br/
Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Este conteúdo foi distribuído pela plataforma SALA DA NOTÍCIA e elaborado/criado pelo Assessor(a):
U | U
U