Plataforma de IA de Fala NVIDIA Riva
NVIDIA Riva é um kit de desenvolvimento de software abrangente acelerado por GPU que fornece microsserviços de fala e tradução multilíngue para construir pipelines de IA conversacional totalmente personalizáveis e em tempo real. A plataforma inclui capacidades líderes da indústria de reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e tradução automática neural (NMT) que podem ser implantadas em todas as nuvens, data centers, dispositivos de borda e sistemas embarcados.
Componentes e Recursos Principais
Riva oferece modelos pré-treinados de última geração treinados em milhares de horas de dados de áudio, suportando vários idiomas, incluindo inglês, espanhol, alemão, russo, mandarim, francês, hindi, coreano e português. A plataforma apresenta a família de modelos de ponta Parakeet, incluindo o Parakeet TDT 0.6B v2, que alcança uma taxa de erro de palavras de 6,05%, a melhor da indústria, e ocupa o 1º lugar no ranking de ASR do Hugging Face.
A plataforma fornece microsserviços baseados em gRPC otimizados tanto para casos de uso de streaming de baixa latência quanto para uso offline de alta capacidade, com a capacidade de escalar para centenas de milhares de usuários simultâneos. A arquitetura do Riva é totalmente conteinerizada, permitindo implantação e escalonamento contínuos para milhares de fluxos paralelos.
Desempenho e Otimização
Impulsionado por otimizações do NVIDIA TensorRT e servido através do NVIDIA Triton Inference Server, o Riva oferece desempenho excepcional com tempos de inferência tão baixos quanto 150 milissegundos em comparação com 25 segundos em plataformas somente de CPU. A plataforma proporciona ganhos de desempenho de até 12x em relação às gerações anteriores através de otimizações abrangentes da pilha.
Soluções Empresariais
Riva Enterprise oferece licenças de uso anual com suporte especializado da NVIDIA, acesso prioritário a novos recursos e capacidades de implantação em nível empresarial para organizações que necessitam de soluções de IA de fala em escala de produção. A plataforma se integra perfeitamente com grandes modelos de linguagem e geração aumentada por recuperação para criar assistentes e avatares multilíngues poderosos.
Vendedor
NVIDIADescrição do Produto
NVIDIA® Riva é um conjunto de microsserviços de fala e tradução multilíngue acelerados por GPU para construir pipelines de IA conversacional em tempo real totalmente personalizáveis. Riva inclui reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e tradução automática neural (NMT) e pode ser implantado em todas as nuvens, em data centers, na borda e em dispositivos incorporados. Com o Riva, as organizações podem adicionar interfaces de fala e tradução com grandes modelos de linguagem (LLMs) e geração aumentada por recuperação (RAG) para transformar chatbots em assistentes e avatares multilíngues envolventes e expressivos.
Visão Geral por
Adi Margolin US