Plateforme NVIDIA Riva Speech AI
NVIDIA Riva est un kit de développement logiciel complet accéléré par GPU qui fournit des microservices de parole et de traduction multilingues pour construire des pipelines d'IA conversationnelle en temps réel entièrement personnalisables. La plateforme inclut des capacités de reconnaissance automatique de la parole (ASR), de synthèse vocale (TTS) et de traduction automatique neuronale (NMT) de pointe qui peuvent être déployées sur tous les clouds, centres de données, appareils en périphérie et systèmes embarqués.
Composants et fonctionnalités principaux
Riva propose des modèles pré-entraînés à la pointe de la technologie, entraînés sur des milliers d'heures de données audio, supportant plusieurs langues, y compris l'anglais, l'espagnol, l'allemand, le russe, le mandarin, le français, l'hindi, le coréen et le portugais. La plateforme présente la famille de modèles Parakeet de pointe, y compris le Parakeet TDT 0.6B v2 qui atteint un taux d'erreur de mots de 6,05 % le meilleur de l'industrie et se classe n°1 sur le classement ASR de Hugging Face.
La plateforme fournit des microservices basés sur gRPC optimisés pour des cas d'utilisation en streaming à faible latence et à haut débit hors ligne, avec la capacité de s'adapter à des centaines de milliers d'utilisateurs simultanés. L'architecture de Riva est entièrement conteneurisée, permettant un déploiement et une mise à l'échelle transparents à des milliers de flux parallèles.
Performance et optimisation
Propulsé par les optimisations NVIDIA TensorRT et servi via le serveur d'inférence NVIDIA Triton, Riva offre des performances exceptionnelles avec des temps d'inférence aussi bas que 150 millisecondes par rapport à 25 secondes sur des plateformes uniquement CPU. La plateforme offre jusqu'à 12 fois les gains de performance par rapport aux générations précédentes grâce à des optimisations complètes de la pile.
Solutions d'entreprise
Riva Enterprise propose des licences d'utilisation annuelles avec le support d'experts NVIDIA, un accès prioritaire aux nouvelles fonctionnalités et des capacités de déploiement de niveau entreprise pour les organisations nécessitant des solutions d'IA vocale à l'échelle de la production. La plateforme s'intègre parfaitement avec les grands modèles de langage et la génération augmentée par récupération pour créer de puissants assistants et avatars multilingues.
Vendeur
NVIDIADescription du produit
NVIDIA® Riva est un ensemble de microservices de parole et de traduction multilingues accélérés par GPU pour construire des pipelines d'IA conversationnelle en temps réel entièrement personnalisables. Riva inclut la reconnaissance automatique de la parole (ASR), la synthèse vocale (TTS) et la traduction automatique neuronale (NMT) et est déployable dans tous les clouds, dans les centres de données, à la périphérie et sur les appareils embarqués. Avec Riva, les organisations peuvent ajouter des interfaces de parole et de traduction avec de grands modèles de langage (LLM) et une génération augmentée par récupération (RAG) pour transformer les chatbots en assistants et avatars multilingues engageants et expressifs.
Aperçu par
Adi Margolin US