Llama 4 Maverick 17B Instruct (128E) est un modèle de langage multimodal à haute capacité développé par Meta, conçu pour gérer à la fois des entrées textuelles et d'images tout en générant des sorties textuelles et de code multilingues dans 12 langues. Construit sur une architecture de mélange d'experts (MoE) avec 128 experts, il active 17 milliards de paramètres par passage avant sur un total de 400 milliards, assurant un traitement efficace. Optimisé pour les tâches de vision-langage, Maverick est ajusté par instruction pour exhiber un comportement de type assistant, effectuer un raisonnement d'image et faciliter les interactions multimodales à usage général. Il présente une fusion précoce pour la multimodalité native et prend en charge une fenêtre de contexte allant jusqu'à 1 million de tokens. Entraîné sur environ 22 trillions de tokens provenant d'un mélange de données publiques, sous licence et de la plateforme Meta, avec une coupure de connaissance en août 2024, Maverick a été publié le 5 avril 2025 sous la licence communautaire Llama 4. Il est bien adapté pour les applications de recherche et commerciales nécessitant une compréhension multimodale avancée et un débit élevé du modèle.
Caractéristiques clés et fonctionnalités :
- Support d'entrée multimodale : Traite à la fois des entrées textuelles et d'images, permettant des capacités de compréhension et de génération complètes.
- Sortie multilingue : Génère des sorties textuelles et de code dans 12 langues, y compris l'arabe, l'anglais, le français, l'allemand, l'hindi, l'indonésien, l'italien, le portugais, l'espagnol, le tagalog, le thaï et le vietnamien.
- Architecture de mélange d'experts : Utilise 128 experts avec 17 milliards de paramètres actifs par passage avant, optimisant l'efficacité et la performance computationnelles.
- Ajusté par instruction : Affiné pour un comportement de type assistant, le raisonnement d'image et les interactions multimodales à usage général, améliorant son applicabilité à travers diverses tâches.
- Fenêtre de contexte étendue : Prend en charge une longueur de contexte allant jusqu'à 1 million de tokens, facilitant le traitement d'entrées étendues et complexes.
Valeur principale et solutions pour les utilisateurs :
Llama 4 Maverick 17B Instruct répond à la demande croissante de modèles d'IA avancés capables de comprendre et de générer du contenu à travers plusieurs modalités et langues. Ses capacités multimodales et multilingues en font un outil inestimable pour les développeurs et les chercheurs travaillant sur des applications nécessitant une compréhension nuancée du langage, le traitement d'images et la génération de code. La nature ajustée par instruction du modèle garantit qu'il peut effectuer une large gamme de tâches avec une grande précision, allant de servir d'assistant intelligent à exécuter des tâches de raisonnement complexes. Son architecture efficace et sa fenêtre de contexte étendue permettent de gérer des entrées de données à grande échelle, le rendant adapté à la fois pour les applications de recherche et commerciales qui exigent un débit élevé et une compréhension multimodale avancée.