Granite-4.0-Tiny-Preview est un modèle de mélange d'experts hybride à grain fin de 7 milliards de paramètres, développé par l'équipe Granite d'IBM. Affiné à partir du Granite-4.0-Tiny-Base-Preview, il utilise une combinaison de jeux de données d'instructions open-source et de données synthétiques générées en interne pour résoudre des problèmes de contexte long. Le modèle emploie des techniques telles que l'affinage supervisé et l'alignement basé sur l'apprentissage par renforcement pour améliorer ses performances dans des formats de chat structurés.
Caractéristiques clés et fonctionnalités :
- Support multilingue : Gère des tâches en anglais, allemand, espagnol, français, japonais, portugais, arabe, tchèque, italien, coréen, néerlandais et chinois.
- Capacités polyvalentes : Excelle dans la synthèse, la classification de texte, l'extraction, le questionnement-réponse, la génération augmentée par récupération (RAG), les tâches liées au code, l'appel de fonctions, les dialogues multilingues et les tâches de contexte long comme la synthèse de documents et le questionnement-réponse.
- Techniques d'entraînement avancées : Intègre l'affinage supervisé et l'apprentissage par renforcement pour une meilleure adhérence aux instructions et des capacités d'appel d'outils.
Valeur principale et solutions pour les utilisateurs :
Granite-4.0-Tiny-Preview est conçu pour gérer des tâches générales de suivi d'instructions et peut être intégré dans des assistants IA à travers divers domaines, y compris les applications commerciales. Son support multilingue et ses capacités avancées en font un outil précieux pour les développeurs cherchant à construire des solutions IA sophistiquées.