Granite-4.0-Tiny-Preview es un modelo de mezcla de expertos (MoE) de instrucción de seguimiento fino de 7 mil millones de parámetros desarrollado por el equipo Granite de IBM. Ajustado a partir del Granite-4.0-Tiny-Base-Preview, utiliza una combinación de conjuntos de datos de instrucción de código abierto y datos sintéticos generados internamente para abordar problemas de contexto largo. El modelo emplea técnicas como el ajuste fino supervisado y la alineación basada en el aprendizaje por refuerzo para mejorar su rendimiento en formatos de chat estructurados.
Características y Funcionalidad Clave:
- Soporte Multilingüe: Maneja tareas en inglés, alemán, español, francés, japonés, portugués, árabe, checo, italiano, coreano, neerlandés y chino.
- Capacidades Versátiles: Sobresale en resumen, clasificación de texto, extracción, preguntas y respuestas, generación aumentada por recuperación (RAG), tareas relacionadas con código, llamadas a funciones, diálogos multilingües y tareas de contexto largo como resumen de documentos y preguntas y respuestas.
- Técnicas de Entrenamiento Avanzadas: Incorpora ajuste fino supervisado y aprendizaje por refuerzo para mejorar la adherencia a las instrucciones y las capacidades de llamadas a herramientas.
Valor Principal y Soluciones para el Usuario:
Granite-4.0-Tiny-Preview está diseñado para manejar tareas generales de seguimiento de instrucciones y puede integrarse en asistentes de IA en varios dominios, incluidas aplicaciones empresariales. Su soporte multilingüe y capacidades avanzadas lo convierten en una herramienta valiosa para los desarrolladores que buscan construir soluciones de IA sofisticadas.