Granite-4.0-Tiny-Preview é um modelo de instrução híbrido de mistura de especialistas (MoE) de 7 bilhões de parâmetros desenvolvido pela equipe Granite da IBM. Ajustado a partir do Granite-4.0-Tiny-Base-Preview, utiliza uma combinação de conjuntos de dados de instrução de código aberto e dados sintéticos gerados internamente para resolver problemas de contexto longo. O modelo emprega técnicas como ajuste fino supervisionado e alinhamento baseado em aprendizado por reforço para melhorar seu desempenho em formatos de chat estruturados.
Características e Funcionalidades Principais:
- Suporte Multilíngue: Lida com tarefas em inglês, alemão, espanhol, francês, japonês, português, árabe, tcheco, italiano, coreano, holandês e chinês.
- Capacidades Versáteis: Destaca-se em sumarização, classificação de texto, extração, perguntas e respostas, geração aumentada por recuperação (RAG), tarefas relacionadas a código, chamadas de função, diálogos multilíngues e tarefas de contexto longo como sumarização de documentos e perguntas e respostas.
- Técnicas Avançadas de Treinamento: Incorpora ajuste fino supervisionado e aprendizado por reforço para melhor adesão às instruções e capacidades de chamada de ferramentas.
Valor Principal e Soluções para Usuários:
Granite-4.0-Tiny-Preview é projetado para lidar com tarefas gerais de seguimento de instruções e pode ser integrado em assistentes de IA em vários domínios, incluindo aplicações empresariais. Seu suporte multilíngue e capacidades avançadas o tornam uma ferramenta valiosa para desenvolvedores que buscam construir soluções de IA sofisticadas.