  # Meilleur Petits modèles de langage (SLMs) - Page 2

  *By [Jeffrey Lin](https://research.g2.com/insights/author/jeffrey-lin)*

   Les petits modèles de langage (SLM) sont des modèles de langage IA optimisés pour l&#39;efficacité, la spécialisation et le déploiement dans des environnements à ressources limitées, conçus pour comprendre, interpréter et générer des sorties semblables à celles des humains tout en maintenant une efficacité computationnelle, des temps d&#39;inférence rapides et une flexibilité de déploiement sur des appareils périphériques, des plateformes mobiles et des systèmes hors ligne.

### Capacités principales des logiciels SLM

Pour être inclus dans la catégorie des Petits Modèles de Langage (SLM), un produit doit :

- Offrir un modèle de langage compact optimisé pour l&#39;efficacité des ressources et des tâches spécialisées, capable de comprendre et de générer des sorties semblables à celles des humains
- Contenir 10 milliards de paramètres ou moins, le distinguant des LLM qui dépassent ce seuil
- Fournir une flexibilité de déploiement pour des environnements à ressources limitées tels que des appareils périphériques, des plateformes mobiles ou du matériel informatique limité
- Être conçu pour une optimisation spécifique à la tâche grâce à un ajustement fin, une spécialisation de domaine ou une formation ciblée pour des applications commerciales spécifiques
- Maintenir une efficacité computationnelle avec des temps d&#39;inférence rapides, des exigences de mémoire réduites et une consommation d&#39;énergie inférieure par rapport aux LLM

### Cas d&#39;utilisation courants des logiciels SLM

Les développeurs et les organisations utilisent les SLM là où les LLM seraient trop gourmands en ressources ou coûteux à déployer. Les cas d&#39;utilisation courants incluent :

- Déployer des capacités linguistiques spécialisées sur des appareils périphériques ou des plateformes mobiles sans dépendance au cloud
- Exécuter des tâches d&#39;IA spécifiques à un domaine telles que la classification de documents, la reconnaissance d&#39;entités nommées ou le résumé avec des ressources de calcul minimales
- Ajuster finement des modèles compacts pour des applications commerciales ciblées nécessitant un déploiement d&#39;IA rentable et rapide

### Comment les SLM diffèrent des autres outils

Les SLM diffèrent des [grands modèles de langage (LLM)](https://www.g2.com/categories/large-language-models-llms) principalement par l&#39;échelle, avec des tailles de paramètres allant généralement de quelques millions à 10 milliards, comparé aux LLM qui vont de 10 milliards à des trillions de paramètres. Alors que les LLM se concentrent sur des tâches linguistiques générales et complètes à travers plusieurs domaines, les SLM sont conçus pour des applications ciblées qui privilégient l&#39;efficacité des ressources et la spécialisation. Les SLM diffèrent également des [chatbots IA](https://www.g2.com/categories/ai-chatbots), qui fournissent la plateforme orientée utilisateur plutôt que les modèles fondamentaux eux-mêmes.

### Perspectives de G2 sur les logiciels SLM

Selon les tendances de catégorie sur G2, la flexibilité de déploiement et la performance spécifique à la tâche se démarquent comme des capacités remarquables. Les coûts d&#39;inférence plus bas et le temps de déploiement plus rapide pour des cas d&#39;utilisation spécialisés se distinguent comme les principaux avantages de l&#39;adoption des SLM.




  
## How Many Petits modèles de langage (SLMs) Products Does G2 Track?
**Total Products under this Category:** 40

### Category Stats (May 2026)
- **Average Rating**: 4.48/5 (↑0.01 vs Apr 2026)
- **New Reviews This Quarter**: 1
- **Buyer Segments**: Petite entreprise 50% │ Marché intermédiaire 25% │ Entreprise 25%
- **Top Trending Product**: StableLM (+0.03)
*Last updated: May 29, 2026*

  
## How Does G2 Rank Petits modèles de langage (SLMs) Products?

**Pourquoi vous pouvez faire confiance aux classements de logiciels de G2:**

- 30 Analystes et experts en données
- 0+ Avis authentiques
- 40+ Produits
- Classements impartiaux

Les classements de logiciels de G2 sont basés sur des avis d'utilisateurs vérifiés, une modération rigoureuse et une méthodologie de recherche cohérente maintenue par une équipe d'analystes et d'experts en données. Chaque produit est mesuré selon les mêmes critères transparents, sans placement payant ni influence du vendeur. Bien que les avis reflètent des expériences utilisateur réelles, qui peuvent être subjectives, ils offrent un aperçu précieux de la performance des logiciels entre les mains de professionnels. Ensemble, ces contributions alimentent le G2 Score, une manière standardisée de comparer les outils dans chaque catégorie.

  
## Which Petits modèles de langage (SLMs) Is Best for Your Use Case?


  
  ## What Are the Top-Rated Petits modèles de langage (SLMs) Products in 2026?
### 1. [Ministral 3B 24.10](https://www.g2.com/fr/products/ministral-3b-24-10/reviews)
  Codestral est un modèle d&#39;IA générative à poids ouvert développé par Mistral AI, spécialement conçu pour les tâches de génération de code. Il aide les développeurs à écrire et à interagir avec le code via un point d&#39;accès API unifié pour les instructions et les complétions. Compétent dans plus de 80 langages de programmation — y compris Python, Java, C, C++, JavaScript et Bash — Codestral prend également en charge des langages moins courants comme Swift et Fortran, ce qui le rend polyvalent dans divers environnements de codage. Caractéristiques clés et fonctionnalités : - Support multilingue : Formé sur un ensemble de données diversifié englobant plus de 80 langages de programmation, assurant une adaptabilité à différents projets de développement. - Complétion et génération de code : Capable de compléter des fonctions de codage, d&#39;écrire des tests et de remplir du code partiel en utilisant un mécanisme de remplissage au milieu, rationalisant ainsi le processus de codage. - Intégration avec les environnements de développement : Accessible via un point d&#39;accès dédié (`codestral.mistral.ai`), facilitant une intégration transparente dans divers environnements de développement intégrés (IDE). Valeur principale et solutions pour les utilisateurs : Codestral améliore considérablement la productivité des développeurs en automatisant les tâches de codage routinières, réduisant le temps et les efforts nécessaires pour la complétion de code et la génération de tests. Son support linguistique étendu et sa compréhension avancée du code minimisent les erreurs et les bugs, permettant aux développeurs de se concentrer sur la résolution de problèmes complexes et l&#39;innovation. En s&#39;intégrant harmonieusement dans les flux de travail existants, Codestral démocratise le codage, rendant le développement assisté par IA avancé accessible à un plus large éventail d&#39;utilisateurs.



**Who Is the Company Behind Ministral 3B 24.10?**

- **Vendeur:** [Mistral](https://www.g2.com/fr/sellers/mistral)
- **Année de fondation:** 2023
- **Emplacement du siège social:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (182,737 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/mistralai/ (787 employés sur LinkedIn®)



### 2. [Ministral 8B 24.10](https://www.g2.com/fr/products/ministral-8b-24-10/reviews)
  Codestral est un modèle d&#39;IA générative à poids ouvert développé par Mistral AI, spécialement conçu pour les tâches de génération de code. Il aide les développeurs à écrire et à interagir avec le code via un point d&#39;accès API unifié pour les instructions et les complétions. Compétent dans plus de 80 langages de programmation, y compris Python, Java, C, C++, JavaScript et Bash, Codestral prend également en charge des langages moins courants comme Swift et Fortran, ce qui le rend polyvalent dans divers environnements de codage. Caractéristiques clés et fonctionnalités : - Support multilingue : Formé sur un ensemble de données diversifié englobant plus de 80 langages de programmation, assurant une adaptabilité à différents projets de développement. - Complétion et génération de code : Capable de compléter des fonctions de codage, d&#39;écrire des tests et de remplir du code partiel en utilisant un mécanisme de remplissage au milieu, rationalisant ainsi le processus de codage. - Intégration avec les environnements de développement : Accessible via un point d&#39;accès dédié (`codestral.mistral.ai`), facilitant une intégration transparente dans divers environnements de développement intégrés (IDE). Valeur principale et solutions pour les utilisateurs : Codestral améliore considérablement la productivité des développeurs en automatisant les tâches de codage routinières, réduisant le temps et les efforts nécessaires pour la complétion de code et la génération de tests. Son support linguistique étendu et sa compréhension avancée du code minimisent les erreurs et les bugs, permettant aux développeurs de se concentrer sur la résolution de problèmes complexes et l&#39;innovation. En s&#39;intégrant harmonieusement dans les flux de travail existants, Codestral démocratise le codage, rendant le développement assisté par l&#39;IA avancée accessible à un plus large éventail d&#39;utilisateurs.



**Who Is the Company Behind Ministral 8B 24.10?**

- **Vendeur:** [Mistral](https://www.g2.com/fr/sellers/mistral)
- **Année de fondation:** 2023
- **Emplacement du siège social:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (182,737 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/mistralai/ (787 employés sur LinkedIn®)



### 3. [Mistral Saba](https://www.g2.com/fr/products/mistral-saba/reviews)
  Codestral est un modèle d&#39;IA générative à poids ouvert développé par Mistral AI, spécialement conçu pour les tâches de génération de code. Il aide les développeurs à écrire et interagir avec le code via un point d&#39;accès API unifié pour les instructions et les complétions. Compétent dans plus de 80 langages de programmation — y compris Python, Java, C, C++, JavaScript et Bash — Codestral prend également en charge des langages moins courants comme Swift et Fortran, ce qui le rend polyvalent dans divers environnements de codage. Caractéristiques clés et fonctionnalités : - Support multi-langues : Entraîné sur un ensemble de données diversifié englobant plus de 80 langages de programmation, assurant une adaptabilité à différents projets de développement. - Complétion et génération de code : Capable de compléter des fonctions de codage, d&#39;écrire des tests et de remplir du code partiel grâce à un mécanisme de remplissage au milieu, rationalisant ainsi le processus de codage. - Intégration avec les environnements de développement : Accessible via un point d&#39;accès dédié (`codestral.mistral.ai`), facilitant une intégration transparente dans divers environnements de développement intégrés (IDE). Valeur principale et solutions pour les utilisateurs : Codestral améliore considérablement la productivité des développeurs en automatisant les tâches de codage routinières, réduisant le temps et l&#39;effort nécessaires pour la complétion de code et la génération de tests. Son support linguistique étendu et sa compréhension avancée du code minimisent les erreurs et les bugs, permettant aux développeurs de se concentrer sur la résolution de problèmes complexes et l&#39;innovation. En s&#39;intégrant harmonieusement dans les flux de travail existants, Codestral démocratise le codage, rendant le développement assisté par IA avancé accessible à un plus large éventail d&#39;utilisateurs.



**Who Is the Company Behind Mistral Saba?**

- **Vendeur:** [Mistral](https://www.g2.com/fr/sellers/mistral)
- **Année de fondation:** 2023
- **Emplacement du siège social:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (182,737 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/mistralai/ (787 employés sur LinkedIn®)



### 4. [Mistral Small 3.2](https://www.g2.com/fr/products/mistral-small-3-2/reviews)
  Codestral est un modèle d&#39;IA générative à poids ouvert développé par Mistral AI, spécialement conçu pour les tâches de génération de code. Il aide les développeurs à écrire et interagir avec le code via un point d&#39;accès API unifié pour les instructions et les complétions. Compétent dans plus de 80 langages de programmation — y compris Python, Java, C, C++, JavaScript et Bash — Codestral prend également en charge des langages moins courants comme Swift et Fortran, ce qui le rend polyvalent dans divers environnements de codage. Caractéristiques clés et fonctionnalités : - Support multilingue : Formé sur un ensemble de données diversifié englobant plus de 80 langages de programmation, assurant une adaptabilité à différents projets de développement. - Complétion et génération de code : Capable de compléter des fonctions de codage, d&#39;écrire des tests et de remplir du code partiel grâce à un mécanisme de remplissage au milieu, rationalisant ainsi le processus de codage. - Intégration avec les environnements de développement : Accessible via un point d&#39;accès dédié (`codestral.mistral.ai`), facilitant une intégration transparente dans divers environnements de développement intégrés (IDE). Valeur principale et solutions pour les utilisateurs : Codestral améliore considérablement la productivité des développeurs en automatisant les tâches de codage routinières, réduisant le temps et l&#39;effort nécessaires pour la complétion de code et la génération de tests. Son support linguistique étendu et sa compréhension avancée du code minimisent les erreurs et les bugs, permettant aux développeurs de se concentrer sur la résolution de problèmes complexes et l&#39;innovation. En s&#39;intégrant harmonieusement dans les flux de travail existants, Codestral démocratise le codage, rendant le développement assisté par IA avancé accessible à un plus large éventail d&#39;utilisateurs.



**Who Is the Company Behind Mistral Small 3.2?**

- **Vendeur:** [Mistral](https://www.g2.com/fr/sellers/mistral)
- **Année de fondation:** 2023
- **Emplacement du siège social:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (182,737 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/mistralai/ (787 employés sur LinkedIn®)



### 5. [MPT-7B](https://www.g2.com/fr/products/mpt-7b/reviews)
  MPT-7B est un transformateur de type décodeur préentraîné à partir de zéro sur 1T de tokens de texte et de code en anglais. Ce modèle a été entraîné par MosaicML. MPT-7B fait partie de la famille des modèles MosaicPretrainedTransformer (MPT), qui utilisent une architecture de transformateur modifiée optimisée pour un entraînement et une inférence efficaces. Ces changements architecturaux incluent des implémentations de couches optimisées pour la performance et l&#39;élimination des limites de longueur de contexte en remplaçant les embeddings positionnels par l&#39;Attention avec Biais Linéaires (ALiBi). Grâce à ces modifications, les modèles MPT peuvent être entraînés avec une efficacité de débit élevée et une convergence stable. Les modèles MPT peuvent également être servis efficacement avec les pipelines standard de HuggingFace et le FasterTransformer de NVIDIA.



**Who Is the Company Behind MPT-7B?**

- **Vendeur:** [MosaicML](https://www.g2.com/fr/sellers/mosaicml)
- **Année de fondation:** 2021
- **Emplacement du siège social:** San Francisco, US
- **Page LinkedIn®:** https://www.linkedin.com/company/databricks (13,148 employés sur LinkedIn®)



### 6. [NVIDIA Nemotron Nano 9b](https://www.g2.com/fr/products/nvidia-nemotron-nano-9b/reviews)
  NVIDIA Nemotron-Nano-9B-v2 est un modèle de langage compact et open-source conçu pour offrir des capacités de raisonnement et d&#39;agentic de haute performance. Utilisant une architecture hybride Mamba-Transformer, il traite efficacement des séquences de long contexte allant jusqu&#39;à 128 000 tokens, le rendant adapté aux tâches complexes nécessitant une compréhension contextuelle étendue. Le modèle prend en charge plusieurs langues, dont l&#39;anglais, l&#39;allemand, le français, l&#39;italien, l&#39;espagnol et le japonais, et excelle dans les tâches de suivi d&#39;instructions et de génération de code. Caractéristiques clés et fonctionnalités : - Architecture hybride : Combine des couches d&#39;espace d&#39;état Mamba-2 avec des couches d&#39;attention Transformer, améliorant le débit et la précision dans les tâches de raisonnement. - Traitement efficace de long contexte : Capable de gérer des séquences allant jusqu&#39;à 128 000 tokens sur un seul GPU NVIDIA A10G, facilitant le raisonnement évolutif de long contexte. - Support multilingue : Entraîné sur des données couvrant 15 langues et 43 langages de programmation, permettant une grande fluidité multilingue et en codage. - Fonction de raisonnement activable : Permet aux utilisateurs de contrôler le processus de raisonnement du modèle à l&#39;aide de commandes simples comme &quot;/think&quot; ou &quot;/no\_think&quot;, équilibrant précision et vitesse de réponse. - Contrôle du budget de raisonnement : Introduit un mécanisme de &quot;budget de réflexion&quot;, permettant aux développeurs de définir le nombre de tokens utilisés pendant le processus de raisonnement, optimisant pour la latence ou le coût. Valeur principale et solutions pour les utilisateurs : NVIDIA Nemotron-Nano-9B-v2 répond au besoin de modèles de langage efficaces et performants capables de gérer un contexte étendu et des tâches de raisonnement complexes. Son architecture hybride et ses fonctionnalités avancées fournissent aux développeurs et chercheurs un outil polyvalent pour construire des applications d&#39;IA nécessitant une compréhension approfondie et un traitement rapide de données textuelles à grande échelle. La nature open-source du modèle et sa licence permissive facilitent une adoption et une personnalisation larges, permettant aux utilisateurs de déployer des solutions d&#39;IA sophistiquées dans divers domaines.



**Who Is the Company Behind NVIDIA Nemotron Nano 9b?**

- **Vendeur:** [NVIDIA](https://www.g2.com/fr/sellers/nvidia)
- **Année de fondation:** 1993
- **Emplacement du siège social:** Santa Clara, CA
- **Twitter:** @nvidia (2,519,450 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/3608/ (46,612 employés sur LinkedIn®)
- **Propriété:** NVDA



### 7. [Phi 3.5 mini](https://www.g2.com/fr/products/phi-3-5-mini/reviews)
  Phi-3.5-mini est un modèle de langage léger et à la pointe de la technologie développé par Microsoft, conçu pour offrir des capacités de raisonnement de haute qualité dans une architecture compacte. S&#39;appuyant sur les ensembles de données utilisés pour Phi-3, il se concentre sur des données de très haute qualité, riches en raisonnement, y compris des données synthétiques et des sites web publics filtrés. Le modèle prend en charge une longueur de contexte de 128K tokens, lui permettant de gérer efficacement des entrées étendues. Grâce à des processus d&#39;amélioration rigoureux tels que l&#39;ajustement fin supervisé, l&#39;optimisation de la politique proximale et l&#39;optimisation directe des préférences, Phi-3.5-mini assure une adhérence précise aux instructions et des mesures de sécurité robustes. Caractéristiques clés et fonctionnalités : - Gestion de contexte étendu : Prend en charge jusqu&#39;à 128K tokens, facilitant les tâches nécessitant le traitement de longs documents ou conversations. - Raisonnement de haute qualité : Entraîné sur des données riches en raisonnement pour améliorer les capacités de résolution de problèmes et d&#39;analyse. - Performance efficace : Offre des résultats à la pointe de la technologie dans un modèle de taille compacte, le rendant adapté aux environnements à ressources limitées. - Mesures de sécurité robustes : Intègre des techniques d&#39;optimisation avancées pour garantir des sorties sûres et fiables. Valeur principale et solutions pour les utilisateurs : Phi-3.5-mini répond au besoin d&#39;un modèle de langage puissant mais efficace, capable de gérer de longues longueurs de contexte et des tâches de raisonnement complexes. Sa taille compacte permet un déploiement dans des environnements avec des ressources informatiques limitées sans compromettre la performance. En se concentrant sur des données de haute qualité et riches en raisonnement, il fournit aux utilisateurs des sorties précises et contextuellement pertinentes, le rendant idéal pour des applications en compréhension du langage naturel, génération de contenu et IA conversationnelle.



**Who Is the Company Behind Phi 3.5 mini?**

- **Vendeur:** [Microsoft](https://www.g2.com/fr/sellers/microsoft)
- **Année de fondation:** 1975
- **Emplacement du siège social:** Redmond, Washington
- **Twitter:** @microsoft (13,101,622 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/microsoft/ (227,697 employés sur LinkedIn®)
- **Propriété:** MSFT



### 8. [Phi 3 mini 4k](https://www.g2.com/fr/products/phi-3-mini-4k/reviews)
  Le Phi-3 Mini-4K-Instruct est un modèle de langage léger et à la pointe de la technologie développé par Microsoft, comportant 3,8 milliards de paramètres. Il fait partie de la famille de modèles Phi-3 et est conçu pour prendre en charge une longueur de contexte de 4 000 tokens. Entraîné sur une combinaison de données synthétiques et de sites web publics filtrés, le modèle met l&#39;accent sur un contenu de haute qualité et riche en raisonnement. Des améliorations post-entraînement, y compris un ajustement fin supervisé et une optimisation directe des préférences, ont été appliquées pour améliorer l&#39;adhérence aux instructions et les mesures de sécurité. Le Phi-3 Mini-4K-Instruct démontre des performances robustes à travers des benchmarks évaluant le bon sens, la compréhension du langage, les mathématiques, le codage, la compréhension de longs contextes et le raisonnement logique, le positionnant comme un modèle de premier plan parmi ceux ayant moins de 13 milliards de paramètres. Caractéristiques clés et fonctionnalités : - Architecture compacte : Avec 3,8 milliards de paramètres, le modèle offre un équilibre entre performance et efficacité des ressources. - Longueur de contexte étendue : Prend en charge le traitement de jusqu&#39;à 4 000 tokens, permettant de gérer efficacement des entrées plus longues. - Données d&#39;entraînement de haute qualité : Utilise un ensemble de données sélectionnées combinant des données synthétiques et du contenu web filtré, se concentrant sur des informations de haute qualité et intensives en raisonnement. - Suivi des instructions amélioré : Les processus post-entraînement, y compris l&#39;ajustement fin supervisé et l&#39;optimisation directe des préférences, améliorent la capacité du modèle à suivre les instructions avec précision. - Performance polyvalente : Excelle dans diverses tâches telles que le raisonnement de bon sens, la compréhension du langage, la résolution de problèmes mathématiques, le codage et le raisonnement logique. Valeur principale et solutions pour les utilisateurs : Le Phi-3 Mini-4K-Instruct répond au besoin d&#39;un modèle de langage puissant mais efficace, adapté aux environnements avec des ressources mémoire et computationnelles limitées. Sa taille compacte et ses capacités de contexte étendu le rendent idéal pour les applications nécessitant une faible latence et de fortes capacités de raisonnement. En offrant des performances de pointe dans un format efficace en ressources, il permet aux développeurs et chercheurs d&#39;intégrer des fonctionnalités avancées de compréhension et de génération de langage dans leurs applications sans les contraintes associées aux modèles plus grands.



**Who Is the Company Behind Phi 3 mini 4k?**

- **Vendeur:** [Microsoft](https://www.g2.com/fr/sellers/microsoft)
- **Année de fondation:** 1975
- **Emplacement du siège social:** Redmond, Washington
- **Twitter:** @microsoft (13,101,622 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/microsoft/ (227,697 employés sur LinkedIn®)
- **Propriété:** MSFT



### 9. [Phi 3 small 128k](https://www.g2.com/fr/products/phi-3-small-128k/reviews)
  Le Phi-3-Small-128K-Instruct est un modèle de langage de pointe de 7 milliards de paramètres développé par Microsoft. Il fait partie de la famille Phi-3 et est conçu pour gérer une longueur de contexte allant jusqu&#39;à 128 000 tokens. Entraîné sur une combinaison de données synthétiques et de contenu web filtré disponible publiquement, le modèle met l&#39;accent sur des propriétés de haute qualité et riches en raisonnement. Des processus post-entraînement, y compris un ajustement fin supervisé et une optimisation directe des préférences, ont été appliqués pour améliorer ses capacités de suivi des instructions et ses mesures de sécurité. Le Phi-3-Small-128K-Instruct démontre des performances robustes sur des benchmarks testant le bon sens, la compréhension du langage, les mathématiques, le codage, la compréhension de longs contextes et le raisonnement logique, le positionnant de manière compétitive parmi les modèles de tailles similaires et plus grandes. Caractéristiques clés et fonctionnalités : - Gestion étendue du contexte : Prend en charge une longueur de contexte allant jusqu&#39;à 128 000 tokens, permettant le traitement d&#39;entrées longues et complexes. - Données d&#39;entraînement de haute qualité : Utilise un mélange de données synthétiques et de données web sélectionnées, en se concentrant sur un contenu riche en raisonnement et en qualité. - Techniques avancées de post-entraînement : Intègre un ajustement fin supervisé et une optimisation directe des préférences pour améliorer l&#39;adhérence aux instructions et la sécurité. - Performance polyvalente : Excelle dans les tâches nécessitant du bon sens, la compréhension du langage, le raisonnement mathématique, la compétence en codage et l&#39;analyse logique. Valeur principale et solutions pour les utilisateurs : Le modèle Phi-3-Small-128K-Instruct offre aux développeurs et chercheurs un outil puissant pour construire des systèmes d&#39;IA nécessitant un raisonnement profond et la capacité de traiter des informations contextuelles étendues. Son architecture efficace le rend adapté aux environnements contraints en mémoire et en calcul, tandis que ses performances solides dans diverses tâches de raisonnement répondent aux besoins des applications exigeant des niveaux élevés de compréhension et d&#39;analyse. En fournissant une base robuste pour les fonctionnalités d&#39;IA générative, le modèle accélère le développement d&#39;applications avancées de langage et multimodales.



**Who Is the Company Behind Phi 3 small 128k?**

- **Vendeur:** [Microsoft](https://www.g2.com/fr/sellers/microsoft)
- **Année de fondation:** 1975
- **Emplacement du siège social:** Redmond, Washington
- **Twitter:** @microsoft (13,101,622 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/microsoft/ (227,697 employés sur LinkedIn®)
- **Propriété:** MSFT



### 10. [Phi 3 Small 8k](https://www.g2.com/fr/products/phi-3-small-8k/reviews)
  Une variante plus petite du modèle Phi-3 avec un contexte étendu de 8 000 tokens et des capacités d&#39;instruction.



**Who Is the Company Behind Phi 3 Small 8k?**

- **Vendeur:** [Microsoft](https://www.g2.com/fr/sellers/microsoft)
- **Année de fondation:** 1975
- **Emplacement du siège social:** Redmond, Washington
- **Twitter:** @microsoft (13,101,622 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/microsoft/ (227,697 employés sur LinkedIn®)
- **Propriété:** MSFT



### 11. [Phi 4 mini](https://www.g2.com/fr/products/phi-4-mini/reviews)
  Le Phi-3 Mini-4K-Instruct est un modèle de langage léger et à la pointe de la technologie développé par Microsoft, comportant 3,8 milliards de paramètres. Il fait partie de la famille de modèles Phi-3 et est conçu pour prendre en charge une longueur de contexte de 4 000 tokens. Entraîné sur une combinaison de données synthétiques et de sites web publics filtrés, le modèle met l&#39;accent sur un contenu de haute qualité et riche en raisonnement. Des améliorations post-formation, y compris un ajustement fin supervisé et une optimisation directe des préférences, ont été appliquées pour améliorer l&#39;adhérence aux instructions et les mesures de sécurité. Le Phi-3 Mini-4K-Instruct démontre des performances robustes à travers des benchmarks évaluant le bon sens, la compréhension du langage, les mathématiques, le codage, la compréhension de longs contextes et le raisonnement logique, le positionnant comme un modèle de premier plan parmi ceux ayant moins de 13 milliards de paramètres. Caractéristiques clés et fonctionnalités : - Architecture compacte : Avec 3,8 milliards de paramètres, le modèle offre un équilibre entre performance et efficacité des ressources. - Longueur de contexte étendue : Prend en charge le traitement de jusqu&#39;à 4 000 tokens, permettant de gérer efficacement des entrées plus longues. - Données d&#39;entraînement de haute qualité : Utilise un ensemble de données sélectionnées combinant des données synthétiques et du contenu web filtré, se concentrant sur des informations de haute qualité et intensives en raisonnement. - Suivi des instructions amélioré : Les processus post-formation, y compris l&#39;ajustement fin supervisé et l&#39;optimisation directe des préférences, améliorent la capacité du modèle à suivre les instructions avec précision. - Performance polyvalente : Excelle dans diverses tâches telles que le raisonnement de bon sens, la compréhension du langage, la résolution de problèmes mathématiques, le codage et le raisonnement logique. Valeur principale et solutions pour les utilisateurs : Le Phi-3 Mini-4K-Instruct répond au besoin d&#39;un modèle de langage puissant mais efficace, adapté aux environnements avec des ressources mémoire et computationnelles limitées. Sa taille compacte et ses capacités de contexte étendu le rendent idéal pour les applications nécessitant une faible latence et de fortes capacités de raisonnement. En offrant des performances de pointe dans un format efficace en ressources, il permet aux développeurs et chercheurs d&#39;intégrer des fonctionnalités avancées de compréhension et de génération de langage dans leurs applications sans les contraintes associées aux modèles plus grands.



**Who Is the Company Behind Phi 4 mini?**

- **Vendeur:** [Microsoft](https://www.g2.com/fr/sellers/microsoft)
- **Année de fondation:** 1975
- **Emplacement du siège social:** Redmond, Washington
- **Twitter:** @microsoft (13,101,622 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/microsoft/ (227,697 employés sur LinkedIn®)
- **Propriété:** MSFT



### 12. [Phi 4 mini reasoning](https://www.g2.com/fr/products/phi-4-mini-reasoning/reviews)
  Phi-4-mini-reasoning est un modèle de langage compact basé sur un transformateur développé par Microsoft, spécifiquement optimisé pour les tâches de raisonnement mathématique. Avec 3,8 milliards de paramètres et une prise en charge d&#39;une longueur de contexte de 128K tokens, il offre des capacités de résolution de problèmes de haute qualité, étape par étape, dans des environnements où les ressources informatiques ou la latence sont limitées. Affiné à l&#39;aide de données mathématiques synthétiques générées par un modèle plus avancé, Phi-4-mini-reasoning excelle dans les scénarios de résolution de problèmes multi-étapes et intensifs en logique, ce qui le rend adapté à des applications telles que la génération de preuves formelles, le calcul symbolique et les problèmes de mots avancés. Caractéristiques clés et fonctionnalités : - Optimisé pour le raisonnement mathématique : Conçu pour gérer des problèmes mathématiques complexes et multi-étapes avec une logique structurée et une pensée analytique. - Architecture compacte : Équilibre la capacité de raisonnement avec l&#39;efficacité, permettant le déploiement dans des environnements à ressources limitées. - Longueur de contexte étendue : Prend en charge jusqu&#39;à 128K tokens, permettant une rétention complète du contexte à travers les étapes de résolution de problèmes. - Affiné avec des données synthétiques : Entraîné sur un ensemble diversifié de plus d&#39;un million de problèmes mathématiques, améliorant ses performances de raisonnement. Valeur principale et résolution de problèmes : Phi-4-mini-reasoning répond au besoin d&#39;un raisonnement mathématique efficace et de haute qualité dans des scénarios où les ressources informatiques sont limitées. Sa taille compacte et ses performances optimisées le rendent idéal pour les applications éducatives, les systèmes de tutorat intégrés et les déploiements sur des appareils de périphérie ou mobiles. En maintenant le contexte à travers plusieurs étapes et en appliquant une logique structurée, il fournit des solutions précises et fiables pour des problèmes mathématiques complexes, améliorant ainsi les expériences d&#39;apprentissage et soutenant des tâches analytiques avancées.



**Who Is the Company Behind Phi 4 mini reasoning?**

- **Vendeur:** [Microsoft](https://www.g2.com/fr/sellers/microsoft)
- **Année de fondation:** 1975
- **Emplacement du siège social:** Redmond, Washington
- **Twitter:** @microsoft (13,101,622 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/microsoft/ (227,697 employés sur LinkedIn®)
- **Propriété:** MSFT



### 13. [StableLM 2 1.6b](https://www.g2.com/fr/products/stablelm-2-1-6b/reviews)
  StableLM 2 1.6B est un modèle de langage à 1,6 milliard de paramètres, uniquement décodeur, développé par Stability AI. Il est pré-entraîné sur 2 trillions de tokens provenant de divers ensembles de données multilingues et de code sur deux époques. Le modèle est conçu pour générer un texte cohérent et contextuellement pertinent, le rendant adapté à un large éventail de tâches de traitement du langage naturel. Caractéristiques clés et fonctionnalités : - Architecture de décodeur Transformer : StableLM 2 1.6B utilise une architecture de transformateur uniquement décodeur, similaire à LLaMA, avec des modifications spécifiques pour améliorer les performances. - Embeddings de position rotatifs : Intègre des embeddings de position rotatifs appliqués aux 25 % premiers des dimensions d&#39;embedding de tête, améliorant le débit. - Normalisation de couche : Utilise LayerNorm avec des termes de biais appris, différent de RMSNorm, pour stabiliser l&#39;entraînement et améliorer la convergence. - Configuration de biais : Supprime tous les termes de biais des réseaux feed-forward et des couches d&#39;auto-attention multi-têtes, à l&#39;exception des biais des projections de requête, clé et valeur, optimisant l&#39;efficacité computationnelle. - Tokenisation avancée : Utilise le tokenizer Arcade100k, un tokenizer BPE étendu à partir de tiktoken.cl100k\_base d&#39;OpenAI, avec une séparation des chiffres en tokens individuels pour améliorer la compréhension numérique. Valeur principale et solutions pour les utilisateurs : StableLM 2 1.6B offre une solution robuste pour les développeurs et chercheurs cherchant un modèle de langage puissant capable de générer du texte de haute qualité dans diverses applications. Son pré-entraînement étendu sur des ensembles de données diversifiés assure une polyvalence dans la gestion de plusieurs langues et codes, le rendant idéal pour des tâches telles que la création de contenu, la génération de code et la traduction multilingue. L&#39;architecture et les méthodologies d&#39;entraînement du modèle offrent un équilibre entre performance et efficacité computationnelle, répondant au besoin de modèles de langage évolutifs et efficaces dans la communauté de l&#39;IA.



**Who Is the Company Behind StableLM 2 1.6b?**

- **Vendeur:** [Stability AI](https://www.g2.com/fr/sellers/stability-ai)
- **Emplacement du siège social:** London
- **Twitter:** @StabilityAI (255,902 abonnés Twitter)
- **Page LinkedIn®:** https://www.linkedin.com/company/stability-ai (188 employés sur LinkedIn®)



### 14. [step-1 8k](https://www.g2.com/fr/products/step-1-8k/reviews)
  Step-1 8k est un modèle de langage à grande échelle développé par StepFun, conçu pour comprendre et générer du texte en langage naturel dans divers domaines. Avec une longueur de contexte de 8 000 tokens, il peut traiter des entrées et sorties substantielles, ce qui le rend adapté à des tâches telles que la création de contenu, la communication multilingue, la réponse à des questions et le raisonnement logique. De plus, Step-1 8k présente de solides capacités mathématiques et de codage, soutenant des applications dans le calcul scientifique et le développement de logiciels. Caractéristiques clés et fonctionnalités : - Traitement de contexte étendu : Gère jusqu&#39;à 8 000 tokens, permettant une compréhension et une génération complètes de textes longs. - Tâches linguistiques polyvalentes : Excelle dans la génération de contenu, la traduction, la synthèse et l&#39;IA conversationnelle. - Compétence mathématique et en codage : Capable d&#39;effectuer des calculs complexes et de générer des extraits de code, aidant dans les tâches scientifiques et de programmation. - Rapport coût-performance élevé : Offre un équilibre entre performance et coût, le rendant accessible pour diverses applications. Valeur principale et solutions pour les utilisateurs : Step-1 8k améliore la productivité en automatisant et en rationalisant les tâches liées au langage. Sa capacité à traiter un contexte étendu assure des sorties cohérentes et contextuellement pertinentes, bénéficiant aux professionnels dans la création de contenu, le développement de logiciels et l&#39;analyse de données. En intégrant Step-1 8k, les utilisateurs peuvent obtenir des résultats efficaces et précis dans leurs domaines respectifs.



**Who Is the Company Behind step-1 8k?**

- **Vendeur:** [StepFun](https://www.g2.com/fr/sellers/stepfun)
- **Emplacement du siège social:** N/A
- **Page LinkedIn®:** https://www.linkedin.com/company/stepfun-ai/ (35 employés sur LinkedIn®)



### 15. [Sutra](https://www.g2.com/fr/products/two-ai-sutra/reviews)
  Modèle Multilingue Mixture-of-Experts prenant en charge plus de 50 langues avec de meilleures performances MMLU et des hallucinations réduites grâce à l&#39;utilisation de connaissances en ligne.



**Who Is the Company Behind Sutra?**

- **Vendeur:** [Two AI](https://www.g2.com/fr/sellers/two-ai)
- **Année de fondation:** 2021
- **Emplacement du siège social:** Silicon Valley, US
- **Page LinkedIn®:** https://www.linkedin.com/company/2wo (49 employés sur LinkedIn®)




    ## What Is Petits modèles de langage (SLMs)?
  [Logiciel d&#39;IA générative](https://www.g2.com/fr/categories/generative-ai)

  
    
