
  # Migliori Piccoli Modelli Linguistici (SLM) - Pagina 2

  *By [Jeffrey Lin](https://research.g2.com/insights/author/jeffrey-lin)*


   I modelli di linguaggio piccoli (SLM) sono modelli di linguaggio AI ottimizzati per l&#39;efficienza, la specializzazione e il dispiegamento in ambienti con risorse limitate, progettati per comprendere, interpretare e generare output simili a quelli umani mantenendo l&#39;efficienza computazionale, tempi di inferenza rapidi e flessibilità di dispiegamento su dispositivi edge, piattaforme mobili e sistemi offline.

### Capacità principali del software SLM

Per qualificarsi per l&#39;inclusione nella categoria dei modelli di linguaggio piccoli (SLM), un prodotto deve:

- Offrire un modello di linguaggio compatto ottimizzato per l&#39;efficienza delle risorse e compiti specializzati, capace di comprendere e generare output simili a quelli umani
- Contenere 10 miliardi di parametri o meno, distinguendosi dagli LLM che superano questa soglia
- Fornire flessibilità di dispiegamento per ambienti con risorse limitate come dispositivi edge, piattaforme mobili o hardware di calcolo limitato
- Essere progettato per l&#39;ottimizzazione specifica del compito attraverso il fine-tuning, la specializzazione del dominio o l&#39;addestramento mirato per applicazioni aziendali specifiche
- Mantenere l&#39;efficienza computazionale con tempi di inferenza rapidi, requisiti di memoria ridotti e un consumo energetico inferiore rispetto agli LLM

### Casi d&#39;uso comuni per il software SLM

Sviluppatori e organizzazioni utilizzano gli SLM dove gli LLM sarebbero troppo intensivi in termini di risorse o costosi da dispiegare. I casi d&#39;uso comuni includono:

- Dispiegare capacità linguistiche specializzate su dispositivi edge o piattaforme mobili senza dipendenza dal cloud
- Eseguire compiti AI specifici del dominio come la classificazione dei documenti, il riconoscimento delle entità nominate o il riassunto con risorse di calcolo minime
- Effettuare il fine-tuning di modelli compatti per applicazioni aziendali mirate che richiedono un dispiegamento AI economico e veloce

### Come gli SLM differiscono da altri strumenti

Gli SLM differiscono dai [modelli di linguaggio grandi (LLM)](https://www.g2.com/categories/large-language-models-llms) principalmente per la scala, con dimensioni dei parametri che vanno da pochi milioni a 10 miliardi, rispetto agli LLM che vanno da 10 miliardi a trilioni di parametri. Mentre gli LLM si concentrano su compiti linguistici completi e generali attraverso più domini, gli SLM sono progettati per applicazioni mirate che danno priorità all&#39;efficienza delle risorse e alla specializzazione. Gli SLM differiscono anche dai [chatbot AI](https://www.g2.com/categories/ai-chatbots), che forniscono la piattaforma rivolta all&#39;utente piuttosto che i modelli fondamentali stessi.

### Approfondimenti da G2 sul software SLM

Basandosi sulle tendenze di categoria su G2, la flessibilità di dispiegamento e le prestazioni specifiche del compito si distinguono come capacità eccezionali. Costi di inferenza inferiori e tempi di dispiegamento più rapidi per casi d&#39;uso specializzati si distinguono come benefici primari dell&#39;adozione degli SLM.




  
  
## How Many Piccoli Modelli Linguistici (SLM) Products Does G2 Track?
**Total Products under this Category:** 40

### Category Stats (Jun 2026)
- **Average Rating**: 4.48/5 The average rating of products in this category, based on all submitted ratings
- **New Reviews This Quarter**: 1
- **Buyer Segments**: Piccola Impresa 50% │ Mercato Medio 25% │ Impresa 25% Represents the distribution of reviewers across all products in this category.

*Last updated: June 10, 2026*

  
## How Does G2 Rank Piccoli Modelli Linguistici (SLM) Products?

**Perché puoi fidarti delle classifiche software di G2:**

- 30 Analisti ed Esperti di Dati
- 0+ Recensioni autentiche
- 40+ Prodotti
- Classifiche Imparziali

Le classifiche software di G2 si basano su recensioni verificate degli utenti, moderazione rigorosa e una metodologia di ricerca coerente mantenuta da un team di analisti ed esperti di dati. Ogni prodotto è misurato utilizzando gli stessi criteri trasparenti, senza posizionamenti a pagamento o influenze dei venditori. Sebbene le recensioni riflettano esperienze reali degli utenti, che possono essere soggettive, offrono preziose informazioni su come il software si comporta nelle mani dei professionisti. Insieme, questi input alimentano il G2 Score, un modo standardizzato per confrontare gli strumenti all'interno di ogni categoria.

  
## Which Piccoli Modelli Linguistici (SLM) Is Best for Your Use Case?


  
  ## What Are the Top-Rated Piccoli Modelli Linguistici (SLM) Products in 2026?
### 1. [Ministral 3B 24.10](https://www.g2.com/it/products/ministral-3b-24-10/reviews)
  Codestral è un modello di intelligenza artificiale generativa a peso aperto sviluppato da Mistral AI, progettato specificamente per compiti di generazione di codice. Assiste gli sviluppatori nella scrittura e nell&#39;interazione con il codice attraverso un endpoint API unificato per istruzioni e completamenti. Proficiente in oltre 80 linguaggi di programmazione, tra cui Python, Java, C, C++, JavaScript e Bash, Codestral supporta anche linguaggi meno comuni come Swift e Fortran, rendendolo versatile in vari ambienti di codifica. Caratteristiche e Funzionalità Chiave: - Supporto Multilingue: Addestrato su un dataset diversificato che comprende più di 80 linguaggi di programmazione, garantendo adattabilità a diversi progetti di sviluppo. - Completamento e Generazione di Codice: Capace di completare funzioni di codifica, scrivere test e riempire codice parziale utilizzando un meccanismo di riempimento nel mezzo, semplificando così il processo di codifica. - Integrazione con Ambienti di Sviluppo: Accessibile tramite un endpoint dedicato (`codestral.mistral.ai`), facilitando l&#39;integrazione senza soluzione di continuità in vari Ambienti di Sviluppo Integrati (IDE). Valore Primario e Soluzioni per gli Utenti: Codestral migliora significativamente la produttività degli sviluppatori automatizzando i compiti di codifica di routine, riducendo il tempo e lo sforzo richiesti per il completamento del codice e la generazione di test. Il suo ampio supporto linguistico e la comprensione avanzata del codice minimizzano errori e bug, permettendo agli sviluppatori di concentrarsi sulla risoluzione di problemi complessi e sull&#39;innovazione. Integrandosi senza problemi nei flussi di lavoro esistenti, Codestral democratizza la codifica, rendendo lo sviluppo avanzato assistito dall&#39;IA accessibile a una gamma più ampia di utenti.



**Who Is the Company Behind Ministral 3B 24.10?**

- **Venditore:** [Mistral](https://www.g2.com/it/sellers/mistral)
- **Anno di Fondazione:** 2023
- **Sede centrale:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (185,240 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/mistralai/ (1,114 dipendenti su LinkedIn®)



### 2. [Ministral 8B 24.10](https://www.g2.com/it/products/ministral-8b-24-10/reviews)
  Codestral è un modello di intelligenza artificiale generativa a peso aperto sviluppato da Mistral AI, progettato specificamente per compiti di generazione di codice. Assiste gli sviluppatori nella scrittura e nell&#39;interazione con il codice attraverso un endpoint API unificato per istruzioni e completamenti. Proficiente in oltre 80 linguaggi di programmazione, tra cui Python, Java, C, C++, JavaScript e Bash, Codestral supporta anche linguaggi meno comuni come Swift e Fortran, rendendolo versatile in vari ambienti di codifica. Caratteristiche e Funzionalità Chiave: - Supporto Multilingue: Addestrato su un dataset diversificato che comprende più di 80 linguaggi di programmazione, garantendo adattabilità a diversi progetti di sviluppo. - Completamento e Generazione di Codice: Capace di completare funzioni di codifica, scrivere test e riempire codice parziale utilizzando un meccanismo di riempimento nel mezzo, semplificando così il processo di codifica. - Integrazione con Ambienti di Sviluppo: Accessibile tramite un endpoint dedicato (`codestral.mistral.ai`), facilitando l&#39;integrazione senza soluzione di continuità in vari Ambienti di Sviluppo Integrati (IDE). Valore Primario e Soluzioni per gli Utenti: Codestral migliora significativamente la produttività degli sviluppatori automatizzando i compiti di codifica di routine, riducendo il tempo e lo sforzo richiesti per il completamento del codice e la generazione di test. Il suo ampio supporto linguistico e la comprensione avanzata del codice minimizzano errori e bug, permettendo agli sviluppatori di concentrarsi sulla risoluzione di problemi complessi e sull&#39;innovazione. Integrandosi senza problemi nei flussi di lavoro esistenti, Codestral democratizza la codifica, rendendo lo sviluppo avanzato assistito dall&#39;IA accessibile a una gamma più ampia di utenti.



**Who Is the Company Behind Ministral 8B 24.10?**

- **Venditore:** [Mistral](https://www.g2.com/it/sellers/mistral)
- **Anno di Fondazione:** 2023
- **Sede centrale:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (185,240 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/mistralai/ (1,114 dipendenti su LinkedIn®)



### 3. [Mistral Saba](https://www.g2.com/it/products/mistral-saba/reviews)
  Codestral è un modello di intelligenza artificiale generativa a peso aperto sviluppato da Mistral AI, progettato specificamente per compiti di generazione di codice. Assiste gli sviluppatori nella scrittura e nell&#39;interazione con il codice attraverso un&#39;API unificata di istruzione e completamento. Proficiente in oltre 80 linguaggi di programmazione, tra cui Python, Java, C, C++, JavaScript e Bash, Codestral supporta anche linguaggi meno comuni come Swift e Fortran, rendendolo versatile in vari ambienti di codifica. Caratteristiche e Funzionalità Chiave: - Supporto Multilingue: Addestrato su un dataset diversificato che comprende più di 80 linguaggi di programmazione, garantendo adattabilità a diversi progetti di sviluppo. - Completamento e Generazione di Codice: Capace di completare funzioni di codifica, scrivere test e riempire codice parziale utilizzando un meccanismo di riempimento nel mezzo, semplificando così il processo di codifica. - Integrazione con Ambienti di Sviluppo: Accessibile tramite un endpoint dedicato (`codestral.mistral.ai`), facilitando l&#39;integrazione senza soluzione di continuità in vari Ambienti di Sviluppo Integrati (IDE). Valore Primario e Soluzioni per l&#39;Utente: Codestral migliora significativamente la produttività degli sviluppatori automatizzando i compiti di codifica di routine, riducendo il tempo e lo sforzo richiesti per il completamento del codice e la generazione di test. Il suo ampio supporto linguistico e la comprensione avanzata del codice minimizzano errori e bug, permettendo agli sviluppatori di concentrarsi sulla risoluzione di problemi complessi e sull&#39;innovazione. Integrandosi senza problemi nei flussi di lavoro esistenti, Codestral democratizza la codifica, rendendo lo sviluppo avanzato assistito dall&#39;IA accessibile a una gamma più ampia di utenti.



**Who Is the Company Behind Mistral Saba?**

- **Venditore:** [Mistral](https://www.g2.com/it/sellers/mistral)
- **Anno di Fondazione:** 2023
- **Sede centrale:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (185,240 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/mistralai/ (1,114 dipendenti su LinkedIn®)



### 4. [Mistral Small 3.2](https://www.g2.com/it/products/mistral-small-3-2/reviews)
  Codestral è un modello di intelligenza artificiale generativa a peso aperto sviluppato da Mistral AI, progettato specificamente per compiti di generazione di codice. Assiste gli sviluppatori nella scrittura e nell&#39;interazione con il codice attraverso un endpoint API unificato per istruzioni e completamenti. Proficiente in oltre 80 linguaggi di programmazione, tra cui Python, Java, C, C++, JavaScript e Bash, Codestral supporta anche linguaggi meno comuni come Swift e Fortran, rendendolo versatile in vari ambienti di codifica. Caratteristiche e Funzionalità Chiave: - Supporto Multilingue: Addestrato su un dataset diversificato che comprende più di 80 linguaggi di programmazione, garantendo adattabilità a diversi progetti di sviluppo. - Completamento e Generazione di Codice: Capace di completare funzioni di codifica, scrivere test e riempire codice parziale utilizzando un meccanismo di riempimento nel mezzo, semplificando così il processo di codifica. - Integrazione con Ambienti di Sviluppo: Accessibile tramite un endpoint dedicato (`codestral.mistral.ai`), facilitando l&#39;integrazione senza soluzione di continuità in vari Ambienti di Sviluppo Integrati (IDE). Valore Primario e Soluzioni per gli Utenti: Codestral migliora significativamente la produttività degli sviluppatori automatizzando i compiti di codifica di routine, riducendo il tempo e lo sforzo richiesti per il completamento del codice e la generazione di test. Il suo ampio supporto linguistico e la comprensione avanzata del codice minimizzano errori e bug, permettendo agli sviluppatori di concentrarsi sulla risoluzione di problemi complessi e sull&#39;innovazione. Integrandosi senza problemi nei flussi di lavoro esistenti, Codestral democratizza la codifica, rendendo lo sviluppo avanzato assistito dall&#39;IA accessibile a una gamma più ampia di utenti.



**Who Is the Company Behind Mistral Small 3.2?**

- **Venditore:** [Mistral](https://www.g2.com/it/sellers/mistral)
- **Anno di Fondazione:** 2023
- **Sede centrale:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (185,240 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/mistralai/ (1,114 dipendenti su LinkedIn®)



### 5. [MPT-7B](https://www.g2.com/it/products/mpt-7b/reviews)
  MPT-7B è un trasformatore in stile decoder preaddestrato da zero su 1T di token di testo e codice in inglese. Questo modello è stato addestrato da MosaicML. MPT-7B fa parte della famiglia di modelli MosaicPretrainedTransformer (MPT), che utilizzano un&#39;architettura di trasformatore modificata ottimizzata per un addestramento e un&#39;inferenza efficienti. Queste modifiche architetturali includono implementazioni di layer ottimizzate per le prestazioni e l&#39;eliminazione dei limiti di lunghezza del contesto sostituendo gli embedding posizionali con l&#39;Attention with Linear Biases (ALiBi). Grazie a queste modifiche, i modelli MPT possono essere addestrati con un&#39;elevata efficienza di throughput e una convergenza stabile. I modelli MPT possono anche essere serviti in modo efficiente sia con le pipeline standard di HuggingFace che con il FasterTransformer di NVIDIA.



**Who Is the Company Behind MPT-7B?**

- **Venditore:** [MosaicML](https://www.g2.com/it/sellers/mosaicml)
- **Anno di Fondazione:** 2021
- **Sede centrale:** San Francisco, US
- **Pagina LinkedIn®:** https://www.linkedin.com/company/databricks (13,148 dipendenti su LinkedIn®)



### 6. [NVIDIA Nemotron Nano 9b](https://www.g2.com/it/products/nvidia-nemotron-nano-9b/reviews)
  NVIDIA Nemotron-Nano-9B-v2 è un modello linguistico compatto e open-source progettato per offrire capacità di ragionamento ad alte prestazioni e agentiche. Utilizzando un&#39;architettura ibrida Mamba-Transformer, elabora in modo efficiente sequenze di contesto lungo fino a 128.000 token, rendendolo adatto per compiti complessi che richiedono una comprensione estesa del contesto. Il modello supporta più lingue, tra cui inglese, tedesco, francese, italiano, spagnolo e giapponese, ed eccelle nei compiti di seguire istruzioni e generazione di codice. Caratteristiche e Funzionalità Chiave: - Architettura Ibrida: Combina strati di spazio di stato Mamba-2 con strati di attenzione Transformer, migliorando il throughput e l&#39;accuratezza nei compiti di ragionamento. - Elaborazione Efficiente di Contesto Lungo: Capace di gestire sequenze fino a 128.000 token su una singola GPU NVIDIA A10G, facilitando il ragionamento scalabile su contesti lunghi. - Supporto Multilingue: Addestrato su dati che coprono 15 lingue e 43 linguaggi di programmazione, consentendo un&#39;ampia fluidità multilingue e di codifica. - Funzione di Ragionamento Attivabile: Consente agli utenti di controllare il processo di ragionamento del modello utilizzando comandi semplici come &quot;/think&quot; o &quot;/no\_think,&quot; bilanciando accuratezza e velocità di risposta. - Controllo del Budget di Ragionamento: Introduce un meccanismo di &quot;budget di pensiero,&quot; permettendo agli sviluppatori di impostare il numero di token utilizzati durante il processo di ragionamento, ottimizzando per latenza o costo. Valore Primario e Soluzioni per gli Utenti: NVIDIA Nemotron-Nano-9B-v2 risponde alla necessità di modelli linguistici efficienti e ad alte prestazioni capaci di gestire contesti estesi e compiti di ragionamento complessi. La sua architettura ibrida e le funzionalità avanzate forniscono a sviluppatori e ricercatori uno strumento versatile per costruire applicazioni AI che richiedono una comprensione profonda e un&#39;elaborazione rapida di dati testuali su larga scala. La natura open-source del modello e la licenza permissiva facilitano un&#39;adozione e una personalizzazione diffuse, consentendo agli utenti di implementare soluzioni AI sofisticate in vari domini.



**Who Is the Company Behind NVIDIA Nemotron Nano 9b?**

- **Venditore:** [NVIDIA](https://www.g2.com/it/sellers/nvidia)
- **Anno di Fondazione:** 1993
- **Sede centrale:** Santa Clara, CA
- **Twitter:** @nvidia (2,576,525 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/3608/ (48,229 dipendenti su LinkedIn®)
- **Proprietà:** NVDA



### 7. [Phi 3.5 mini](https://www.g2.com/it/products/phi-3-5-mini/reviews)
  Phi-3.5-mini è un modello linguistico all&#39;avanguardia e leggero sviluppato da Microsoft, progettato per offrire capacità di ragionamento di alta qualità all&#39;interno di un&#39;architettura compatta. Basandosi sui dataset utilizzati per Phi-3, si concentra su dati di altissima qualità e densi di ragionamento, inclusi dati sintetici e siti web pubblicamente disponibili filtrati. Il modello supporta una lunghezza di contesto di 128K token, permettendogli di gestire efficacemente input estesi. Attraverso rigorosi processi di miglioramento come il fine-tuning supervisionato, l&#39;ottimizzazione della politica prossimale e l&#39;ottimizzazione delle preferenze dirette, Phi-3.5-mini garantisce un&#39;aderenza precisa alle istruzioni e robuste misure di sicurezza. Caratteristiche e Funzionalità Chiave: - Gestione del Contesto Esteso: Supporta fino a 128K token, facilitando compiti che richiedono l&#39;elaborazione di documenti o conversazioni lunghe. - Ragionamento di Alta Qualità: Addestrato su dati densi di ragionamento per migliorare le capacità di problem-solving e analisi. - Prestazioni Efficienti: Offre risultati all&#39;avanguardia all&#39;interno di un modello di dimensioni compatte, rendendolo adatto per ambienti con risorse limitate. - Misure di Sicurezza Robuste: Incorpora tecniche di ottimizzazione avanzate per garantire output sicuri e affidabili. Valore Primario e Soluzioni per l&#39;Utente: Phi-3.5-mini risponde alla necessità di un modello linguistico potente ma efficiente, capace di gestire lunghezze di contesto estese e compiti di ragionamento complessi. La sua dimensione compatta consente il dispiegamento in ambienti con risorse computazionali limitate senza compromettere le prestazioni. Concentrandosi su dati di alta qualità e densi di ragionamento, fornisce agli utenti output accurati e contestualmente rilevanti, rendendolo ideale per applicazioni nella comprensione del linguaggio naturale, generazione di contenuti e intelligenza artificiale conversazionale.



**Who Is the Company Behind Phi 3.5 mini?**

- **Venditore:** [Microsoft](https://www.g2.com/it/sellers/microsoft)
- **Anno di Fondazione:** 1975
- **Sede centrale:** Redmond, Washington
- **Twitter:** @microsoft (13,091,954 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/microsoft/ (231,632 dipendenti su LinkedIn®)
- **Proprietà:** MSFT



### 8. [Phi 3 mini 4k](https://www.g2.com/it/products/phi-3-mini-4k/reviews)
  Il Phi-3 Mini-4K-Instruct è un modello linguistico all&#39;avanguardia e leggero sviluppato da Microsoft, con 3,8 miliardi di parametri. Fa parte della famiglia di modelli Phi-3 ed è progettato per supportare una lunghezza di contesto di 4.000 token. Addestrato su una combinazione di dati sintetici e siti web pubblicamente disponibili filtrati, il modello enfatizza contenuti di alta qualità e densi di ragionamento. Miglioramenti post-addestramento, inclusi il fine-tuning supervisionato e l&#39;ottimizzazione delle preferenze dirette, sono stati applicati per migliorare l&#39;aderenza alle istruzioni e le misure di sicurezza. Il Phi-3 Mini-4K-Instruct dimostra prestazioni robuste su benchmark che valutano il buon senso, la comprensione del linguaggio, la matematica, la programmazione, la comprensione di contesti lunghi e il ragionamento logico, posizionandosi come un modello leader tra quelli con meno di 13 miliardi di parametri. Caratteristiche e Funzionalità Chiave: - Architettura Compatta: Con 3,8 miliardi di parametri, il modello offre un equilibrio tra prestazioni ed efficienza delle risorse. - Lunghezza del Contesto Estesa: Supporta l&#39;elaborazione di fino a 4.000 token, consentendo di gestire efficacemente input più lunghi. - Dati di Addestramento di Alta Qualità: Utilizza un dataset curato che combina dati sintetici e contenuti web filtrati, concentrandosi su informazioni di alta qualità e intensive di ragionamento. - Miglioramento nel Seguire le Istruzioni: Processi post-addestramento, inclusi il fine-tuning supervisionato e l&#39;ottimizzazione delle preferenze dirette, migliorano la capacità del modello di seguire le istruzioni con precisione. - Prestazioni Versatili: Eccelle in vari compiti come il ragionamento di buon senso, la comprensione del linguaggio, la risoluzione di problemi matematici, la programmazione e il ragionamento logico. Valore Primario e Soluzioni per gli Utenti: Il Phi-3 Mini-4K-Instruct risponde alla necessità di un modello linguistico potente ma efficiente, adatto ad ambienti con risorse di memoria e computazionali limitate. La sua dimensione compatta e le capacità di contesto esteso lo rendono ideale per applicazioni che richiedono bassa latenza e forti capacità di ragionamento. Offrendo prestazioni all&#39;avanguardia in un pacchetto efficiente in termini di risorse, consente a sviluppatori e ricercatori di integrare funzionalità avanzate di comprensione e generazione del linguaggio nelle loro applicazioni senza il sovraccarico associato a modelli più grandi.



**Who Is the Company Behind Phi 3 mini 4k?**

- **Venditore:** [Microsoft](https://www.g2.com/it/sellers/microsoft)
- **Anno di Fondazione:** 1975
- **Sede centrale:** Redmond, Washington
- **Twitter:** @microsoft (13,091,954 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/microsoft/ (231,632 dipendenti su LinkedIn®)
- **Proprietà:** MSFT



### 9. [Phi 3 small 128k](https://www.g2.com/it/products/phi-3-small-128k/reviews)
  Il Phi-3-Small-128K-Instruct è un modello linguistico all&#39;avanguardia con 7 miliardi di parametri sviluppato da Microsoft. Fa parte della famiglia Phi-3 ed è progettato per gestire una lunghezza di contesto fino a 128.000 token. Addestrato su una combinazione di dati sintetici e contenuti web pubblicamente disponibili e filtrati, il modello enfatizza proprietà di alta qualità e dense di ragionamento. Processi post-addestramento, inclusi il fine-tuning supervisionato e l&#39;ottimizzazione delle preferenze dirette, sono stati applicati per migliorare le sue capacità di seguire istruzioni e le misure di sicurezza. Il Phi-3-Small-128K-Instruct dimostra prestazioni robuste su benchmark che testano il buon senso, la comprensione del linguaggio, la matematica, la codifica, la comprensione di contesti lunghi e il ragionamento logico, posizionandosi in modo competitivo tra modelli di dimensioni simili e maggiori. Caratteristiche e Funzionalità Chiave: - Gestione Estensiva del Contesto: Supporta una lunghezza di contesto fino a 128.000 token, consentendo l&#39;elaborazione di input lunghi e complessi. - Dati di Addestramento di Alta Qualità: Utilizza una miscela di dati sintetici e web curati, concentrandosi su contenuti ricchi di ragionamento e qualità. - Tecniche Avanzate di Post-Addestramento: Incorpora il fine-tuning supervisionato e l&#39;ottimizzazione delle preferenze dirette per migliorare l&#39;aderenza alle istruzioni e la sicurezza. - Prestazioni Versatili: Eccelle in compiti che richiedono buon senso, comprensione del linguaggio, ragionamento matematico, competenza nella codifica e analisi logica. Valore Primario e Soluzioni per gli Utenti: Il modello Phi-3-Small-128K-Instruct offre a sviluppatori e ricercatori uno strumento potente per costruire sistemi di intelligenza artificiale che richiedono un ragionamento profondo e la capacità di elaborare informazioni contestuali estese. La sua architettura efficiente lo rende adatto per ambienti con vincoli di memoria e calcolo, mentre le sue forti prestazioni in vari compiti di ragionamento rispondono alle esigenze di applicazioni che richiedono alti livelli di comprensione e analisi. Fornendo una solida base per funzionalità di intelligenza artificiale generativa, il modello accelera lo sviluppo di applicazioni linguistiche e multimodali avanzate.



**Who Is the Company Behind Phi 3 small 128k?**

- **Venditore:** [Microsoft](https://www.g2.com/it/sellers/microsoft)
- **Anno di Fondazione:** 1975
- **Sede centrale:** Redmond, Washington
- **Twitter:** @microsoft (13,091,954 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/microsoft/ (231,632 dipendenti su LinkedIn®)
- **Proprietà:** MSFT



### 10. [Phi 3 Small 8k](https://www.g2.com/it/products/phi-3-small-8k/reviews)
  Variante più piccola del modello Phi-3 con contesto esteso di 8k token e capacità di istruzione.



**Who Is the Company Behind Phi 3 Small 8k?**

- **Venditore:** [Microsoft](https://www.g2.com/it/sellers/microsoft)
- **Anno di Fondazione:** 1975
- **Sede centrale:** Redmond, Washington
- **Twitter:** @microsoft (13,091,954 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/microsoft/ (231,632 dipendenti su LinkedIn®)
- **Proprietà:** MSFT



### 11. [Phi 4 mini](https://www.g2.com/it/products/phi-4-mini/reviews)
  Il Phi-3 Mini-4K-Instruct è un modello linguistico all&#39;avanguardia e leggero sviluppato da Microsoft, con 3,8 miliardi di parametri. Fa parte della famiglia di modelli Phi-3 ed è progettato per supportare una lunghezza di contesto di 4.000 token. Addestrato su una combinazione di dati sintetici e siti web pubblicamente disponibili filtrati, il modello enfatizza contenuti di alta qualità e densi di ragionamento. Miglioramenti post-addestramento, inclusi il fine-tuning supervisionato e l&#39;ottimizzazione delle preferenze dirette, sono stati applicati per migliorare l&#39;aderenza alle istruzioni e le misure di sicurezza. Il Phi-3 Mini-4K-Instruct dimostra prestazioni robuste su benchmark che valutano il buon senso, la comprensione del linguaggio, la matematica, la codifica, la comprensione di contesti lunghi e il ragionamento logico, posizionandosi come un modello leader tra quelli con meno di 13 miliardi di parametri. Caratteristiche e Funzionalità Chiave: - Architettura Compatta: Con 3,8 miliardi di parametri, il modello offre un equilibrio tra prestazioni ed efficienza delle risorse. - Lunghezza del Contesto Estesa: Supporta l&#39;elaborazione di fino a 4.000 token, consentendo di gestire efficacemente input più lunghi. - Dati di Addestramento di Alta Qualità: Utilizza un dataset curato che combina dati sintetici e contenuti web filtrati, concentrandosi su informazioni di alta qualità e intensive di ragionamento. - Miglioramento nel Seguire le Istruzioni: Processi post-addestramento, inclusi il fine-tuning supervisionato e l&#39;ottimizzazione delle preferenze dirette, migliorano la capacità del modello di seguire le istruzioni con precisione. - Prestazioni Versatili: Eccelle in vari compiti come il ragionamento di buon senso, la comprensione del linguaggio, la risoluzione di problemi matematici, la codifica e il ragionamento logico. Valore Primario e Soluzioni per gli Utenti: Il Phi-3 Mini-4K-Instruct risponde alla necessità di un modello linguistico potente ma efficiente, adatto ad ambienti con risorse di memoria e computazionali limitate. La sua dimensione compatta e le capacità di contesto esteso lo rendono ideale per applicazioni che richiedono bassa latenza e forti capacità di ragionamento. Offrendo prestazioni all&#39;avanguardia in un pacchetto efficiente in termini di risorse, consente a sviluppatori e ricercatori di integrare funzionalità avanzate di comprensione e generazione del linguaggio nelle loro applicazioni senza il sovraccarico associato a modelli più grandi.



**Who Is the Company Behind Phi 4 mini?**

- **Venditore:** [Microsoft](https://www.g2.com/it/sellers/microsoft)
- **Anno di Fondazione:** 1975
- **Sede centrale:** Redmond, Washington
- **Twitter:** @microsoft (13,091,954 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/microsoft/ (231,632 dipendenti su LinkedIn®)
- **Proprietà:** MSFT



### 12. [Phi 4 mini reasoning](https://www.g2.com/it/products/phi-4-mini-reasoning/reviews)
  Phi-4-mini-reasoning è un modello linguistico compatto basato su transformer sviluppato da Microsoft, specificamente ottimizzato per compiti di ragionamento matematico. Con 3,8 miliardi di parametri e supporto per una lunghezza di contesto di 128K token, offre capacità di risoluzione dei problemi di alta qualità, passo dopo passo, in ambienti dove le risorse computazionali o la latenza sono limitate. Ottimizzato utilizzando dati matematici sintetici generati da un modello più avanzato, Phi-4-mini-reasoning eccelle in scenari di risoluzione di problemi multi-step e intensivi di logica, rendendolo adatto per applicazioni come la generazione di prove formali, il calcolo simbolico e problemi di parole avanzati. Caratteristiche e Funzionalità Chiave: - Ottimizzato per il Ragionamento Matematico: Progettato per gestire problemi matematici complessi e multi-step con logica strutturata e pensiero analitico. - Architettura Compatta: Bilancia la capacità di ragionamento con l&#39;efficienza, consentendo il dispiegamento in ambienti con risorse limitate. - Lunghezza del Contesto Estesa: Supporta fino a 128K token, permettendo una ritenzione completa del contesto attraverso i passaggi di risoluzione dei problemi. - Ottimizzato con Dati Sintetici: Addestrato su un set diversificato di oltre un milione di problemi matematici, migliorando le sue prestazioni di ragionamento. Valore Primario e Risoluzione dei Problemi: Phi-4-mini-reasoning risponde alla necessità di un ragionamento matematico efficiente e di alta qualità in scenari dove le risorse computazionali sono limitate. La sua dimensione compatta e le prestazioni ottimizzate lo rendono ideale per applicazioni educative, sistemi di tutoraggio integrati e implementazioni su dispositivi edge o mobili. Mantenendo il contesto attraverso più passaggi e applicando una logica strutturata, fornisce soluzioni accurate e affidabili per problemi matematici complessi, migliorando così le esperienze di apprendimento e supportando compiti analitici avanzati.



**Who Is the Company Behind Phi 4 mini reasoning?**

- **Venditore:** [Microsoft](https://www.g2.com/it/sellers/microsoft)
- **Anno di Fondazione:** 1975
- **Sede centrale:** Redmond, Washington
- **Twitter:** @microsoft (13,091,954 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/microsoft/ (231,632 dipendenti su LinkedIn®)
- **Proprietà:** MSFT



### 13. [StableLM 2 1.6b](https://www.g2.com/it/products/stablelm-2-1-6b/reviews)
  StableLM 2 1.6B è un modello linguistico di decodifica con 1,6 miliardi di parametri sviluppato da Stability AI. È pre-addestrato su 2 trilioni di token provenienti da dataset multilingue e di codice diversi per due epoche. Il modello è progettato per generare testo coerente e contestualmente rilevante, rendendolo adatto a una vasta gamma di compiti di elaborazione del linguaggio naturale. Caratteristiche chiave e funzionalità: - Architettura del Decodificatore Transformer: StableLM 2 1.6B utilizza un&#39;architettura di decodificatore transformer, simile a LLaMA, con modifiche specifiche per migliorare le prestazioni. - Embedding di Posizione Rotatoria: Incorpora embedding di posizione rotatoria applicati al primo 25% delle dimensioni dell&#39;head embedding, migliorando il throughput. - Normalizzazione a Strati: Impiega LayerNorm con termini di bias appresi, differendo da RMSNorm, per stabilizzare l&#39;addestramento e migliorare la convergenza. - Configurazione del Bias: Rimuove tutti i termini di bias dalle reti feed-forward e dai livelli di auto-attenzione multi-head, eccetto per i bias delle proiezioni di query, key e value, ottimizzando l&#39;efficienza computazionale. - Tokenizzazione Avanzata: Utilizza il tokenizer Arcade100k, un tokenizer BPE esteso dal tiktoken.cl100k\_base di OpenAI, con divisione delle cifre in token individuali per migliorare la comprensione numerica. Valore Primario e Soluzioni per l&#39;Utente: StableLM 2 1.6B offre una soluzione robusta per sviluppatori e ricercatori che cercano un potente modello linguistico capace di generare testo di alta qualità in varie applicazioni. Il suo ampio pre-addestramento su dataset diversificati garantisce versatilità nella gestione di più lingue e codice, rendendolo ideale per compiti come la creazione di contenuti, la generazione di codice e la traduzione multilingue. L&#39;architettura e le metodologie di addestramento del modello forniscono un equilibrio tra prestazioni ed efficienza computazionale, rispondendo alla necessità di modelli linguistici scalabili ed efficaci nella comunità AI.



**Who Is the Company Behind StableLM 2 1.6b?**

- **Venditore:** [Stability AI](https://www.g2.com/it/sellers/stability-ai)
- **Sede centrale:** London
- **Twitter:** @StabilityAI (256,849 follower su Twitter)
- **Pagina LinkedIn®:** https://www.linkedin.com/company/stability-ai (188 dipendenti su LinkedIn®)



### 14. [step-1 8k](https://www.g2.com/it/products/step-1-8k/reviews)
  Step-1 8k è un modello di linguaggio su larga scala sviluppato da StepFun, progettato per comprendere e generare testo in linguaggio naturale in vari domini. Con una lunghezza di contesto di 8.000 token, può elaborare input e output sostanziali, rendendolo adatto per compiti come la creazione di contenuti, la comunicazione multilingue, la risposta a domande e il ragionamento logico. Inoltre, Step-1 8k dimostra forti capacità matematiche e di codifica, supportando applicazioni nel calcolo scientifico e nello sviluppo software. Caratteristiche e Funzionalità Chiave: - Elaborazione Estensiva del Contesto: Gestisce fino a 8.000 token, consentendo una comprensione e generazione completa di testi lunghi. - Compiti Linguistici Versatili: Eccelle nella generazione di contenuti, traduzione, sintesi e intelligenza artificiale conversazionale. - Competenza Matematica e di Codifica: Capace di eseguire calcoli complessi e generare frammenti di codice, aiutando nei compiti scientifici e di programmazione. - Alto Rapporto Costo-Prestazioni: Offre un equilibrio tra prestazioni e costo, rendendolo accessibile per varie applicazioni. Valore Primario e Soluzioni per gli Utenti: Step-1 8k migliora la produttività automatizzando e semplificando i compiti legati al linguaggio. La sua capacità di elaborare un contesto esteso assicura output coerenti e contestualmente rilevanti, avvantaggiando i professionisti nella creazione di contenuti, nello sviluppo software e nell&#39;analisi dei dati. Integrando Step-1 8k, gli utenti possono ottenere risultati efficienti e accurati nei loro rispettivi campi.



**Who Is the Company Behind step-1 8k?**

- **Venditore:** [StepFun](https://www.g2.com/it/sellers/stepfun)
- **Sede centrale:** N/A
- **Pagina LinkedIn®:** https://www.linkedin.com/company/stepfun-ai/ (35 dipendenti su LinkedIn®)



### 15. [Sutra](https://www.g2.com/it/products/two-ai-sutra/reviews)
  Modello Multilingue Mixture-of-Experts che supporta oltre 50 lingue con migliori prestazioni MMLU e riduzione delle allucinazioni utilizzando conoscenze online.



**Who Is the Company Behind Sutra?**

- **Venditore:** [Two AI](https://www.g2.com/it/sellers/two-ai)
- **Anno di Fondazione:** 2021
- **Sede centrale:** Silicon Valley, US
- **Pagina LinkedIn®:** https://www.linkedin.com/company/2wo (49 dipendenti su LinkedIn®)




    ## What Is Piccoli Modelli Linguistici (SLM)?
  [Software di intelligenza artificiale generativa](https://www.g2.com/it/categories/generative-ai)

  
    
