# Beste Kleine Sprachmodelle (SLMs)

  *By [Jeffrey Lin](https://research.g2.com/insights/author/jeffrey-lin)*

   Kleine Sprachmodelle (SLMs) sind KI-Sprachmodelle, die für Effizienz, Spezialisierung und den Einsatz in ressourcenbeschränkten Umgebungen optimiert sind. Sie sind darauf ausgelegt, menschliche Ausgaben zu verstehen, zu interpretieren und zu erzeugen, während sie die rechnerische Effizienz, schnelle Inferenzzeiten und die Flexibilität der Bereitstellung auf Edge-Geräten, mobilen Plattformen und Offline-Systemen beibehalten.

### Kernfähigkeiten von SLM-Software

Um in die Kategorie der kleinen Sprachmodelle (SLM) aufgenommen zu werden, muss ein Produkt:

- Ein kompaktes Sprachmodell bieten, das für Ressourceneffizienz und spezialisierte Aufgaben optimiert ist und in der Lage ist, menschliche Ausgaben zu verstehen und zu erzeugen
- Weniger als 10 Milliarden Parameter enthalten, was es von LLMs unterscheidet, die diese Schwelle überschreiten
- Bereitstellungsflexibilität für ressourcenbeschränkte Umgebungen wie Edge-Geräte, mobile Plattformen oder begrenzte Rechenhardware bieten
- Für aufgabenspezifische Optimierung durch Feinabstimmung, Domänenspezialisierung oder gezieltes Training für spezifische Geschäftsanwendungen ausgelegt sein
- Rechnerische Effizienz mit schnellen Inferenzzeiten, reduzierten Speicheranforderungen und geringerem Energieverbrauch im Vergleich zu LLMs beibehalten

### Häufige Anwendungsfälle für SLM-Software

Entwickler und Organisationen nutzen SLMs dort, wo LLMs zu ressourcenintensiv oder kostspielig wären, um sie bereitzustellen. Häufige Anwendungsfälle umfassen:

- Bereitstellung spezialisierter Sprachfähigkeiten auf Edge-Geräten oder mobilen Plattformen ohne Cloud-Abhängigkeit
- Ausführung domänenspezifischer KI-Aufgaben wie Dokumentenklassifizierung, Erkennung benannter Entitäten oder Zusammenfassung mit minimalen Rechenressourcen
- Feinabstimmung kompakter Modelle für gezielte Geschäftsanwendungen, die eine kostengünstige und schnelle KI-Bereitstellung erfordern

### Wie sich SLMs von anderen Tools unterscheiden

SLMs unterscheiden sich von [großen Sprachmodellen (LLMs)](https://www.g2.com/categories/large-language-models-llms) hauptsächlich im Umfang, mit Parametergrößen, die typischerweise von einigen Millionen bis zu 10 Milliarden reichen, im Vergleich zu LLMs, die von 10 Milliarden bis zu Billionen von Parametern reichen. Während LLMs sich auf umfassende, allgemeine Sprachaufgaben über mehrere Domänen hinweg konzentrieren, sind SLMs für gezielte Anwendungen konzipiert, die Ressourceneffizienz und Spezialisierung priorisieren. SLMs unterscheiden sich auch von [KI-Chatbots](https://www.g2.com/categories/ai-chatbots), die die benutzerorientierte Plattform bieten, anstatt die grundlegenden Modelle selbst.

### Einblicke von G2 zu SLM-Software

Basierend auf Kategorietrends auf G2 stechen Bereitstellungsflexibilität und aufgabenspezifische Leistung als herausragende Fähigkeiten hervor. Niedrigere Inferenzkosten und schnellere Bereitstellungszeiten für spezialisierte Anwendungsfälle heben sich als primäre Vorteile der SLM-Einführung hervor.


## How Many Kleine Sprachmodelle (SLMs) Products Does G2 Track?
**Total Products under this Category:** 40

### Category Stats (May 2026)
- **Average Rating**: 4.48/5
- **New Reviews This Quarter**: 1
- **Buyer Segments**: Kleinunternehmen 50% │ Unternehmen mittlerer Größe 25% │ Unternehmen 25%

*Last updated: May 31, 2026*

  
## How Does G2 Rank Kleine Sprachmodelle (SLMs) Products?

**Warum Sie den Software-Rankings von G2 vertrauen können:**

- 30 Analysten und Datenexperten
- 0+ Authentische Bewertungen
- 40+ Produkte
- Unvoreingenommene Rankings

Die Software-Rankings von G2 basieren auf verifizierten Benutzerbewertungen, strenger Moderation und einer konsistenten Forschungsmethodik, die von einem Team von Analysten und Datenexperten gepflegt wird. Jedes Produkt wird nach denselben transparenten Kriterien gemessen, ohne bezahlte Platzierung oder Einflussnahme durch Anbieter. Während Bewertungen reale Benutzererfahrungen widerspiegeln, die subjektiv sein können, bieten sie wertvolle Einblicke, wie Software in den Händen von Fachleuten funktioniert. Zusammen bilden diese Eingaben den G2 Score, eine standardisierte Methode, um Tools innerhalb jeder Kategorie zu vergleichen.

  
## Which Kleine Sprachmodelle (SLMs) Is Best for Your Use Case?


  ## What Are the Top-Rated Kleine Sprachmodelle (SLMs) Products in 2026?
### 1. [StableLM](https://www.g2.com/de/products/stablelm/reviews)
  StableLM ist eine Suite von Open-Source-Sprachmodellen (LLMs), die von Stability AI entwickelt wurden und darauf abzielen, leistungsstarke Fähigkeiten zur Verarbeitung natürlicher Sprache bereitzustellen. Diese Modelle werden auf umfangreichen Datensätzen trainiert, um eine breite Palette von Anwendungen zu unterstützen, darunter Textgenerierung, Sprachverständnis und konversationelle KI. Durch das Angebot zugänglicher und effizienter Sprachmodelle möchte StableLM Entwicklern und Forschern die Möglichkeit geben, innovative KI-gesteuerte Lösungen zu entwickeln. Hauptmerkmale und Funktionalität: - Open-Source-Zugänglichkeit: StableLM-Modelle sind frei verfügbar, was eine breite Nutzung und gemeinschaftsgetriebene Verbesserungen ermöglicht. - Skalierbarkeit: Die Modelle sind darauf ausgelegt, sich über verschiedene Anwendungen hinweg zu skalieren, von kleinen Projekten bis hin zu unternehmensweiten Implementierungen. - Vielseitigkeit: StableLM unterstützt vielfältige Aufgaben der Verarbeitung natürlicher Sprache, einschließlich Textgenerierung, Zusammenfassung und Fragebeantwortung. - Leistungsoptimierung: Die Modelle sind auf Effizienz optimiert und gewährleisten eine hohe Leistung auf verschiedenen Hardwarekonfigurationen. Primärer Wert und Benutzerlösungen: StableLM adressiert das Bedürfnis nach zugänglichen, hochwertigen Sprachmodellen in der KI-Community. Durch die Bereitstellung von Open-Source-LLMs ermöglicht es Entwicklern und Forschern, fortschrittliche Sprachverständnis- und Generierungsfähigkeiten in ihre Anwendungen zu integrieren, ohne die Einschränkungen proprietärer Systeme. Dies fördert Innovation und beschleunigt die Entwicklung von KI-Lösungen in verschiedenen Branchen.


  **Average Rating:** 4.7/5.0
  **Total Reviews:** 17

**Who Is the Company Behind StableLM?**

- **Verkäufer:** [Stability AI](https://www.g2.com/de/sellers/stability-ai)
- **Hauptsitz:** London
- **Twitter:** @StabilityAI (256,283 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/stability-ai (188 Mitarbeiter*innen auf LinkedIn®)

**Who Uses This Product?**
  - **Company Size:** 47% Kleinunternehmen, 29% Unternehmen


#### What Are StableLM's Pros and Cons?

**Pros:**

- Benutzerfreundlichkeit (5 reviews)
- Effizienz (5 reviews)
- Leistungsverbesserung (4 reviews)
- Hilfreich (3 reviews)
- Genauigkeit (2 reviews)

**Cons:**

- Technische Probleme (4 reviews)
- Datensicherheit (3 reviews)
- Hoher Ressourcenverbrauch (2 reviews)
- Niedrige Genauigkeit (2 reviews)
- Langsame Leistung (2 reviews)

### 2. [Mistral 7B](https://www.g2.com/de/products/mistral-7b/reviews)
  Mistral-7B-v0.1 ist ein kleines, aber leistungsstarkes Modell, das an viele Anwendungsfälle anpassbar ist. Mistral 7B ist in allen Benchmarks besser als Llama 2 13B, hat natürliche Codierungsfähigkeiten und eine Sequenzlänge von 8k. Es wird unter der Apache 2.0-Lizenz veröffentlicht.


  **Average Rating:** 4.2/5.0
  **Total Reviews:** 11

**Who Is the Company Behind Mistral 7B?**

- **Verkäufer:** [Mistral](https://www.g2.com/de/sellers/mistral)
- **Gründungsjahr:** 2023
- **Hauptsitz:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (183,452 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/mistralai/ (787 Mitarbeiter*innen auf LinkedIn®)

**Who Uses This Product?**
  - **Company Size:** 64% Kleinunternehmen, 27% Unternehmen mittlerer Größe


#### What Are Mistral 7B's Pros and Cons?

**Pros:**

- Effizienz (3 reviews)
- Leistungsverbesserung (2 reviews)
- Geschwindigkeit (2 reviews)
- Zeitersparnis (2 reviews)
- Genauigkeit (1 reviews)

**Cons:**

- Ungenaue Antworten (2 reviews)
- Schlechtes Verständnis (2 reviews)
- Komplexität (1 reviews)
- Mangel an Kreativität (1 reviews)
- Eingeschränkte Funktionalität (1 reviews)

### 3. [bloom 560m](https://www.g2.com/de/products/bloom-560m/reviews)
  BLOOM-560m ist ein transformerbasiertes Sprachmodell, das von BigScience entwickelt wurde, um die Forschung an großen Sprachmodellen (LLMs) zu erleichtern. Es dient als vortrainiertes Basismodell, das in der Lage ist, menschenähnlichen Text zu generieren und für verschiedene Aufgaben der natürlichen Sprachverarbeitung feinabgestimmt werden kann. Das Modell unterstützt mehrere Sprachen und ist somit vielseitig für eine breite Palette von Anwendungen einsetzbar. Hauptmerkmale und Funktionalität: - Mehrsprachige Unterstützung: BLOOM-560m ist auf vielfältigen Datensätzen trainiert, was es ihm ermöglicht, Text in mehreren Sprachen zu verstehen und zu generieren. - Transformer-Architektur: Nutzt ein transformerbasiertes Design, das eine effiziente Verarbeitung und Generierung von Text ermöglicht. - Vortrainiertes Modell: Dient als grundlegendes Modell, das für spezifische Aufgaben wie Textgenerierung, Zusammenfassung und Beantwortung von Fragen feinabgestimmt werden kann. - Offener Zugang: Entwickelt unter der RAIL-Lizenz v1.0, fördert es offene Wissenschaft und Zugänglichkeit für Forschungszwecke. Primärer Wert und Problemlösung: BLOOM-560m adressiert das Bedürfnis nach zugänglichen und vielseitigen Sprachmodellen in der Forschungsgemeinschaft. Durch die Bereitstellung eines vortrainierten, mehrsprachigen Modells ermöglicht es Forschern und Entwicklern, verschiedene Anwendungen der natürlichen Sprachverarbeitung zu erkunden und voranzutreiben, ohne umfangreiche Rechenressourcen zu benötigen. Seine offene Zugänglichkeit fördert Zusammenarbeit und Innovation und trägt zum breiteren Verständnis und zur Entwicklung von Sprachmodellen bei.


  **Average Rating:** 5.0/5.0
  **Total Reviews:** 1

**Who Is the Company Behind bloom 560m?**

- **Verkäufer:** [Hugging Face](https://www.g2.com/de/sellers/hugging-face)
- **Gründungsjahr:** 2016
- **Hauptsitz:** United States
- **Twitter:** @huggingface (696,651 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/huggingface/ (636 Mitarbeiter*innen auf LinkedIn®)

**Who Uses This Product?**
  - **Company Size:** 100% Unternehmen


### 4. [granite 3.1 MoE 3b](https://www.g2.com/de/products/granite-3-1-moe-3b/reviews)
  Granite-3.1-3B-A800M-Base ist ein hochmodernes Sprachmodell, das von IBM entwickelt wurde, um komplexe Aufgaben der natürlichen Sprachverarbeitung mit hoher Effizienz zu bewältigen. Dieses Modell verwendet eine spärliche Mixture of Experts (MoE) Transformer-Architektur, die es ihm ermöglicht, umfangreiche Kontextlängen von bis zu 128K Tokens zu verarbeiten. Es wurde auf etwa 10 Billionen Tokens aus verschiedenen Bereichen trainiert, darunter Webinhalte, Code-Repositories, wissenschaftliche Literatur und mehrsprachige Datensätze. Es unterstützt zwölf Sprachen: Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch. Hauptmerkmale und Funktionalität: - Erweiterte Kontextverarbeitung: In der Lage, Eingaben von bis zu 128K Tokens zu verarbeiten, was Aufgaben wie das Verständnis und die Zusammenfassung von Langform-Dokumenten erleichtert. - Spärliche Mixture of Experts Architektur: Nutzt 40 feinkörnige Experten mit dropless Token-Routing und Lastenausgleichsverlust, optimiert die Recheneffizienz, indem nur 800 Millionen Parameter während der Inferenz aktiviert werden. - Mehrsprachige Unterstützung: Vortrainiert auf Daten aus zwölf Sprachen, was seine Anwendbarkeit in verschiedenen sprachlichen Kontexten verbessert. - Vielseitige Anwendungen: Hervorragend in der Textgenerierung, Zusammenfassung, Klassifikation, Extraktion und bei Frage-Antwort-Aufgaben. Primärer Wert und Benutzerlösungen: Granite-3.1-3B-A800M-Base bietet Unternehmen ein leistungsstarkes Werkzeug für effizientes und genaues Verständnis und Generierung natürlicher Sprache. Sein erweitertes Kontextfenster und die mehrsprachigen Fähigkeiten machen es ideal für die Verarbeitung von groß angelegten Dokumenten und die Unterstützung globaler Operationen. Die effiziente Architektur des Modells gewährleistet eine hohe Leistung bei gleichzeitiger Minimierung der Rechenressourcen, was es für den Einsatz in Umgebungen mit begrenzter Rechenleistung geeignet macht. Durch die Nutzung dieses Modells können Organisationen ihre KI-gesteuerten Anwendungen verbessern, Kundeninteraktionen optimieren und Content-Management-Prozesse rationalisieren.


  **Average Rating:** 3.5/5.0
  **Total Reviews:** 1

**Who Is the Company Behind granite 3.1 MoE 3b?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM

**Who Uses This Product?**
  - **Company Size:** 100% Kleinunternehmen


#### What Are granite 3.1 MoE 3b's Pros and Cons?

**Pros:**

- Kostenlose Dienstleistungen (1 reviews)
- Open Source (1 reviews)
- Suchfunktionen (1 reviews)
- UI-Design (1 reviews)
- Aktualisierungen (1 reviews)


### 5. [Phi 3 Mini 128k](https://www.g2.com/de/products/phi-3-mini-128k/reviews)
  Microsoft Azures Phi 3 Modell definiert die Fähigkeiten von groß angelegten Sprachmodellen in der Cloud neu.


  **Average Rating:** 5.0/5.0
  **Total Reviews:** 1

**Who Is the Company Behind Phi 3 Mini 128k?**

- **Verkäufer:** [Microsoft](https://www.g2.com/de/sellers/microsoft)
- **Gründungsjahr:** 1975
- **Hauptsitz:** Redmond, Washington
- **Twitter:** @microsoft (13,100,852 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/microsoft/ (227,697 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** MSFT

**Who Uses This Product?**
  - **Company Size:** 100% Unternehmen mittlerer Größe


### 6. [Athene 70B](https://www.g2.com/de/products/athene-70b/reviews)
  Athene-70B ist ein fortschrittliches Open-Weight-Sprachmodell, das von Nexusflow entwickelt wurde und auf der Llama-3-70B-Instruct-Architektur von Meta basiert. Durch die Nutzung von Reinforcement Learning aus menschlichem Feedback erreicht Athene-70B eine Punktzahl von 77,8 % im Arena-Hard-Auto-Benchmark und positioniert sich damit wettbewerbsfähig gegenüber proprietären Modellen wie Claude-3.5-Sonnet und GPT-4o. Dieses Modell zeichnet sich in Aufgaben aus, die präzises Befolgen von Anweisungen, komplexes Denken, umfassende Unterstützung beim Programmieren, kreatives Schreiben und mehrsprachiges Verständnis erfordern. Seine Open-Weight-Natur ermöglicht eine breite Zugänglichkeit, sodass Entwickler und Forscher das Modell für verschiedene Anwendungen integrieren und anpassen können. Hauptmerkmale und Funktionalität: - Hohe Leistung: Erreicht eine Punktzahl von 77,8 % im Arena-Hard-Auto-Benchmark und kommt damit führenden proprietären Modellen nahe. - Fortgeschrittenes Training: Feinabgestimmt mit RLHF, um gewünschte Verhaltensweisen und Leistungen zu verbessern. - Vielseitige Fähigkeiten: Hervorragend im Befolgen von Anweisungen, komplexem Denken, Unterstützung beim Programmieren, kreativem Schreiben und mehrsprachigen Aufgaben. - Open-Weight-Zugänglichkeit: Bietet Transparenz und Anpassungsfähigkeit für Entwickler und Forscher. Primärer Wert und Benutzerlösungen: Athene-70B bietet eine leistungsstarke, Open-Weight-Alternative zu proprietären Sprachmodellen und ermöglicht es Benutzern, anspruchsvolle KI-Anwendungen zu entwickeln, ohne die Einschränkungen geschlossener Systeme. Seine fortschrittlichen Fähigkeiten im Verstehen und Generieren von menschenähnlichem Text machen es geeignet für eine Vielzahl von Anwendungen, einschließlich Konversationsagenten, Inhaltserstellung und komplexen Problemlösungsaufgaben. Durch die Bereitstellung eines zugänglichen und anpassbaren Modells befähigt Athene-70B Benutzer, innovative und maßgeschneiderte KI-Lösungen für ihre spezifischen Bedürfnisse zu entwickeln.


**Who Is the Company Behind Athene 70B?**

- **Verkäufer:** [NexusFlow](https://www.g2.com/de/sellers/nexusflow)
- **Hauptsitz:** Palo Alto, California
- **LinkedIn®-Seite:** https://www.linkedin.com/company/nexusflow-ai/ (18 Mitarbeiter*innen auf LinkedIn®)


### 7. [bloom 1b1](https://www.g2.com/de/products/bloom-1b1/reviews)
  BLOOM-1b1 ist ein mehrsprachiges Sprachmodell, das vom BigScience Workshop entwickelt wurde und darauf ausgelegt ist, menschenähnlichen Text in 48 Sprachen zu generieren. Als transformerbasiertes Modell nutzt es eine Architektur, die nur aus einem Decoder besteht, mit 24 Schichten und 16 Attention Heads, insgesamt etwa 1,06 Milliarden Parameter. Diese Konfiguration ermöglicht es BLOOM-1b1, eine Vielzahl von Aufgaben der natürlichen Sprachverarbeitung zu erfüllen, einschließlich Textgenerierung, Übersetzung und Zusammenfassung. Hauptmerkmale und Funktionalität: - Mehrsprachige Fähigkeit: Unterstützt die Textgenerierung in 48 Sprachen und erleichtert vielfältige sprachliche Anwendungen. - Transformer-Architektur: Verwendet eine Struktur, die nur aus einem Decoder besteht, mit 24 Schichten und 16 Attention Heads, was seine Fähigkeit verbessert, komplexe Texte zu verstehen und zu generieren. - Umfangreiche Trainingsdaten: Trainiert auf einem großen und vielfältigen Datensatz, was Robustheit und Anpassungsfähigkeit in verschiedenen Kontexten gewährleistet. - Offener Zugang: Veröffentlicht unter der BigScience RAIL License 1.0, fördert Transparenz und Zusammenarbeit innerhalb der KI-Community. Primärer Wert und Benutzerlösungen: BLOOM-1b1 adressiert das Bedürfnis nach einem vielseitigen und zugänglichen Sprachmodell, das in der Lage ist, mehrere Sprachen und Aufgaben zu bewältigen. Seine offene Zugänglichkeit ermöglicht es Forschern, Entwicklern und Organisationen, fortschrittliche Sprachverarbeitungsfähigkeiten in ihre Anwendungen zu integrieren, ohne die Einschränkungen proprietärer Modelle. Durch die Unterstützung einer breiten Palette von Sprachen ermöglicht BLOOM-1b1 inklusivere und effektivere Kommunikationswerkzeuge, überbrückt sprachliche Lücken und fördert die globale Konnektivität.


**Who Is the Company Behind bloom 1b1?**

- **Verkäufer:** [Hugging Face](https://www.g2.com/de/sellers/hugging-face)
- **Gründungsjahr:** 2016
- **Hauptsitz:** United States
- **Twitter:** @huggingface (696,651 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/huggingface/ (636 Mitarbeiter*innen auf LinkedIn®)


### 8. [bloom 1b7](https://www.g2.com/de/products/bloom-1b7/reviews)
  BLOOM-1b7 ist ein transformerbasiertes Sprachmodell, das vom BigScience Workshop entwickelt wurde und darauf ausgelegt ist, menschenähnlichen Text in 48 Sprachen zu generieren. Als verkleinerte Variante des größeren BLOOM-Modells bietet es ein Gleichgewicht zwischen Leistung und Recheneffizienz, was es für eine Vielzahl von Aufgaben der natürlichen Sprachverarbeitung geeignet macht. Hauptmerkmale und Funktionalität: - Mehrsprachige Unterstützung: In der Lage, Text in 48 Sprachen zu verstehen und zu generieren, was vielfältige sprachliche Anwendungen erleichtert. - Textgenerierung: Produziert kohärenten und kontextuell relevanten Text, nützlich für Aufgaben wie Inhaltserstellung, Dialogsysteme und mehr. - Transformer-Architektur: Nutzt ein transformerbasiertes Design, das eine effiziente Verarbeitung und Generierung von Text ermöglicht. - Vorgefertigtes Modell: Dient als Basismodell, das für spezifische Anwendungen feinabgestimmt werden kann, um die Anpassungsfähigkeit an verschiedene Aufgaben zu verbessern. Primärer Wert und Benutzerlösungen: BLOOM-1b7 adressiert das Bedürfnis nach zugänglichen, hochwertigen Sprachmodellen, die mehrere Sprachen unterstützen. Seine relativ kleinere Größe im Vergleich zu größeren Modellen ermöglicht den Einsatz in Umgebungen mit begrenzten Rechenressourcen, ohne dass es zu erheblichen Leistungseinbußen kommt. Dies macht es zu einer idealen Wahl für Forscher und Entwickler, die ein vielseitiges und effizientes Sprachmodell für Aufgaben wie Textgenerierung, Übersetzung und andere NLP-Anwendungen suchen.


**Who Is the Company Behind bloom 1b7?**

- **Verkäufer:** [Hugging Face](https://www.g2.com/de/sellers/hugging-face)
- **Gründungsjahr:** 2016
- **Hauptsitz:** United States
- **Twitter:** @huggingface (696,651 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/huggingface/ (636 Mitarbeiter*innen auf LinkedIn®)


### 9. [bloom 3b](https://www.g2.com/de/products/bloom-3b/reviews)
  BLOOM-3B ist ein mehrsprachiges Sprachmodell mit 3 Milliarden Parametern, das von der BigScience-Initiative entwickelt wurde. Als verkleinerte Version des größeren BLOOM-Modells behält es die gleiche Architektur und Trainingsziele bei und bietet ein Gleichgewicht zwischen Leistung und Recheneffizienz. Es wurde entwickelt, um kohärenten und kontextuell relevanten Text zu generieren und unterstützt 46 natürliche Sprachen und 13 Programmiersprachen, was es vielseitig für eine Vielzahl von Anwendungen macht. Hauptmerkmale und Funktionalität: - Mehrsprachige Fähigkeit: Trainiert auf einem vielfältigen Datensatz, der 46 natürliche Sprachen und 13 Programmiersprachen umfasst, was es ihm ermöglicht, Text in verschiedenen sprachlichen Kontexten zu verstehen und zu generieren. - Transformer-basierte Architektur: Nutzt ein reines Decoder-Transformer-Modell mit 30 Schichten und 32 Aufmerksamkeitsköpfen, was eine effiziente Verarbeitung von Eingabesequenzen ermöglicht. - Umfangreicher Wortschatz: Verwendet einen Tokenizer mit einem Vokabular von 250.680 Tokens, was eine nuancierte Textgenerierung und -verständnis ermöglicht. - Effizientes Training: Entwickelt mit fortschrittlichen Trainingstechniken und Infrastruktur, um ein Gleichgewicht zwischen Modellgröße und Leistung sicherzustellen. Primärer Wert und Benutzerlösungen: BLOOM-3B adressiert das Bedürfnis nach einem leistungsstarken, aber rechnerisch handhabbaren Sprachmodell, das in der Lage ist, mehrsprachige Aufgaben zu bewältigen. Seine umfangreiche Sprachunterstützung und effiziente Architektur machen es geeignet für Anwendungen wie maschinelle Übersetzung, Inhaltserstellung und Code-Vervollständigung. Indem es ein Modell bereitstellt, das Leistung mit Ressourcenanforderungen ausgleicht, ermöglicht BLOOM-3B Forschern und Entwicklern, fortschrittliches Sprachverständnis in ihre Projekte zu integrieren, ohne umfangreiche Rechenressourcen zu benötigen.


**Who Is the Company Behind bloom 3b?**

- **Verkäufer:** [Hugging Face](https://www.g2.com/de/sellers/hugging-face)
- **Gründungsjahr:** 2016
- **Hauptsitz:** United States
- **Twitter:** @huggingface (696,651 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/huggingface/ (636 Mitarbeiter*innen auf LinkedIn®)


### 10. [bloom 7b1](https://www.g2.com/de/products/bloom-7b1/reviews)
  BLOOM-7B1 ist ein mehrsprachiges Sprachmodell, das von BigScience entwickelt wurde und darauf abzielt, menschenähnlichen Text in 48 Sprachen zu generieren. Mit über 7 Milliarden Parametern nutzt es eine transformerbasierte Architektur, um Aufgaben wie Textgenerierung, Übersetzung und Zusammenfassung auszuführen. Trainiert auf vielfältigen Datensätzen, strebt BLOOM-7B1 an, genaue und kontextuell relevante Ergebnisse zu liefern, was es zu einem wertvollen Werkzeug für Forscher und Entwickler im Bereich der natürlichen Sprachverarbeitung macht. Hauptmerkmale und Funktionalität: - Mehrsprachige Fähigkeit: Unterstützt 48 Sprachen und ermöglicht eine breite Palette von Anwendungen in verschiedenen sprachlichen Kontexten. - Transformerbasierte Architektur: Nutzt ein reines Decoder-Transformermodell mit 30 Schichten und 32 Aufmerksamkeitsköpfen, was eine effiziente und effektive Textverarbeitung erleichtert. - Umfangreiche Trainingsdaten: Trainiert auf einem großen und vielfältigen Korpus, was Robustheit und Vielseitigkeit im Umgang mit verschiedenen textbasierten Aufgaben gewährleistet. - Offener Zugang: Veröffentlicht unter der RAIL-Lizenz v1.0, fördert Transparenz und Zusammenarbeit innerhalb der KI-Community. Primärer Wert und Problemlösung: BLOOM-7B1 adressiert das Bedürfnis nach einem groß angelegten, offenen mehrsprachigen Sprachmodell, das in der Lage ist, Text in zahlreichen Sprachen zu verstehen und zu generieren. Es befähigt Benutzer, Anwendungen zu entwickeln, die qualitativ hochwertige natürliche Sprachverarbeitung und -generierung erfordern, wie maschinelle Übersetzung, Inhaltserstellung und Konversationsagenten. Durch die Bereitstellung eines leistungsstarken und zugänglichen Werkzeugs fördert BLOOM-7B1 Innovation und Forschung im Bereich der natürlichen Sprachverarbeitung.


**Who Is the Company Behind bloom 7b1?**

- **Verkäufer:** [Hugging Face](https://www.g2.com/de/sellers/hugging-face)
- **Gründungsjahr:** 2016
- **Hauptsitz:** United States
- **Twitter:** @huggingface (696,651 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/huggingface/ (636 Mitarbeiter*innen auf LinkedIn®)


### 11. [Gemma 3 1B](https://www.g2.com/de/products/gemma-3-1b/reviews)
  Gemma 3 270M ist ein kompaktes, textbasiertes Modell innerhalb der Gemma-Familie generativer KI-Modelle, das für eine Vielzahl von Textgenerierungsaufgaben wie Fragenbeantwortung, Zusammenfassung und Argumentation entwickelt wurde. Mit 270 Millionen Parametern bietet es ein Gleichgewicht zwischen Leistung und Effizienz und ist somit für Anwendungen mit begrenzten Rechenressourcen geeignet. Hauptmerkmale und Funktionalität: - Textgenerierung: In der Lage, kohärenten und kontextuell relevanten Text für Aufgaben wie Zusammenfassung und Fragenbeantwortung zu generieren. - Funktionsaufruf: Unterstützt Funktionsaufrufe, was die Erstellung von Schnittstellen in natürlicher Sprache für Programmierfunktionen ermöglicht. - Breite Sprachunterstützung: Trainiert, um über 140 Sprachen zu unterstützen, was mehrsprachige Anwendungen erleichtert. - Effiziente Bereitstellung: Seine relativ kleine Größe ermöglicht die Bereitstellung auf Geräten mit begrenzter Rechenleistung. Primärer Wert und Benutzerlösungen: Gemma 3 270M bietet Entwicklern ein vielseitiges und effizientes KI-Modell für textbasierte Anwendungen. Seine Unterstützung für Funktionsaufrufe ermöglicht die Entwicklung von Schnittstellen in natürlicher Sprache, die die Benutzerinteraktion mit Softwaresystemen verbessern. Die breite Sprachunterstützung des Modells ermöglicht die Erstellung von Anwendungen, die ein globales Publikum ansprechen. Darüber hinaus stellt seine kompakte Größe sicher, dass es auf Geräten mit begrenzten Ressourcen bereitgestellt werden kann, wodurch fortschrittliche KI-Fähigkeiten in verschiedenen Umgebungen zugänglich werden.


**Who Is the Company Behind Gemma 3 1B?**

- **Verkäufer:** [Google](https://www.g2.com/de/sellers/google)
- **Gründungsjahr:** 1998
- **Hauptsitz:** Mountain View, CA
- **Twitter:** @google (31,920,059 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1441/ (336,169 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NASDAQ:GOOG


### 12. [Gemma 3 270m](https://www.g2.com/de/products/gemma-3-270m/reviews)
  Gemma 3 270M ist ein kompaktes, textbasiertes Modell innerhalb der Gemma-Familie generativer KI-Modelle, das für eine Vielzahl von Textgenerierungsaufgaben wie Fragenbeantwortung, Zusammenfassung und Argumentation entwickelt wurde. Mit 270 Millionen Parametern bietet es ein Gleichgewicht zwischen Leistung und Effizienz und ist somit für Anwendungen mit begrenzten Rechenressourcen geeignet. Hauptmerkmale und Funktionalität: - Textgenerierung: In der Lage, kohärenten und kontextuell relevanten Text für Aufgaben wie Zusammenfassung und Fragenbeantwortung zu generieren. - Funktionsaufruf: Unterstützt Funktionsaufrufe, was die Erstellung von Schnittstellen für Programmiersprachen in natürlicher Sprache ermöglicht. - Breite Sprachunterstützung: Trainiert, um über 140 Sprachen zu unterstützen, was mehrsprachige Anwendungen erleichtert. - Effiziente Bereitstellung: Die relativ kleine Größe ermöglicht die Bereitstellung auf Geräten mit begrenzter Rechenleistung. Primärer Wert und Benutzerlösungen: Gemma 3 270M bietet Entwicklern ein vielseitiges und effizientes KI-Modell für textbasierte Anwendungen. Die Unterstützung für Funktionsaufrufe ermöglicht die Entwicklung von Schnittstellen in natürlicher Sprache, die die Benutzerinteraktion mit Softwaresystemen verbessern. Die breite Sprachunterstützung des Modells ermöglicht die Erstellung von Anwendungen, die ein globales Publikum ansprechen. Darüber hinaus stellt die kompakte Größe sicher, dass es auf Geräten mit begrenzten Ressourcen bereitgestellt werden kann, wodurch fortschrittliche KI-Fähigkeiten in verschiedenen Umgebungen zugänglich werden.


**Who Is the Company Behind Gemma 3 270m?**

- **Verkäufer:** [Google](https://www.g2.com/de/sellers/google)
- **Gründungsjahr:** 1998
- **Hauptsitz:** Mountain View, CA
- **Twitter:** @google (31,920,059 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1441/ (336,169 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NASDAQ:GOOG


### 13. [Gemma 3 4B](https://www.g2.com/de/products/gemma-3-4b/reviews)
  Gemma 3 270M ist ein kompaktes, textbasiertes Modell innerhalb der Gemma-Familie generativer KI-Modelle, das für eine Vielzahl von Textgenerierungsaufgaben wie Fragenbeantwortung, Zusammenfassung und Argumentation entwickelt wurde. Mit 270 Millionen Parametern bietet es ein Gleichgewicht zwischen Leistung und Effizienz und ist somit für Anwendungen mit begrenzten Rechenressourcen geeignet. Hauptmerkmale und Funktionalität: - Textgenerierung: In der Lage, kohärenten und kontextuell relevanten Text für Aufgaben wie Zusammenfassung und Fragenbeantwortung zu generieren. - Funktionsaufruf: Unterstützt Funktionsaufrufe, was die Erstellung von Schnittstellen in natürlicher Sprache für Programmierfunktionen ermöglicht. - Breite Sprachunterstützung: Trainiert, um über 140 Sprachen zu unterstützen, was mehrsprachige Anwendungen erleichtert. - Effiziente Bereitstellung: Die relativ kleine Größe ermöglicht die Bereitstellung auf Geräten mit begrenzter Rechenleistung. Primärer Wert und Benutzerlösungen: Gemma 3 270M bietet Entwicklern ein vielseitiges und effizientes KI-Modell für textbasierte Anwendungen. Die Unterstützung für Funktionsaufrufe ermöglicht die Entwicklung von Schnittstellen in natürlicher Sprache, die die Benutzerinteraktion mit Softwaresystemen verbessern. Die breite Sprachunterstützung des Modells ermöglicht die Erstellung von Anwendungen, die ein globales Publikum ansprechen. Darüber hinaus stellt die kompakte Größe sicher, dass es auf Geräten mit begrenzten Ressourcen bereitgestellt werden kann, wodurch fortschrittliche KI-Fähigkeiten in verschiedenen Umgebungen zugänglich werden.


**Who Is the Company Behind Gemma 3 4B?**

- **Verkäufer:** [Google](https://www.g2.com/de/sellers/google)
- **Gründungsjahr:** 1998
- **Hauptsitz:** Mountain View, CA
- **Twitter:** @google (31,920,059 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1441/ (336,169 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NASDAQ:GOOG


### 14. [Gemma 3n 2b](https://www.g2.com/de/products/gemma-3n-2b/reviews)
  Gemma 3n ist ein generatives KI-Modell, das für den Einsatz auf Alltagsgeräten wie Smartphones, Laptops und Tablets optimiert ist. Es führt Innovationen in der parameter-effizienten Verarbeitung ein, einschließlich der Per-Layer Embedding (PLE) Parameter-Caching und der MatFormer-Architektur, die gemeinsam die Rechen- und Speicheranforderungen reduzieren. Das Modell unterstützt Audio-, Text- und visuelle Eingaben und ermöglicht eine breite Palette von Anwendungen von Spracherkennung bis hin zur Bildanalyse. Hauptmerkmale und Funktionalität: - Audioeingabeverarbeitung: Verarbeitet Audiodaten für Aufgaben wie Spracherkennung, Übersetzung und Audioanalyse. - Multimodale Fähigkeiten: Handhabt visuelle und Texteingaben und erleichtert das umfassende Verständnis und die Analyse verschiedener Datentypen. - Vision-Encoder: Integriert einen leistungsstarken MobileNet-V5-Encoder, um die Geschwindigkeit und Genauigkeit der visuellen Datenverarbeitung zu verbessern. - PLE-Caching: Nutzt Per-Layer Embedding-Parameter, die im lokalen Speicher zwischengespeichert werden können, um den Speicherverbrauch während der Modellausführung zu reduzieren. - MatFormer-Architektur: Verwendet die Matryoshka-Transformer-Architektur, die eine selektive Aktivierung von Modellparametern ermöglicht, um die Rechenkosten und Antwortzeiten zu verringern. - Bedingtes Parameterladen: Bietet die Flexibilität, spezifische Parameter dynamisch zu laden, wie z.B. für Vision und Audio, um den Speicherverbrauch basierend auf den Aufgabenanforderungen zu optimieren. - Umfassende Sprachunterstützung: In über 140 Sprachen trainiert, was umfangreiche sprachliche Fähigkeiten ermöglicht. - 32K Token-Kontextfenster: Bietet einen erheblichen Eingabekontext, der die Verarbeitung großer Datensätze und komplexer Aufgaben ermöglicht. Primärer Wert und Benutzerlösungen: Gemma 3n adressiert die Herausforderung, fortschrittliche KI-Fähigkeiten auf ressourcenbeschränkten Geräten bereitzustellen, indem es ein Modell bietet, das Leistung mit Effizienz ausbalanciert. Sein parameter-effizientes Design stellt sicher, dass Benutzer anspruchsvolle KI-Anwendungen ausführen können, ohne die Geräteleistung oder die Akkulaufzeit zu beeinträchtigen. Die Unterstützung des Modells für mehrere Eingabemodalitäten – Audio, Text und visuell – ermöglicht es Entwicklern, vielseitige Anwendungen zu erstellen, die Inhalte über verschiedene Datentypen hinweg interpretieren und generieren können. Durch die Bereitstellung offener Gewichte und Lizenzen für verantwortungsvolle kommerzielle Nutzung befähigt Gemma 3n Entwickler, das Modell in verschiedenen Projekten zu optimieren und einzusetzen und fördert so Innovationen in KI-Anwendungen auf verschiedenen Plattformen und Geräten.


**Who Is the Company Behind Gemma 3n 2b?**

- **Verkäufer:** [Google](https://www.g2.com/de/sellers/google)
- **Gründungsjahr:** 1998
- **Hauptsitz:** Mountain View, CA
- **Twitter:** @google (31,920,059 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1441/ (336,169 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NASDAQ:GOOG


### 15. [Gemma 3n 4b](https://www.g2.com/de/products/gemma-3n-4b/reviews)
  Gemma 3n ist ein generatives KI-Modell, das für den Einsatz auf Alltagsgeräten wie Smartphones, Laptops und Tablets optimiert ist. Es führt Innovationen in der parameter-effizienten Verarbeitung ein, einschließlich der Per-Layer Embedding (PLE) Parameter-Caching und der MatFormer-Architektur, die gemeinsam die Rechen- und Speicheranforderungen reduzieren. Das Modell unterstützt Audio-, Text- und visuelle Eingaben und ermöglicht eine breite Palette von Anwendungen, von Spracherkennung bis hin zur Bildanalyse. Hauptmerkmale und Funktionalität: - Audioeingabeverarbeitung: Verarbeitet Audiodaten für Aufgaben wie Spracherkennung, Übersetzung und Audioanalyse. - Multimodale Fähigkeiten: Handhabt visuelle und Texteingaben und erleichtert das umfassende Verständnis und die Analyse verschiedener Datentypen. - Vision-Encoder: Integriert einen leistungsstarken MobileNet-V5-Encoder, um die Geschwindigkeit und Genauigkeit der visuellen Datenverarbeitung zu verbessern. - PLE-Caching: Nutzt Per-Layer Embedding-Parameter, die im lokalen Speicher zwischengespeichert werden können, um den Speicherverbrauch während der Modellausführung zu reduzieren. - MatFormer-Architektur: Verwendet die Matryoshka-Transformer-Architektur, die eine selektive Aktivierung von Modellparametern ermöglicht, um die Rechenkosten und Antwortzeiten zu verringern. - Bedingtes Parameterladen: Bietet die Flexibilität, spezifische Parameter dynamisch zu laden, wie z.B. für Vision und Audio, um den Speicherverbrauch basierend auf den Aufgabenanforderungen zu optimieren. - Umfangreiche Sprachunterstützung: In über 140 Sprachen trainiert, was umfassende sprachliche Fähigkeiten ermöglicht. - 32K-Token-Kontextfenster: Bietet einen erheblichen Eingabekontext, der die Verarbeitung großer Datensätze und komplexer Aufgaben ermöglicht. Primärer Wert und Benutzerlösungen: Gemma 3n adressiert die Herausforderung, fortschrittliche KI-Fähigkeiten auf ressourcenbeschränkten Geräten bereitzustellen, indem es ein Modell bietet, das Leistung mit Effizienz ausbalanciert. Sein parameter-effizientes Design stellt sicher, dass Benutzer anspruchsvolle KI-Anwendungen ausführen können, ohne die Geräteleistung oder die Akkulaufzeit zu beeinträchtigen. Die Unterstützung des Modells für mehrere Eingabemodalitäten – Audio, Text und visuell – ermöglicht es Entwicklern, vielseitige Anwendungen zu erstellen, die Inhalte über verschiedene Datentypen hinweg interpretieren und generieren können. Durch die Bereitstellung offener Gewichte und Lizenzen für verantwortungsvolle kommerzielle Nutzung befähigt Gemma 3n Entwickler, das Modell in verschiedenen Projekten fein abzustimmen und einzusetzen, was Innovationen in KI-Anwendungen auf verschiedenen Plattformen und Geräten fördert.


**Who Is the Company Behind Gemma 3n 4b?**

- **Verkäufer:** [Google](https://www.g2.com/de/sellers/google)
- **Gründungsjahr:** 1998
- **Hauptsitz:** Mountain View, CA
- **Twitter:** @google (31,920,059 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1441/ (336,169 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NASDAQ:GOOG


### 16. [granite 3.1 MoE 1b](https://www.g2.com/de/products/granite-3-1-moe-1b/reviews)
  Granite-3.1-1B-A400M-Base ist ein Sprachmodell, das von IBMs Granite-Team entwickelt wurde und darauf ausgelegt ist, umfangreiche Kontextlängen von bis zu 128K Tokens zu verarbeiten. Dieses Modell basiert auf einer reinen Decoder-Architektur mit einem spärlichen Mixture of Experts (MoE) Transformer, der feinkörnige Experten, dropless Token-Routing und eine Lastenausgleichsverlustfunktion integriert. Es unterstützt mehrere Sprachen, darunter Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch. Hauptmerkmale und Funktionalität: - Erweiterte Kontextlänge: Unterstützt Sequenzen von bis zu 128K Tokens, was die Verarbeitung von Langform-Inhalten ermöglicht. - Spärliche Mixture of Experts Architektur: Nutzt feinkörnige Experten, um die Recheneffizienz und die Modellleistung zu verbessern. - Mehrsprachige Unterstützung: Vortrainiert auf verschiedenen Sprachen, was Anwendungen in unterschiedlichen sprachlichen Kontexten erleichtert. - Vielseitige Anwendungen: Geeignet für Aufgaben wie Zusammenfassung, Textklassifikation, Extraktion und Fragebeantwortung. Primärer Wert und Benutzerlösungen: Granite-3.1-1B-A400M-Base adressiert das Bedürfnis, umfangreiche Textdaten zu verarbeiten, indem es Langkontextsequenzen von bis zu 128K Tokens unterstützt. Seine spärliche MoE-Architektur sorgt für eine effiziente Berechnung, ohne die Leistung zu beeinträchtigen. Die mehrsprachigen Fähigkeiten des Modells machen es anpassungsfähig für globale Anwendungen, und seine Vielseitigkeit ermöglicht es den Benutzern, es für spezifische Aufgaben zu optimieren, was die Entwicklung spezialisierter Sprachverarbeitungslösungen verbessert.


**Who Is the Company Behind granite 3.1 MoE 1b?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 17. [granite 3.2 2b](https://www.g2.com/de/products/granite-3-2-2b/reviews)
  Granite-3.2-2B-Instruct ist ein Sprachmodell mit 2 Milliarden Parametern, das von IBMs Granite-Team entwickelt wurde, um eine Vielzahl von Aufgaben zur Befolgung von Anweisungen zu bewältigen. Aufgebaut auf seinem Vorgänger, Granite-3.1-2B-Instruct, wurde dieses Modell mithilfe einer Kombination aus permissiv lizenzierten Open-Source-Datensätzen und intern generierten synthetischen Daten feinabgestimmt, wobei der Schwerpunkt auf der Verbesserung der Denkfähigkeiten liegt. Es unterstützt mehrere Sprachen, darunter Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch, mit der Flexibilität für Benutzer, es für zusätzliche Sprachen feinabzustimmen. Hauptmerkmale und Funktionalität: - Denkfähigkeiten: Das Modell ist feinabgestimmt, um komplexe Denkaufgaben auszuführen, was nuanciertere und kontextuell relevante Antworten ermöglicht. - Zusammenfassung: Es kann prägnante Zusammenfassungen langer Texte erstellen, was bei der Informationsverdichtung hilft. - Textklassifikation und -extraktion: Das Modell ist in der Lage, Texte in vordefinierte Klassen zu kategorisieren und relevante Informationen aus unstrukturierten Daten zu extrahieren. - Frage-Antwort: Es kann genaue Antworten auf Benutzeranfragen basierend auf dem Eingabekontext liefern. - Retrieval Augmented Generation (RAG): Verbessert die Antwortgenerierung durch das Abrufen relevanter Informationen aus externen Quellen. - Aufgaben im Zusammenhang mit Code: Unterstützt bei der Codegenerierung, -vervollständigung und -debugging und unterstützt verschiedene Programmiersprachen. - Aufgaben zur Funktionsausführung: Erleichtert die Ausführung spezifischer Funktionen oder Operationen basierend auf Benutzeranweisungen. - Anwendungsfälle für mehrsprachige Dialoge: Unterstützt Gespräche in mehreren Sprachen und ermöglicht so einen breiteren Zugang. - Aufgaben mit langem Kontext: Bewältigt Aufgaben, die umfangreichen Kontext erfordern, wie das Zusammenfassen langer Dokumente oder das Beantworten von Fragen basierend auf umfangreichen Eingaben. Primärer Wert und Benutzerlösungen: Granite-3.2-2B-Instruct bietet eine vielseitige Lösung für Entwickler und Unternehmen, die ein fortschrittliches Sprachmodell suchen, das in der Lage ist, eine Vielzahl von Anweisungen zu verstehen und auszuführen. Seine verbesserten Denkfähigkeiten und die Unterstützung mehrerer Sprachen machen es geeignet für Anwendungen, die von KI-Assistenten bis hin zu komplexen Datenanalysetools reichen. Durch die Bereitstellung von Funktionen wie Zusammenfassung, Textklassifikation und Codeunterstützung adressiert das Modell das Bedürfnis nach effizienter und genauer Verarbeitung vielfältiger Aufgaben und verbessert so die Produktivität und Benutzerbindung.


**Who Is the Company Behind granite 3.2 2b?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 18. [granite 3.2 8b](https://www.g2.com/de/products/granite-3-2-8b/reviews)
  Granite-3.2-8B-Instruct ist ein KI-Modell mit 8 Milliarden Parametern, das für fortgeschrittene Denkaufgaben optimiert wurde. Aufgebaut auf seinem Vorgänger, Granite-3.1-8B-Instruct, wurde es mit einer Kombination aus permissiv lizenzierten Open-Source-Datensätzen und intern generierten synthetischen Daten trainiert, die auf komplexe Problemlösungen zugeschnitten sind. Das Modell bietet kontrollierbare Denkfähigkeiten, um sicherzustellen, dass seine Anwendung präzise und kontextuell angemessen ist. Hauptmerkmale und Funktionalität: - Fortgeschrittenes Denken: Verbesserte Denkfähigkeiten für komplexe Problemlösungen. - Zusammenfassung: Fähigkeit, lange Texte in prägnante Zusammenfassungen zu verdichten. - Textklassifikation und -extraktion: Kategorisiert und extrahiert effizient relevante Informationen aus Texten. - Frage-Antwort: Bietet genaue Antworten auf Benutzeranfragen. - Retrieval Augmented Generation (RAG): Integriert externe Informationsbeschaffung für angereicherte Antworten. - Aufgaben im Zusammenhang mit Code: Unterstützt bei der Code-Generierung und -Verständnis. - Aufgaben zur Funktionsausführung: Führt spezifische Funktionen basierend auf Benutzeranweisungen aus. - Unterstützung für mehrsprachige Dialoge: Handhabt Gespräche in mehreren Sprachen, darunter Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch. - Verarbeitung von langen Kontexten: Bewältigt Aufgaben, die umfangreiche Inhalte beinhalten, wie z.B. die Zusammenfassung langer Dokumente und die Transkription von Besprechungen. Primärer Wert und Benutzerlösungen: Granite-3.2-8B-Instruct erfüllt das Bedürfnis nach einem vielseitigen KI-Modell, das in der Lage ist, eine breite Palette von Aufgaben in verschiedenen Bereichen zu bewältigen. Seine fortgeschrittenen Denkfähigkeiten und die Unterstützung mehrerer Sprachen machen es geeignet für Anwendungen in Wirtschaft, Forschung und Technologie. Durch das Angebot kontrollierbarer Denkfähigkeiten stellt es sicher, dass komplexe Problemlösungen angemessen angewendet werden, was die Effizienz und Genauigkeit in Benutzerinteraktionen verbessert.


**Who Is the Company Behind granite 3.2 8b?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 19. [granite 3.3 2b](https://www.g2.com/de/products/granite-3-3-2b/reviews)
  Granite-3.3-2B-Instruct ist ein Sprachmodell mit 2 Milliarden Parametern, das von IBMs Granite-Team entwickelt wurde, um die Fähigkeiten in Bezug auf logisches Denken und Befolgen von Anweisungen zu verbessern. Mit einer Kontextlänge von 128K Tokens baut es auf dem Granite-3.3-2B-Base-Modell auf und bietet signifikante Verbesserungen in Benchmarks wie AlpacaEval-2.0 und Arena-Hard sowie in Mathematik-, Programmier- und Anweisungsbefolgungsaufgaben. Das Modell unterstützt strukturiertes Denken durch die Verwendung von `&lt;think&gt;` und `&lt;response&gt;` Tags, die eine klare Trennung zwischen internen Gedanken und endgültigen Ausgaben ermöglichen. Es wurde auf einer sorgfältig ausgewogenen Kombination aus permissiv lizenzierten Daten und kuratierten synthetischen Aufgaben trainiert.

Hauptmerkmale und Funktionalität:

- Verbesserte Fähigkeiten im logischen Denken und Befolgen von Anweisungen: Feinabgestimmt, um die Leistung beim Verstehen und Ausführen komplexer Anweisungen zu verbessern.
- Unterstützung für strukturiertes Denken: Nutzt `&lt;think&gt;` und `&lt;response&gt;` Tags, um interne Verarbeitung von endgültigen Ausgaben zu trennen.
- Mehrsprachige Unterstützung: Unterstützt mehrere Sprachen, darunter Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch.
- Vielseitige Fähigkeiten: Hervorragend in Aufgaben wie Zusammenfassung, Textklassifikation, Textextraktion, Frage-Antwort, retrieval-augmented generation (RAG), codebezogene Aufgaben, Funktionsaufruf-Aufgaben, mehrsprachiger Dialog und Langkontext-Aufgaben wie Dokumentenzusammenfassung und Frage-Antwort.

Primärer Wert und Benutzerlösungen:

Granite-3.3-2B-Instruct adressiert das Bedürfnis nach fortschrittlichen Sprachmodellen, die in der Lage sind, komplexe Denk- und Anweisungsbefolgungsaufgaben in verschiedenen Bereichen zu bewältigen. Seine Unterstützung für strukturiertes Denken und mehrsprachige Fähigkeiten machen es zu einem wertvollen Werkzeug für Entwickler und Unternehmen, die anspruchsvolle KI-Assistenten in ihre Anwendungen integrieren möchten. Durch die klare Trennung zwischen interner Verarbeitung und Ausgaben verbessert es die Transparenz und Zuverlässigkeit in KI-gesteuerten Lösungen.&lt;/response&gt;&lt;/think&gt;&lt;/response&gt;&lt;/think&gt;


**Who Is the Company Behind granite 3.3 2b?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 20. [granite 3.3 8b](https://www.g2.com/de/products/granite-3-3-8b/reviews)
  Granite-3.3-8B-Instruct ist ein fortschrittliches Sprachmodell, das von IBMs Granite-Team entwickelt wurde und über 8 Milliarden Parameter sowie eine Kontextlänge von 128K verfügt. Es wurde für verbesserte Fähigkeiten in den Bereichen Schlussfolgerung und Befolgung von Anweisungen feinabgestimmt und baut auf dem Granite-3.3-8B-Base-Modell auf, um signifikante Verbesserungen in verschiedenen Benchmarks, einschließlich AlpacaEval-2.0 und Arena-Hard, zu liefern. Das Modell glänzt in Aufgaben wie Mathematik, Programmierung und strukturiertem Denken und verwendet spezielle Tags, um zwischen internen Denkprozessen und endgültigen Ausgaben zu unterscheiden. Es wurde auf einer sorgfältig ausgewogenen Kombination aus permissiv lizenzierten Daten und kuratierten synthetischen Aufgaben trainiert und unterstützt mehrere Sprachen, darunter Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch. Hauptmerkmale und Funktionalität: - Verbesserte Befolgung von Anweisungen: Feinabgestimmt, um komplexe Anweisungen mit hoher Genauigkeit zu verstehen und auszuführen. - Unterstützung für strukturiertes Denken: Verwendet `&lt;think&gt;` und `&lt;response&gt;` Tags, um interne Überlegungen von endgültigen Ausgaben zu trennen und die Klarheit zu erhöhen.
- Mehrsprachige Fähigkeiten: Unterstützt 12 Sprachen und ermöglicht vielfältige Anwendungen auf globalen Märkten.
- Vielseitige Aufgabenbearbeitung: Kompetent in Aufgaben wie Zusammenfassung, Textklassifikation, Textextraktion, Frage-Antwort, auf Code bezogene Aufgaben und Funktionsaufruf-Aufgaben.
- Verarbeitung von langen Kontexten: In der Lage, Aufgaben mit langem Kontext zu bewältigen, einschließlich Dokumentenzusammenfassung und langformige Frage-Antwort.

Primärer Wert und Benutzerlösungen:

Granite-3.3-8B-Instruct adressiert das Bedürfnis nach einem robusten, vielseitigen Sprachmodell, das in der Lage ist, komplexe Anweisungen in verschiedenen Bereichen zu verstehen und auszuführen. Seine verbesserten Schlussfolgerungsfähigkeiten und die Unterstützung für mehrere Sprachen machen es zu einem unschätzbaren Werkzeug für Entwickler und Unternehmen, die fortschrittliche KI in ihre Anwendungen integrieren möchten. Durch die klare Trennung zwischen internen Gedanken und endgültigen Ausgaben gewährleistet das Modell Transparenz und Zuverlässigkeit in KI-generierten Inhalten. Seine Kompetenz in der Bearbeitung von Aufgaben mit langem Kontext und vielfältigen Funktionalitäten befähigt Benutzer, anspruchsvolle KI-Assistenten zu entwickeln, Arbeitsabläufe zu optimieren und Benutzererfahrungen in einer Vielzahl von Anwendungen zu verbessern.&lt;/response&gt;&lt;/think&gt;


**Who Is the Company Behind granite 3.3 8b?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 21. [granite 4 tiny](https://www.g2.com/de/products/granite-4-tiny/reviews)
  Granite-4.0-Tiny-Preview ist ein 7-Milliarden-Parameter-Modell mit feinkörniger hybrider Mischung von Experten (MoE) zur Befolgung von Anweisungen, das von IBMs Granite-Team entwickelt wurde. Feinabgestimmt aus dem Granite-4.0-Tiny-Base-Preview, nutzt es eine Kombination aus Open-Source-Anweisungsdatensätzen und intern generierten synthetischen Daten, um Probleme mit langen Kontexten zu adressieren. Das Modell verwendet Techniken wie überwachte Feinabstimmung und auf Verstärkungslernen basierende Ausrichtung, um seine Leistung in strukturierten Chat-Formaten zu verbessern. Hauptmerkmale und Funktionalität: - Mehrsprachige Unterstützung: Bearbeitet Aufgaben in Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch. - Vielseitige Fähigkeiten: Hervorragend in Zusammenfassung, Textklassifikation, Extraktion, Frage-Antwort, retrieval-augmented generation (RAG), codebezogenen Aufgaben, Funktionsaufrufen, mehrsprachigen Dialogen und Aufgaben mit langem Kontext wie Dokumentenzusammenfassung und Frage-Antwort. - Fortgeschrittene Trainingstechniken: Integriert überwachte Feinabstimmung und Verstärkungslernen für verbesserte Anweisungsbefolgung und Werkzeugaufruffähigkeiten. Primärer Wert und Benutzerlösungen: Granite-4.0-Tiny-Preview ist darauf ausgelegt, allgemeine Anweisungsbefolgungsaufgaben zu bewältigen und kann in KI-Assistenten in verschiedenen Bereichen, einschließlich Geschäftsanwendungen, integriert werden. Seine mehrsprachige Unterstützung und fortgeschrittenen Fähigkeiten machen es zu einem wertvollen Werkzeug für Entwickler, die anspruchsvolle KI-Lösungen entwickeln möchten.


**Who Is the Company Behind granite 4 tiny?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 22. [granite 4 tiny base](https://www.g2.com/de/products/granite-4-tiny-base/reviews)
  Granite-4.0-Tiny-Base-Preview ist ein 7-Milliarden-Parameter-Hybrid-Mixture-of-Experts (MoE) Sprachmodell, das von IBMs Granite-Team entwickelt wurde. Es verfügt über ein Kontextfenster von 128.000 Tokens und nutzt die Mamba-2-Architektur in Kombination mit Softmax-Attention, um die Ausdruckskraft zu erhöhen. Bemerkenswerterweise verzichtet es auf Positionskodierung, um die Generalisierung bei der Länge zu verbessern. Wichtige Merkmale und Funktionalitäten: - Umfangreiches Kontextfenster: Unterstützt bis zu 128.000 Tokens, was die Verarbeitung von langen Dokumenten und komplexen Aufgaben erleichtert. - Fortschrittliche Architektur: Integriert Mamba-2 mit Softmax-Attention, was die Ausdruckskraft und Anpassungsfähigkeit des Modells erhöht. - Mehrsprachige Unterstützung: Trainiert in 12 Sprachen, darunter Englisch, Deutsch, Spanisch, Französisch, Japanisch, Portugiesisch, Arabisch, Tschechisch, Italienisch, Koreanisch, Niederländisch und Chinesisch, mit der Flexibilität zur Feinabstimmung in zusätzlichen Sprachen. - Vielseitige Anwendungen: Entwickelt für Aufgaben wie Zusammenfassung, Textklassifikation, Extraktion, Frage-Antwort und andere Anwendungen mit langem Kontext. Primärer Wert und Benutzerlösungen: Granite-4.0-Tiny-Base-Preview adressiert das Bedürfnis nach einem robusten, mehrsprachigen Sprachmodell, das in der Lage ist, umfangreiche Kontextlängen zu bewältigen. Seine Architektur und sein Training ermöglichen es, eine breite Palette von Text-zu-Text-Generierungsaufgaben effektiv auszuführen, was es geeignet macht für Anwendungen, die tiefes Sprachverständnis und -generierung über mehrere Sprachen hinweg erfordern. Das Design des Modells erlaubt eine Feinabstimmung, wodurch Benutzer es an spezifische Domänen oder Sprachen über die anfänglich unterstützten 12 hinaus anpassen können, und bietet somit Flexibilität und Skalierbarkeit für vielfältige Anwendungsfälle.


**Who Is the Company Behind granite 4 tiny base?**

- **Verkäufer:** [IBM](https://www.g2.com/de/sellers/ibm)
- **Gründungsjahr:** 1911
- **Hauptsitz:** Armonk, New York, United States
- **Twitter:** @IBMSecurity (74,760 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/1009/ (324,553 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** SWX:IBM


### 23. [Llama 3.2 1b](https://www.g2.com/de/products/llama-3-2-1b/reviews)
  Llama 3.2 1B Instruct ist ein mehrsprachiges großes Sprachmodell, das von Meta entwickelt wurde, um fortgeschrittenes Verständnis und Generierung natürlicher Sprache in mehreren Sprachen zu erleichtern. Mit 1 Milliarde Parametern ist dieses Modell für Aufgaben wie Dialoggenerierung, Zusammenfassung und agentische Abfrage optimiert und bietet robuste Leistung in verschiedenen sprachlichen Kontexten. Seine Architektur umfasst überwachte Feinabstimmung (SFT) und Verstärkungslernen mit menschlichem Feedback (RLHF), um die Ausgaben an menschliche Präferenzen für Hilfsbereitschaft und Sicherheit anzupassen. Hauptmerkmale und Funktionalität: - Mehrsprachige Unterstützung: Unterstützt offiziell Englisch, Deutsch, Französisch, Italienisch, Portugiesisch, Hindi, Spanisch und Thailändisch, was Anwendungen in verschiedenen sprachlichen Umgebungen ermöglicht. - Optimierte Transformer-Architektur: Nutzt ein autoregressives Transformer-Design mit gruppierter Abfrageaufmerksamkeit (GQA) für verbesserte Skalierbarkeit der Inferenz. - Feinabstimmungsmöglichkeiten: Unterstützt weitere Feinabstimmung für zusätzliche Sprachen und spezifische Aufgaben, vorausgesetzt, die Einhaltung der Llama 3.2 Community License und der Acceptable Use Policy. - Quantisierungsunterstützung: Verfügbar in verschiedenen quantisierten Formaten, einschließlich 4-Bit und 8-Bit, was die Bereitstellung auf ressourcenbeschränkter Hardware erleichtert. Primärer Wert und Problemlösung: Llama 3.2 1B Instruct adressiert das Bedürfnis nach einem vielseitigen und effizienten mehrsprachigen Sprachmodell, das in der Lage ist, komplexe Aufgaben der Verarbeitung natürlicher Sprache zu bewältigen. Sein Design gewährleistet Skalierbarkeit und Anpassungsfähigkeit, was es für Entwickler und Organisationen geeignet macht, die KI-Lösungen in verschiedenen Sprachen und Anwendungen bereitstellen möchten. Durch die Integration fortschrittlicher Feinabstimmungsmethoden und die Unterstützung mehrerer Quantisierungsformate bietet es ein Gleichgewicht zwischen Leistung und Ressourceneffizienz und bedient eine breite Palette von Anwendungsfällen im Bereich der KI und des maschinellen Lernens.


**Who Is the Company Behind Llama 3.2 1b?**

- **Verkäufer:** [Meta](https://www.g2.com/de/sellers/meta-3e2ff094-c346-4bd2-a24c-d2001c194c6e)
- **Hauptsitz:** N/A
- **LinkedIn®-Seite:** https://www.linkedin.com/company/No-Linkedin-Presence-Added-Intentionally-By-DataOps (1 Mitarbeiter*innen auf LinkedIn®)


### 24. [Llama 3.2 3b](https://www.g2.com/de/products/llama-3-2-3b/reviews)
  Llama 3.2 3B Instruct ist ein mehrsprachiges großes Sprachmodell mit 3 Milliarden Parametern, das von Meta entwickelt wurde und darauf ausgelegt ist, in konversationalen KI-Anwendungen zu glänzen. Es nutzt eine optimierte Transformer-Architektur und wurde durch überwachtes Lernen und Verstärkungslernen mit menschlichem Feedback feinabgestimmt, um seine Leistung bei der Generierung kontextuell relevanter und kohärenter Antworten zu verbessern. Hauptmerkmale und Funktionalität: - Mehrsprachige Kompetenz: Unterstützt mehrere Sprachen und ermöglicht nahtlose Interaktionen in verschiedenen sprachlichen Kontexten. - Optimierte Transformer-Architektur: Nutzt ein fortschrittliches Transformer-Design, um Effizienz und Antwortqualität zu verbessern. - Feinabgestimmtes Training: Setzt auf überwachtes Fein-Tuning und Verstärkungslernen mit menschlichem Feedback, um die konversationalen Fähigkeiten zu verbessern. - Vielseitige Anwendungen: Geeignet für Aufgaben wie agentische Abfrage, Zusammenfassung, assistenzähnliche Chat-Anwendungen, Wissensabfrage und Umschreiben von Anfragen oder Eingaben. Primärer Wert und Benutzerlösungen: Llama 3.2 3B Instruct erfüllt das Bedürfnis nach einem robusten und effizienten Sprachmodell, das in der Lage ist, komplexe konversationale Aufgaben in mehreren Sprachen zu bewältigen. Seine optimierte Architektur und der feinabgestimmte Trainingsprozess gewährleisten qualitativ hochwertige, kontextuell angemessene Antworten und machen es zu einem unschätzbaren Werkzeug für Entwickler und Organisationen, die fortschrittliche, KI-gesteuerte Kommunikationslösungen implementieren möchten.


**Who Is the Company Behind Llama 3.2 3b?**

- **Verkäufer:** [Meta](https://www.g2.com/de/sellers/meta-3e2ff094-c346-4bd2-a24c-d2001c194c6e)
- **Hauptsitz:** N/A
- **LinkedIn®-Seite:** https://www.linkedin.com/company/No-Linkedin-Presence-Added-Intentionally-By-DataOps (1 Mitarbeiter*innen auf LinkedIn®)


### 25. [Magistral Small](https://www.g2.com/de/products/magistral-small/reviews)
  Codestral ist ein generatives KI-Modell mit offenem Gewicht, das von Mistral AI entwickelt wurde und speziell für Aufgaben der Code-Generierung konzipiert ist. Es unterstützt Entwickler beim Schreiben und Interagieren mit Code über einen einheitlichen Anweisungs- und Abschluss-API-Endpunkt. Codestral ist in über 80 Programmiersprachen versiert, darunter Python, Java, C, C++, JavaScript und Bash, und unterstützt auch weniger verbreitete Sprachen wie Swift und Fortran, was es vielseitig in verschiedenen Programmierumgebungen macht. Hauptmerkmale und Funktionalität: - Mehrsprachige Unterstützung: Trainiert auf einem vielfältigen Datensatz, der mehr als 80 Programmiersprachen umfasst, um Anpassungsfähigkeit an verschiedene Entwicklungsprojekte zu gewährleisten. - Code-Vervollständigung und -Generierung: In der Lage, Code-Funktionen zu vervollständigen, Tests zu schreiben und unvollständigen Code mit einem Fill-in-the-Middle-Mechanismus zu ergänzen, wodurch der Programmierprozess optimiert wird. - Integration mit Entwicklungsumgebungen: Über einen dedizierten Endpunkt (`codestral.mistral.ai`) zugänglich, was eine nahtlose Integration in verschiedene integrierte Entwicklungsumgebungen (IDEs) ermöglicht. Primärer Wert und Benutzerlösungen: Codestral steigert die Produktivität von Entwicklern erheblich, indem es routinemäßige Programmieraufgaben automatisiert und die für die Code-Vervollständigung und Testgenerierung erforderliche Zeit und Mühe reduziert. Seine umfangreiche Sprachunterstützung und fortgeschrittenes Code-Verständnis minimieren Fehler und Bugs, sodass sich Entwickler auf komplexe Problemlösungen und Innovationen konzentrieren können. Durch die reibungslose Integration in bestehende Arbeitsabläufe demokratisiert Codestral das Programmieren und macht fortschrittliche KI-unterstützte Entwicklung für eine breitere Benutzergruppe zugänglich.


**Who Is the Company Behind Magistral Small?**

- **Verkäufer:** [Mistral](https://www.g2.com/de/sellers/mistral)
- **Gründungsjahr:** 2023
- **Hauptsitz:** Paris, Île-de-France, France
- **Twitter:** @MistralAI (183,452 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/mistralai/ (787 Mitarbeiter*innen auf LinkedIn®)


    ## What Is Kleine Sprachmodelle (SLMs)?
  [Generative KI-Software](https://www.g2.com/de/categories/generative-ai)