#61

Mistral Small 4

Mistral · Veröffentlichung: 2026-03-16 · mistralai/mistral-small-2603::none

5.3

Kosten pro Ergebnis

0.108

Konsistenz

9.5

$0.006

Falsche Tests: 12

Erfolgsquote pro Versuch: 33.3%

Instabile Tests

1

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

629ms

Antwortzeit (Maximum): 1.72s

Antwortzeit (Gesamt): 10.70s

Falsche Antwort: 10 Anweisungen nicht befolgt: 2

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Mistral Small 4nonevsKimi K2.5none Mistral Small 4nonevsGrok 4.20 Betanone Mistral Small 4nonevsNemotron 3 Super 120b A12bnoneKostenlos verfügbar Mistral Small 4nonevsGLM 4.7 Flashnone Mistral Small 4nonevsGPT-4o-mininone Mistral Small 4nonevsGemini 3 Flash Previewmedium Mistral Small 4nonevsGemini 3.1 Pro Previewmedium Mistral Small 4nonevsStep 3.5 FlashmediumKostenlos verfügbar

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz	Korrekte Tests
Anti-KI-Tricks	3.4	7.9
Kombiniert	3.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	5.3	10.0
Allgemeine Intelligenz	4.0	10.0
Befolgung von Anweisungen	6.5	10.0
Rätsellösen	3.1	9.9
Werkzeugaufrufe	10.0	10.0

Verglichene Modelle