#61
Mistral · Veröffentlichung: 2026-03-16 · mistralai/mistral-small-2603::none
Instabile Tests
1
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Mistral Small 4nonevsKimi K2.5noneMistral Small 4nonevsGrok 4.20 BetanoneMistral Small 4nonevsNemotron 3 Super 120b A12bnoneKostenlos verfügbarMistral Small 4nonevsGLM 4.7 FlashnoneMistral Small 4nonevsGPT-4o-mininoneMistral Small 4nonevsGemini 3 Flash PreviewmediumMistral Small 4nonevsGemini 3.1 Pro PreviewmediumMistral Small 4nonevsStep 3.5 FlashmediumKostenlos verfügbar
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 3.4 | 7.9 | |
| Kombiniert | 3.0 | 10.0 | |
| Datenanalyse und -extraktion | 10.0 | 10.0 | |
| Domänenspezifisch | 5.3 | 10.0 | |
| Allgemeine Intelligenz | 4.0 | 10.0 | |
| Befolgung von Anweisungen | 6.5 | 10.0 | |
| Rätsellösen | 3.1 | 9.9 | |
| Werkzeugaufrufe | 10.0 | 10.0 |