AI BENCHY
Your ad here

#55

Mistral Small 4

Mistral · Releasedatum: 2026-03-16 · mistralai/mistral-small-2603::medium

Score

5.6

Kosten per resultaat

0.502

Consistentie

7.0

Totale kosten

$0.026

Correcte tests

Foute tests: 12

Slaagpercentage per poging: 49.0%

Instabiele tests

6

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

4.18s

Responstijd (max): 25.25s

Responstijd (totaal): 71.03s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 5.6 3.8
Gecombineerd 3.0 10.0
Gegevensparsering en extractie 7.3 5.9
Domeinspecifiek 5.3 7.2
Algemene intelligentie 4.8 10.0
Instructies opvolgen 7.3 5.8
Puzzeloplossing 3.4 9.7
Toolaanroepen 10.0 10.0

Vergeleken modellen