AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#34

GPT-5.4 Mini

OpenAI · Releasedatum: 2026-03-17 · openai/gpt-5.4-mini::medium

Score

7.1

Kosten per resultaat

3.610

Consistentie

7.2

Totale kosten

$0.289

Correcte tests

Foute tests: 9

Slaagpercentage per poging: 68.6%

Instabiele tests

6

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

15.66s

Responstijd (max): 102.91s

Responstijd (totaal): 266.14s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 8.6 7.9
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 4.1 4.4
Algemene intelligentie 4.5 10.0
Instructies opvolgen 7.4 6.5
Puzzeloplossing 6.8 7.9
Toolaanroepen 4.7 1.6

Vergeleken modellen