AI BENCHY
Vergleichen Diagramme
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#33

GPT-5 Mini

OpenAI · Veröffentlichung: 2025-08-07 · openai/gpt-5-mini::medium

Ø-Score

5.77

Kosten pro Ergebnis

1.200

Konsistenz

8.80

Gesamtkosten

$0.084

Korrekte Tests

7

Ein Test gilt nur dann als vollständig bestanden, wenn alle Läufe bestanden wurden.

Falsche Tests

7

Erfolgsquote pro Versuch: 57.1%

Instabile Tests

2

Antwortzeit: Durchschn. 21.47s · Gesamt 300.64s · Max. 82.55s

Anweisungen nicht befolgt: 3 Falsche Antwort: 3 Zeitüberschreitung: 1

Top-Modelle nach Score

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Schnellvergleich

Kategorieaufschlüsselung

Kategorie Ø-Score Konsistenz Korrekte Tests
Anti-AI Tricks 7.00 9.62 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 7.21 0/3
Instructions following 7.00 6.64 1/2
Puzzle Solving 4.34 9.78 1/3
Tool Calling 10.00 10.00 1/1