AI BENCHY
Your ad here

#66

GPT-5.4 Mini

OpenAI · Veröffentlichung: 2026-03-17 · openai/gpt-5.4-mini::none

Punktzahl

4.8

Kosten pro Ergebnis

0.737

Konsistenz

8.6

Gesamtkosten

$0.030

Korrekte Tests

Falsche Tests: 13

Erfolgsquote pro Versuch: 31.4%

Instabile Tests

3

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

1.17s

Antwortzeit (Maximum): 2.52s

Antwortzeit (Gesamt): 19.82s

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Kategorie Punktzahl Konsistenz Korrekte Tests
Anti-KI-Tricks 3.1 8.1
Kombiniert 3.0 10.0
Datenanalyse und -extraktion 10.0 10.0
Domänenspezifisch 3.5 4.4
Allgemeine Intelligenz 4.8 10.0
Befolgung von Anweisungen 6.3 10.0
Rätsellösen 5.4 10.0
Werkzeugaufrufe 3.0 10.0

Verglichene Modelle