#62

GPT-5 Nano

OpenAI Veröffentlichung: 2025-08-07 Getestet am: 2026-04-11 01:44 openai/gpt-5-nano::medium

Zusammenfassung

GPT-5 Nano erreicht 6.3 bei AI BENCHY und liegt auf #62. Das Modell hat k. A. Zuverlässigkeit, 59.3% Erfolgsrate, $0.066 Gesamtkosten und 44.13s durchschnittliche Antwortzeit.

Was GPT-5 Nano besonders macht: Am stärksten ist es in Programmierung, wo es #3 erreicht; am schwächsten ist Datenanalyse und -extraktion mit #15.

Punktzahl

6.3

Konsistenz

6.5

Zuverlässigkeit

k. A.

Gesamtkosten (aktueller Preis)

$0.066

Gesamte Ausgabe-Token

161,268

Gesamte Eingabe-Token

Eingabepreis

$0.050 / 1M

Ausgabepreis

$0.400 / 1M

Korrekte Tests

Falsche Tests: 11

Erfolgsquote pro Versuch: 59.3%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

44.13s

Antwortzeit (Maximum): 204.02s

Antwortzeit (Gesamt): 485.47s

Falsche Antwort: 7 Anweisungen nicht befolgt: 3 Zeitüberschreitung: 1

Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#62 GPT-5 Nano

medium

Kosten: $0.006
Zeit: 108.5s
Token: 13,209 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-06-04 13:44 Neuer Test hinzugefügt	6.3	10.0	$0.081	Vergleichen
2026-05-22 00:17 Suite geändert	6.1	10.0	$0.076	Vergleichen
2026-04-11 01:44 Erster erfasster Lauf	6.3	k. A.	$0.066	Aktueller Lauf

Laufvergleich

Lauf	Punktzahl	Konsistenz	Zuverlässigkeit	Korrekte Tests	Instabile Tests	Gesamte Ausgabe-Token	Gesamtkosten	Antwortzeit (Durchschnitt)
2026-04-11 01:44 · Erster erfasster Lauf	6.3	6.5	k. A.	7/18	8	161,268	$0.066	44.13s
2026-05-22 00:17 · Suite geändert	6.1	7.1	10.0	8/20	7	184,922	$0.076	43.11s
Differenz	+0.2	-0.6		-1	+1	-23654	-$0.010	+1022ms

Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

GPT-5 NanomediumvsGemini 3.5 Flashminimal GPT-5 NanomediumvsQwen3.7 Maxnone GPT-5 NanomediumvsRing-2.6-1Tmedium GPT-5 NanomediumvsGemini 3 Flash Previewnone GPT-5 NanomediumvsGemini 3.5 Flashhigh GPT-5 NanomediumvsGemini 3 Flash Previewmedium GPT-5 NanomediumvsNemotron 3 Ultra 550b A55bmediumKostenlos verfügbar GPT-5 NanomediumvsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	6.5	7.9
Programmierung	6.7	3.5
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	3.7	1.7
Domänenspezifisch	5.2	4.4
Allgemeine Intelligenz	4.1	10.0
Befolgung von Anweisungen	8.5	6.8
Rätsellösen	5.3	7.2
Werkzeugaufrufe	10.0	10.0

GPT-5 Nano

Hamster playing table tennis

#62 GPT-5 Nano

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle