#201

GPT-5.4 Nano

OpenAI Veröffentlichung: 2026-03-17 Getestet am: 2026-07-16 22:35 openai/gpt-5.4-nano::none

(medium) (none)

Zusammenfassung

GPT-5.4 Nano erreicht 4.8 bei AI BENCHY und liegt auf #201. Das Modell hat 10.0 Zuverlässigkeit, 28.8% Erfolgsrate, $0.041 Gesamtkosten und 2.57s durchschnittliche Antwortzeit.

Was GPT-5.4 Nano besonders macht: Am stärksten ist es in Programmierung, wo es #3 erreicht; am schwächsten ist Domänenspezifisch mit #12. Es ist im Vergleich zu ähnlichen Modellen auffällig schnell.

Punktzahl

4.8

Konsistenz

8.2

Zuverlässigkeit

10.0

Gesamtkosten (aktueller Preis)

$0.041

Gesamte Ausgabe-Token

13,794

Gesamte Eingabe-Token

115,924

Eingabepreis

$0.200 / 1M

Ausgabepreis

$1.250 / 1M

Korrekte Tests

Falsche Tests: 18

Erfolgsquote pro Versuch: 28.8%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

2.57s

Antwortzeit (Maximum): 25.50s

Antwortzeit (Gesamt): 56.51s

Falsche Antwort: 15 Anweisungen nicht befolgt: 2 Keine Antwort: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#201 GPT-5.4 Nano

none

Kosten: $0.008
Zeit: 46.1s
Token: 5,735 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-07-16 22:35 Neuer Test hinzugefügt	4.8	10.0	$0.041	Aktueller Lauf
2026-06-04 13:45 Neuer Test hinzugefügt	4.7	10.0	$0.011	Vergleichen
2026-05-22 00:19 Suite geändert	4.5	10.0	$0.010	Vergleichen
2026-04-11 01:44 Erster erfasster Lauf	4.5	k. A.	$0.009	Vergleichen

Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-04 15:40	$0.200 / 1M	$1.250 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

GPT-5.4 NanononevsRing-2.6-1Tnone GPT-5.4 NanononevsTrinity Large Thinkinghigh GPT-5.4 NanononevsLing-2.6-flashnone GPT-5.4 NanononevsKAT-Coder-Air V2.5none GPT-5.4 NanononevsNemotron 3 SupernoneKostenlos verfügbar GPT-5.4 NanononevsTrinity Large Previewnone GPT-5.4 NanononevsGLM 4.7 Flashnone GPT-5.4 NanononevsQwen3 Coder Nextmedium GPT-5.4 NanononevsGPT-4o-mininone GPT-5.4 NanononevsCobuddymedium

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	3.5	8.0
Programmierung	4.6	7.9
Kombiniert	3.0	10.0
Datenanalyse und -extraktion	6.5	10.0
Domänenspezifisch	2.9	4.4
Allgemeine Intelligenz	3.8	2.5
Befolgung von Anweisungen	6.3	10.0
Rätsellösen	5.4	10.0
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#201 GPT-5.4 Nano

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle