#37

GPT-5.2

OpenAI · Veröffentlichung: 2025-12-11 · openai/gpt-5.2::medium

7.3

Konsistenz

8.0

$0.314

Gesamte Ausgabe-Token

19,049

Eingabepreis

$1.750 / 1M

Ausgabepreis

$14.000 / 1M

Falsche Tests: 7

Erfolgsquote pro Versuch: 70.6%

Instabile Tests

4

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

13.93s

Antwortzeit (Maximum): 77.80s

Antwortzeit (Gesamt): 139.29s

Anweisungen nicht befolgt: 3 Falsche Antwort: 2 Keine Antwort: 1 Zeitüberschreitung: 1

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

GPT-5.2mediumvsGPT-5.4 Nanomedium GPT-5.2mediumvsClaude Opus 4.6medium GPT-5.2mediumvsQwen3.5-35B-A3Bmedium GPT-5.2mediumvsGPT-5.3 Chatnone GPT-5.2mediumvsClaude Sonnet 4.6none GPT-5.2mediumvsGemini 3 Flash Previewmedium GPT-5.2mediumvsGemini 3.1 Pro Previewmedium GPT-5.2mediumvsQwen3.6 Plus Previewmedium

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz	Korrekte Tests
Anti-KI-Tricks	6.5	8.0
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	5.9	7.2
Allgemeine Intelligenz	3.7	9.7
Befolgung von Anweisungen	9.9	10.0
Rätsellösen	7.7	7.3
Werkzeugaufrufe	4.7	1.6

Verglichene Modelle