AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#37

GPT-5.2

OpenAI · Releasedatum: 2025-12-11 · openai/gpt-5.2::medium

Score

7.3

Consistentie

8.0

Totale kosten

$0.314

Totaal aantal uitvoer-tokens

19,049

Invoerprijs

$1.750 / 1M

Uitvoerprijs

$14.000 / 1M

Correcte tests

Foute tests: 7

Slaagpercentage per poging: 70.6%

Instabiele tests

4

Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).

Responstijd (gem.)

13.93s

Responstijd (max): 77.80s

Responstijd (totaal): 139.29s

Grafieken

Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Snelle vergelijking

Categorie-uitsplitsing

Categorie Score Consistentie Correcte tests
Anti-AI-trucs 6.5 8.0
Gecombineerd 10.0 10.0
Gegevensparsering en extractie 10.0 10.0
Domeinspecifiek 5.9 7.2
Algemene intelligentie 3.7 9.7
Instructies opvolgen 9.9 10.0
Puzzeloplossing 7.7 7.3
Toolaanroepen 4.7 1.6

Vergeleken modellen