AI BENCHY
Vergelijken
❤️ Made by XCS
Your ad here

Modelnaam

OpenAI: GPT-5.3-Codex

Redenering (medium)

Benchmarks gegenereerd uit AI BENCHY-testsuites op : 24 feb 2026

Metriek OpenAI: GPT-5.3-Codex
Rang#6
BedrijfOpenAI
Score 7.77
Consistentie 8.75
Kosten per resultaat 4.9342
Totale kosten $0.44408
Correcte tests
Slaagpercentage per poging 76.9%
Instabiele tests 2
Uitvoer-tokens 947
Redeneer-tokens 29,564
Responstijd (gem.)17944ms
Responstijd (totaal)233267ms
Responstijd (max)100927ms

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Responstijd (gem.) Kosten
Anti-AI-trucs 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Gegevensparsering en extractie 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Domeinspecifiek 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Instructies opvolgen 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Vergeleken modellen

Vergelijk OpenAI: GPT-5.3-Codex met...

#5 · Google

Google: Gemini 3 Flash Preview

Redenering (low)

Score: 8.23

Consistentie: 8.71

Slaagpercentage per poging: 82.0%

Instabiele tests: 2

Kosten per resultaat: 0.6173

Correcte tests:

Totale kosten: $0.06174

Vergelijken

#7 · OpenAI

OpenAI: GPT-5.2

Redenering (medium)

Score: 7.38

Consistentie: 8.73

Slaagpercentage per poging: 76.9%

Instabiele tests: 2

Kosten per resultaat: 2.5637

Correcte tests:

Totale kosten: $0.23074

Vergelijken

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Redenering (medium)

Score: 8.54

Consistentie: 9.35

Slaagpercentage per poging: 87.2%

Instabiele tests: 1

Kosten per resultaat: 2.1621

Correcte tests:

Totale kosten: $0.23784

Vergelijken

Snelle vergelijking

Vergelijk OpenAI: GPT-5.3-Codex met...