Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Qwen3.6 Plus

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-02

Metriek GPT-5.3-Codex GPT-5.3-Codex medium Releasedatum: 2026-02-05 Qwen3.6 Plus Qwen3.6 Plus medium Releasedatum: 2026-04-02 Gratis beschikbaar
Score 8.5 8.4
Rang #8 #9
Consistentie 8.6 9.5
Correcte tests
Slaagpercentage per poging 82.4% 78.4%
Instabiele tests 3 1
Totaal runs 51 51
Kosten per resultaat 4.526 0.000
Totale kosten $0.544 $0.000
Invoerprijs $1.750 / 1M $0.000 / 1M
Uitvoerprijs $14.000 / 1M $0.000 / 1M
Uitvoer-tokens 1,788 1,763
Redeneer-tokens 33,649 83,782
Responstijd (gem.) 15.76s 15.27s
Responstijd (max) 100.93s 43.55s
Responstijd (totaal) 267.97s 259.55s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 207 7,557
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 452 13,073
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 270 10,706
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 56 33,464
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 111 5,232
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 102 5,552
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.11s 298 6,868
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 267 1,330

Snelle vergelijking

Vergelijkingspaar wisselen