Navigatie
AI BENCHY
Vergelijken Grafieken Methodologie
โค๏ธ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5-27B

Vergelijken:

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-03-06

Metriek OpenAI: GPT-5.3 Chat none Releasedatum: 2026-03-03 Qwen: Qwen3.5-27B medium Releasedatum: 2026-02-24
Rang #19 #7
Gem. score 7.3 8.2
Consistentie 8.5 9.1
Kosten per resultaat 3.163 3.585
Totale kosten $0.317 $0.431
Correcte tests
Slaagpercentage per poging 70.8% 81.3%
Instabiele tests 3 2
Totaal runs 48 (16 x 3) 48 (16 x 3)
Uitvoer-tokens 19,272 1,658
Redeneer-tokens 0 200,786
Responstijd (gem.) 5.96s 52.13s
Responstijd (max) 18.33s 163.96s
Responstijd (totaal) 95.30s 834.16s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Gem. score vs Responstijd (gem.)

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 9.69s 102 8,956
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Qwen: Qwen3.5-27B 9.9 10.0 100.0% 0 30.26s 270 16,150
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Qwen: Qwen3.5-27B 4.0 10.0 33.3% 0 79.53s 43 52,368
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Qwen: Qwen3.5-27B 5.0 3.1 66.7% 1 101.41s 70 23,147
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen: Qwen3.5-27B 8.3 7.7 77.8% 1 64.61s 245 77,213
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323

Snelle vergelijking

Vergelijkingspaar wisselen