Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Qwen: Qwen3.7 Plus

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-03

Metriek Qwen3.6 Max Preview Qwen3.6 Max Preview medium Releasedatum: 2026-04-20 Qwen3.7 Plus Qwen3.7 Plus medium Releasedatum: 2026-06-03
Score 8.4 8.4
Rang #15 #16
Betrouwbaarheid 10.0 9.9
Consistentie 9.2 9.2
Correcte tests
Slaagpercentage per poging 80.0% 80.0%
Instabiele tests 2 2
Totaal runs 60 60
Kosten per resultaat 6.910 1.324
Totale kosten $0.872 $0.199
Invoerprijs $1.040 / 1M $0.400 / 1M
Uitvoerprijs $6.240 / 1M $1.600 / 1M
Totaal aantal invoer-tokens 39,527 38,104
Uitvoer-tokens 2,253 2,107
Redeneer-tokens 130,852 112,479
Responstijd (gem.) 58.43s 36.84s
Responstijd (max) 238.07s 178.04s
Responstijd (totaal) 1168.66s 736.86s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 22.13s 672 228 10,075
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 8.2 6.7 83.3% 1 177.97s 5,060 407 39,442
Qwen3.7 Plus 6.5 5.9 66.7% 1 122.40s 3,637 396 30,301
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 121.49s 14,934 390 14,575
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 41.15s 7,782 270 10,106
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 2.9 7.2 11.1% 1 95.91s 771 60 30,371
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 32.24s 516 129 3,510
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.31s 699 103 5,848
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 24.32s 696 329 7,693
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 18.32s 8,193 309 1,571
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 60.56s 204 28 7,661
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

Snelle vergelijking

Vergelijkingspaar wisselen