Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Qwen: Qwen3.7 Plus

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-03

Metriek Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Releasedatum: 2026-02-15 Qwen3.7 Plus Qwen3.7 Plus medium Releasedatum: 2026-06-03
Score 8.1 8.4
Rang #19 #16
Betrouwbaarheid 10.0 9.9
Consistentie 8.8 9.2
Correcte tests
Slaagpercentage per poging 76.7% 80.0%
Instabiele tests 3 2
Totaal runs 60 60
Kosten per resultaat 2.251 1.324
Totale kosten $0.283 $0.199
Invoerprijs $0.260 / 1M $0.400 / 1M
Uitvoerprijs $1.560 / 1M $1.600 / 1M
Totaal aantal invoer-tokens 39,028 38,104
Uitvoer-tokens 2,145 2,107
Redeneer-tokens 172,563 112,479
Responstijd (gem.) 67.58s 36.84s
Responstijd (max) 266.69s 178.04s
Responstijd (totaal) 878.57s 736.86s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 672 205 21,236
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 7.6 6.7 66.7% 1 193.80s 5,060 406 63,554
Qwen3.7 Plus 6.5 5.9 66.7% 1 122.40s 3,637 396 30,301
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 14,934 421 7,906
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 7,782 270 14,916
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 444 35 16,680
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 344 73 8,675
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 699 101 7,704
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 696 301 13,853
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 8,193 309 909
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 204 24 17,130
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

Snelle vergelijking

Vergelijkingspaar wisselen