Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Qwen: Qwen3.5-27B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-14

Metriek Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Releasedatum: 2026-02-24 Qwen3.5-27B Qwen3.5-27B medium Releasedatum: 2026-02-24
Score 8.1 8.4
Rang #17 #8
Consistentie 8.6 8.8
Correcte tests
Slaagpercentage per poging 79.6% 81.5%
Instabiele tests 3 3
Totaal runs 54 54
Kosten per resultaat 4.060 3.822
Totale kosten $0.528 $0.497
Invoerprijs $0.260 / 1M $0.195 / 1M
Uitvoerprijs $2.080 / 1M $1.560 / 1M
Uitvoer-tokens 17,635 2,500
Redeneer-tokens 162,668 242,500
Responstijd (gem.) 31.38s 53.03s
Responstijd (max) 119.29s 163.96s
Responstijd (totaal) 564.84s 954.46s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 4.7 1.6 66.7% 1 70.98s 322 10,694
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.18s 289 26,165
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323

Snelle vergelijking

Vergelijkingspaar wisselen