Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-27B vs Qwen: Qwen3.6 35B A3B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-10

Metriek Qwen3.5-27B Qwen3.5-27B medium Releasedatum: 2026-02-24 Qwen3.6 35B A3B Qwen3.6 35B A3B medium Releasedatum: 2026-04-20
Score 8.1 8.0
Rang #17 #21
Betrouwbaarheid 10.0 9.8
Consistentie 8.8 9.1
Correcte tests
Slaagpercentage per poging 77.2% 74.5%
Instabiele tests 3 2
Totaal runs 57 57
Kosten per resultaat 4.107 0.959
Totale kosten $0.534 $0.116
Invoerprijs $0.195 / 1M $0.150 / 1M
Uitvoerprijs $1.560 / 1M $1.000 / 1M
Uitvoer-tokens 2,531 15,018
Redeneer-tokens 266,183 108,331
Responstijd (gem.) 54.71s 13.22s
Responstijd (max) 163.96s 45.02s
Responstijd (totaal) 1039.57s 224.66s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 1,154 12,385
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 32.58s 3,294 15,116
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 2,591 9,968
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 6,193 39,116
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 129 4,569
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 219 7,404
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
Qwen3.6 35B A3B 7.9 7.5 77.8% 1 5.98s 676 9,447
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-27B 3.0 10.0 0.0% 0 85.11s 31 23,683
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 762 10,326

Snelle vergelijking

Vergelijkingspaar wisselen