Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs StepFun: Step 3.5 Flash

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Releasedatum: 2026-02-24 Step 3.5 Flash Step 3.5 Flash medium Releasedatum: 2026-02-01
Score 7.3 7.4
Rang #68 #61
Betrouwbaarheid 10.0 10.0
Consistentie 7.5 9.1
Correcte tests
Slaagpercentage per poging 73.3% 62.3%
Instabiele tests 6 2
Totaal runs 60 57
Kosten per resultaat 4.865 0.133
Totale kosten $0.536 $0.015
Invoerprijs $0.139 / 1M $0.090 / 1M
Uitvoerprijs $1.000 / 1M $0.300 / 1M
Uitvoer-tokens 31,242 90,478
Redeneer-tokens 330,546 173,544
Responstijd (gem.) 69.66s 43.20s
Responstijd (max) 409.98s 170.45s
Responstijd (totaal) 1393.17s 561.54s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 6.5 10.0 50.0% 0 244.54s 14,456 88,431
Step 3.5 Flash 3.5 6.0 50.0% 1 62.83s 12,098 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 2,364 3,521
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 8.2 7.2 88.9% 1 33.13s 3,592 26,585
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 5,630 10,861
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 177.35s 10,919 72,053
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

Snelle vergelijking

Vergelijkingspaar wisselen