Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.5 Flash vs Xiaomi: MiMo-V2-Flash

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-04

Metriek Step 3.5 Flash Step 3.5 Flash medium Releasedatum: 2026-02-01 Gratis beschikbaar MiMo-V2-Flash MiMo-V2-Flash medium Releasedatum: 2025-12-16
Score 7.9 7.6
Rang #28 #32
Consistentie 9.1 9.0
Correcte tests
Slaagpercentage per poging 70.6% 70.6%
Instabiele tests 2 2
Totaal runs 49 51
Kosten per resultaat 0.000 0.329
Totale kosten $0.000 $0.037
Invoerprijs $0.100 / 1M $0.090 / 1M
Uitvoerprijs $0.300 / 1M $0.290 / 1M
Uitvoer-tokens 71,904 11,959
Redeneer-tokens 155,607 111,534
Responstijd (gem.) 26.78s 24.30s
Responstijd (max) 170.45s 96.01s
Responstijd (totaal) 294.58s 267.31s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

Snelle vergelijking

Vergelijkingspaar wisselen