Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Xiaomi: MiMo-V2.5

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-22

Metriek Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Releasedatum: 2026-02-19 MiMo-V2.5 MiMo-V2.5 medium Releasedatum: 2026-04-22
Score 9.6 7.8
Rang #2 #35
Consistentie 10.0 8.6
Correcte tests
Slaagpercentage per poging 94.4% 74.1%
Instabiele tests 0 3
Totaal runs 54 54
Kosten per resultaat 3.400 2.102
Totale kosten $0.578 $0.253
Invoerprijs $2.000 / 1M $0.400 / 1M
Uitvoerprijs $12.000 / 1M $2.000 / 1M
Uitvoer-tokens 1,932 2,840
Redeneer-tokens 40,542 116,242
Responstijd (gem.) 15.96s 13.71s
Responstijd (max) 40.61s 86.93s
Responstijd (totaal) 175.52s 246.73s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

Snelle vergelijking

Vergelijkingspaar wisselen