Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Releasedatum: 2026-05-08 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22
Score 7.7 7.6
Rang #35 #40
Betrouwbaarheid 10.0 10.0
Consistentie 9.2 8.9
Correcte tests
Slaagpercentage per poging 68.3% 68.3%
Instabiele tests 2 3
Totaal runs 60 60
Kosten per resultaat 0.500 2.407
Totale kosten $0.065 $0.289
Invoerprijs $0.250 / 1M $1.000 / 1M
Uitvoerprijs $1.500 / 1M $3.000 / 1M
Uitvoer-tokens 2,248 4,957
Redeneer-tokens 35,390 80,301
Responstijd (gem.) 3.18s 21.77s
Responstijd (max) 10.87s 130.77s
Responstijd (totaal) 63.55s 435.33s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 9.1 10.0 75.0% 0 2.39s 604 4,201
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 3.59s 453 6,068
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 10.87s 327 7,401
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 279 2,845
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 3.16s 15 5,165
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 84 1,142
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 9.9 10.0 100.0% 0 2.59s 75 3,320
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 7.6 7.2 77.8% 1 1.95s 165 2,450
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 4.55s 234 921
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 3.08s 12 1,877
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

Snelle vergelijking

Vergelijkingspaar wisselen