Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs Xiaomi: MiMo-V2-Omni

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-02

Metriek Gemma 4 31B Gemma 4 31B medium Releasedatum: 2026-04-02 MiMo-V2-Omni MiMo-V2-Omni none Releasedatum: 2026-03-18
Score 8.6 6.4
Rang #5 #49
Consistentie 9.6 10.0
Correcte tests
Slaagpercentage per poging 80.4% 47.1%
Instabiele tests 1 0
Totaal runs 51 17
Kosten per resultaat 0.109 0.069
Totale kosten $0.015 $0.006
Invoerprijs $0.140 / 1M $0.400 / 1M
Uitvoerprijs $0.400 / 1M $2.000 / 1M
Uitvoer-tokens 9,568 469
Redeneer-tokens 22,501 0
Responstijd (gem.) 21.81s 2.01s
Responstijd (max) 68.92s 6.81s
Responstijd (totaal) 327.16s 34.09s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
MiMo-V2-Omni 4.8 10.0 25.0% 0 1.10s 74 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 2.47s 110 0
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.69s 83 0
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
MiMo-V2-Omni 5.3 10.0 33.3% 0 1.14s 8 0
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
MiMo-V2-Omni 4.5 10.0 0.0% 0 1.19s 37 0
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.18s 22 0
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
MiMo-V2-Omni 8.0 10.0 66.7% 0 2.71s 58 0
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.76s 77 0

Snelle vergelijking

Vergelijkingspaar wisselen