Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

xAI: Grok 4.3 vs Xiaomi: MiMo-V2.5-Pro

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek Grok 4.3 Grok 4.3 medium Releasedatum: 2026-05-01 MiMo-V2.5-Pro MiMo-V2.5-Pro medium Releasedatum: 2026-04-22
Score 7.8 7.6
Rang #31 #40
Betrouwbaarheid 10.0 10.0
Consistentie 8.4 8.9
Correcte tests
Slaagpercentage per poging 75.0% 68.3%
Instabiele tests 4 3
Totaal runs 60 60
Kosten per resultaat 4.562 2.407
Totale kosten $0.593 $0.289
Invoerprijs $1.250 / 1M $1.000 / 1M
Uitvoerprijs $2.500 / 1M $3.000 / 1M
Uitvoer-tokens 1,485 4,957
Redeneer-tokens 214,928 80,301
Responstijd (gem.) 49.23s 21.77s
Responstijd (max) 216.69s 130.77s
Responstijd (totaal) 984.54s 435.33s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 7.4 6.5 66.7% 1 55.26s 532 24,554
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

Snelle vergelijking

Vergelijkingspaar wisselen