Google: Gemini 3 Flash Preview vs Xiaomi: MiMo-V2-Flash
Samenvatting
Benchmarkvergelijking Gemini 3 Flash Preview vs MiMo-V2-Flash: Gemini 3 Flash Preview leidt in gemiddelde score met 9.6 vs 4.3. MiMo-V2-Flash heeft lagere benchmarkkosten met $0.025 vs $0.667. MiMo-V2-Flash is sneller met 2.76s vs 18.64s, met slagingspercentages van 98.4% vs 25.4%.
Aanbevolen model: Gemini 3 Flash Preview - Het heeft de sterkste score in deze vergelijking (9.6) en de beste balans tussen kosten en responstijd over alle 2 modellen.
Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-07-02
MiMo-V2-FlashMiMo-V2-FlashnoneGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.Releasedatum: 2025-12-16
Score
9.6Gemiddelde score over alle benchmarktests.…
4.3Gemiddelde score over alle benchmarktests.…
Rang
#2
#164
Betrouwbaarheid
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
6.7Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
Consistentie
9.7Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
8.5Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
Correcte tests
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)18.64sResponstijd (max)117.26sResponstijd (totaal)391.35sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.88sResponstijd (max)5.73sResponstijd (totaal)15.53sEen test is alleen volledig geslaagd als alle runs slagen.…
3.88sResponstijd (gem.)…
494Totaal aantal invoer-tokens…
330Uitvoer-tokens…
3,216Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.2Gemiddelde score over alle benchmarktests.…
8.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
8.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 4Responstijd (gem.)1.19sResponstijd (max)2.73sResponstijd (totaal)4.76sEen test is alleen volledig geslaagd als alle runs slagen.…
7.6Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
88.9%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)84.40sResponstijd (max)117.26sResponstijd (totaal)253.21sEen test is alleen volledig geslaagd als alle runs slagen.…
84.40sResponstijd (gem.)…
8,122Totaal aantal invoer-tokens…
462Uitvoer-tokens…
161,084Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
4.3Gemiddelde score over alle benchmarktests.…
7.9Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
11.1%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Instructies niet gevolgd: 1Responstijd (gem.)2.64sResponstijd (max)3.84sResponstijd (totaal)7.92sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)22.42sResponstijd (max)22.42sResponstijd (totaal)22.42sEen test is alleen volledig geslaagd als alle runs slagen.…
22.42sResponstijd (gem.)…
12,873Totaal aantal invoer-tokens…
351Uitvoer-tokens…
10,485Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.87sResponstijd (max)2.87sResponstijd (totaal)2.87sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.43sResponstijd (max)6.18sResponstijd (totaal)10.86sEen test is alleen volledig geslaagd als alle runs slagen.…
5.43sResponstijd (gem.)…
7,548Totaal aantal invoer-tokens…
279Uitvoer-tokens…
4,893Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
2.9Gemiddelde score over alle benchmarktests.…
5.8Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
16.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Extra opmaak: 1Responstijd (gem.)19.68sResponstijd (max)19.68sResponstijd (totaal)19.68sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.27sResponstijd (max)34.09sResponstijd (totaal)45.80sEen test is alleen volledig geslaagd als alle runs slagen.…
15.27sResponstijd (gem.)…
633Totaal aantal invoer-tokens…
12Uitvoer-tokens…
21,684Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
5.3Gemiddelde score over alle benchmarktests.…
7.2Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
44.4%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)564msResponstijd (max)564msResponstijd (totaal)564msEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.19sResponstijd (max)5.19sResponstijd (totaal)5.19sEen test is alleen volledig geslaagd als alle runs slagen.…
5.19sResponstijd (gem.)…
486Totaal aantal invoer-tokens…
72Uitvoer-tokens…
1,905Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
4.6Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)1.67sResponstijd (max)1.67sResponstijd (totaal)1.67sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.04sResponstijd (max)4.70sResponstijd (totaal)8.08sEen test is alleen volledig geslaagd als alle runs slagen.…
4.04sResponstijd (gem.)…
615Totaal aantal invoer-tokens…
72Uitvoer-tokens…
2,709Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
6.5Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)857msResponstijd (max)955msResponstijd (totaal)1.71sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.05sResponstijd (max)5.64sResponstijd (totaal)12.15sEen test is alleen volledig geslaagd als alle runs slagen.…
4.05sResponstijd (gem.)…
558Totaal aantal invoer-tokens…
183Uitvoer-tokens…
4,365Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
5.3Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
33.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)1.86sResponstijd (max)2.70sResponstijd (totaal)3.71sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.60sResponstijd (max)12.60sResponstijd (totaal)12.60sEen test is alleen volledig geslaagd als alle runs slagen.…
12.60sResponstijd (gem.)…
5,532Totaal aantal invoer-tokens…
234Uitvoer-tokens…
1,487Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.28sResponstijd (max)2.28sResponstijd (totaal)2.28sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.50sResponstijd (max)5.50sResponstijd (totaal)5.50sEen test is alleen volledig geslaagd als alle runs slagen.…
5.50sResponstijd (gem.)…
156Totaal aantal invoer-tokens…
11Uitvoer-tokens…
2,325Redeneer-tokens…
MiMo-V2-FlashGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.82sResponstijd (max)1.82sResponstijd (totaal)1.82sEen test is alleen volledig geslaagd als alle runs slagen.…