Benchmarkvergelijking Gemini 3 Flash Preview vs Hunter Alpha: Gemini 3 Flash Preview leidt in gemiddelde score met 9.8 vs 5.7. Hunter Alpha heeft lagere benchmarkkosten met $0.000 vs $0.667. Hunter Alpha is sneller met 4.70s vs 18.64s, met slagingspercentages van 98.4% vs 46.3%.
Aanbevolen model: Gemini 3 Flash Preview - Het heeft de sterkste score in deze vergelijking (9.8) en de beste balans tussen kosten en responstijd over alle 2 modellen.
Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-10
Hunter AlphaHunter AlphanoneGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.Releasedatum: 2026-03-11
Score
9.8Gemiddelde score over alle benchmarktests.…
5.7Gemiddelde score over alle benchmarktests.…
Rang
#1
#117
Betrouwbaarheid
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
n.v.t.Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
Consistentie
9.7Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
8.2Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
Correcte tests
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)18.64sResponstijd (max)117.26sResponstijd (totaal)391.35sEen test is alleen volledig geslaagd als alle runs slagen.…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 9Instructies niet gevolgd: 2API-fout: 1Responstijd (gem.)4.70sResponstijd (max)15.17sResponstijd (totaal)79.86sEen test is alleen volledig geslaagd als alle runs slagen.…
Slaagpercentage per poging
98.4%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
46.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
Instabiele tests
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
4Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Totaal runs
63Totaal runs…
52Totaal runs…
Kosten per resultaat
3.335Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
0.000Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
Totale kosten
$0.667Totale kosten (huidige prijs)…
$0.000Totale kosten (huidige prijs)…
Invoerprijs
$0.500 / 1MInvoerprijs…
$0.000 / 1MInvoerprijs…
Uitvoerprijs
$3.000 / 1MUitvoerprijs…
$0.000 / 1MUitvoerprijs…
Totaal aantal invoer-tokens
37,017Totaal aantal invoer-tokens…
34,329Totaal aantal invoer-tokens…
Uitvoer-tokens
2,006Uitvoer-tokens…
2,264Uitvoer-tokens…
Redeneer-tokens
214,153Redeneer-tokens…
0Redeneer-tokens…
Responstijd (gem.)
18.64sResponstijd (gem.)…
4.70sResponstijd (gem.)…
Responstijd (max)
117.26sResponstijd (max)…
15.17sResponstijd (max)…
Responstijd (totaal)
391.35sResponstijd (totaal)…
79.86sResponstijd (totaal)…
Generation showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#1 Gemini 3 Flash Preview
medium
Cost
$0.010
Time
17.9s
Tokens
3,236 tok
#117 Hunter Alpha
none
Hunter Alpha was a stealth model revealed on March 18th as an early testing version of MiMo-V2-Pro. Find it here: https://openrouter.ai/xiaomi/mimo-v2-pro
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.88sResponstijd (max)5.73sResponstijd (totaal)15.53sEen test is alleen volledig geslaagd als alle runs slagen.…
3.88sResponstijd (gem.)…
494Totaal aantal invoer-tokens…
330Uitvoer-tokens…
3,216Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.5Gemiddelde score over alle benchmarktests.…
8.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
16.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 4Responstijd (gem.)3.81sResponstijd (max)6.85sResponstijd (totaal)15.23sEen test is alleen volledig geslaagd als alle runs slagen.…
7.6Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
88.9%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)84.40sResponstijd (max)117.26sResponstijd (totaal)253.21sEen test is alleen volledig geslaagd als alle runs slagen.…
84.40sResponstijd (gem.)…
8,122Totaal aantal invoer-tokens…
462Uitvoer-tokens…
161,084Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0msEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)22.42sResponstijd (max)22.42sResponstijd (totaal)22.42sEen test is alleen volledig geslaagd als alle runs slagen.…
22.42sResponstijd (gem.)…
12,873Totaal aantal invoer-tokens…
351Uitvoer-tokens…
10,485Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)15.17sResponstijd (max)15.17sResponstijd (totaal)15.17sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.43sResponstijd (max)6.18sResponstijd (totaal)10.86sEen test is alleen volledig geslaagd als alle runs slagen.…
5.43sResponstijd (gem.)…
7,548Totaal aantal invoer-tokens…
279Uitvoer-tokens…
4,893Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.49sResponstijd (max)14.02sResponstijd (totaal)16.98sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.27sResponstijd (max)34.09sResponstijd (totaal)45.80sEen test is alleen volledig geslaagd als alle runs slagen.…
15.27sResponstijd (gem.)…
633Totaal aantal invoer-tokens…
12Uitvoer-tokens…
21,684Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
5.3Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
33.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)2.33sResponstijd (max)2.94sResponstijd (totaal)6.99sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.19sResponstijd (max)5.19sResponstijd (totaal)5.19sEen test is alleen volledig geslaagd als alle runs slagen.…
5.19sResponstijd (gem.)…
486Totaal aantal invoer-tokens…
72Uitvoer-tokens…
1,905Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
6.1Gemiddelde score over alle benchmarktests.…
3.1Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)2.71sResponstijd (max)2.71sResponstijd (totaal)2.71sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.04sResponstijd (max)4.70sResponstijd (totaal)8.08sEen test is alleen volledig geslaagd als alle runs slagen.…
4.04sResponstijd (gem.)…
615Totaal aantal invoer-tokens…
72Uitvoer-tokens…
2,709Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
6.4Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.82sResponstijd (max)2.92sResponstijd (totaal)5.65sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.05sResponstijd (max)5.64sResponstijd (totaal)12.15sEen test is alleen volledig geslaagd als alle runs slagen.…
4.05sResponstijd (gem.)…
558Totaal aantal invoer-tokens…
183Uitvoer-tokens…
4,365Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
5.8Gemiddelde score over alle benchmarktests.…
4.4Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
2Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Verkeerd antwoord: 1Responstijd (gem.)3.71sResponstijd (max)5.43sResponstijd (totaal)11.13sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.60sResponstijd (max)12.60sResponstijd (totaal)12.60sEen test is alleen volledig geslaagd als alle runs slagen.…
12.60sResponstijd (gem.)…
5,532Totaal aantal invoer-tokens…
234Uitvoer-tokens…
1,487Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.02sResponstijd (max)6.02sResponstijd (totaal)6.02sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.50sResponstijd (max)5.50sResponstijd (totaal)5.50sEen test is alleen volledig geslaagd als alle runs slagen.…
5.50sResponstijd (gem.)…
156Totaal aantal invoer-tokens…
11Uitvoer-tokens…
2,325Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.