Benchmarkvergelijking Gemini 3 Flash Preview vs Hunter Alpha: Gemini 3 Flash Preview leidt in gemiddelde score met 9.8 vs 6.7. Hunter Alpha heeft lagere benchmarkkosten met $0.000 vs $0.667. Hunter Alpha is sneller met 10.33s vs 18.64s, met slagingspercentages van 98.4% vs 64.8%.
Aanbevolen model: Gemini 3 Flash Preview - Het heeft de sterkste score in deze vergelijking (9.8) en de beste balans tussen kosten en responstijd over alle 2 modellen.
Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-10
Hunter AlphaHunter AlphamediumGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.Releasedatum: 2026-03-11
Score
9.8Gemiddelde score over alle benchmarktests.…
6.7Gemiddelde score over alle benchmarktests.…
Rang
#1
#80
Betrouwbaarheid
10.0Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
n.v.t.Succescore bij de eerste poging: 10.0 betekent geen herhaalbare doel-API- of snelheidslimietfouten vóór succesvolle calls; geregistreerde fouten verlagen de score.…
Consistentie
9.7Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
7.4Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
Correcte tests
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)18.64sResponstijd (max)117.26sResponstijd (totaal)391.35sEen test is alleen volledig geslaagd als alle runs slagen.…
98.4%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
64.8%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
Instabiele tests
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
6Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Totaal runs
63Totaal runs…
52Totaal runs…
Kosten per resultaat
3.335Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
0.000Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).…
Totale kosten
$0.667Totale kosten (huidige prijs)…
$0.000Totale kosten (huidige prijs)…
Invoerprijs
$0.500 / 1MInvoerprijs…
$0.000 / 1MInvoerprijs…
Uitvoerprijs
$3.000 / 1MUitvoerprijs…
$0.000 / 1MUitvoerprijs…
Totaal aantal invoer-tokens
37,017Totaal aantal invoer-tokens…
28,927Totaal aantal invoer-tokens…
Uitvoer-tokens
2,006Uitvoer-tokens…
4,682Uitvoer-tokens…
Redeneer-tokens
214,153Redeneer-tokens…
17,969Redeneer-tokens…
Responstijd (gem.)
18.64sResponstijd (gem.)…
10.33sResponstijd (gem.)…
Responstijd (max)
117.26sResponstijd (max)…
30.53sResponstijd (max)…
Responstijd (totaal)
391.35sResponstijd (totaal)…
175.58sResponstijd (totaal)…
Generation showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#1 Gemini 3 Flash Preview
medium
Cost
$0.010
Time
17.9s
Tokens
3,236 tok
#80 Hunter Alpha
medium
Hunter Alpha was a stealth model revealed on March 18th as an early testing version of MiMo-V2-Pro. Find it here: https://openrouter.ai/xiaomi/mimo-v2-pro
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.88sResponstijd (max)5.73sResponstijd (totaal)15.53sEen test is alleen volledig geslaagd als alle runs slagen.…
3.88sResponstijd (gem.)…
494Totaal aantal invoer-tokens…
330Uitvoer-tokens…
3,216Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
7.3Gemiddelde score over alle benchmarktests.…
5.8Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
83.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
2Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)4.75sResponstijd (max)7.62sResponstijd (totaal)19.00sEen test is alleen volledig geslaagd als alle runs slagen.…
7.6Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
88.9%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)84.40sResponstijd (max)117.26sResponstijd (totaal)253.21sEen test is alleen volledig geslaagd als alle runs slagen.…
84.40sResponstijd (gem.)…
8,122Totaal aantal invoer-tokens…
462Uitvoer-tokens…
161,084Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0msEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)22.42sResponstijd (max)22.42sResponstijd (totaal)22.42sEen test is alleen volledig geslaagd als alle runs slagen.…
22.42sResponstijd (gem.)…
12,873Totaal aantal invoer-tokens…
351Uitvoer-tokens…
10,485Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
4.7Gemiddelde score over alle benchmarktests.…
1.6Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)30.53sResponstijd (max)30.53sResponstijd (totaal)30.53sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.43sResponstijd (max)6.18sResponstijd (totaal)10.86sEen test is alleen volledig geslaagd als alle runs slagen.…
5.43sResponstijd (gem.)…
7,548Totaal aantal invoer-tokens…
279Uitvoer-tokens…
4,893Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.16sResponstijd (max)26.55sResponstijd (totaal)46.33sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.27sResponstijd (max)34.09sResponstijd (totaal)45.80sEen test is alleen volledig geslaagd als alle runs slagen.…
15.27sResponstijd (gem.)…
633Totaal aantal invoer-tokens…
12Uitvoer-tokens…
21,684Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
3.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 1Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)10.52sResponstijd (max)18.68sResponstijd (totaal)31.56sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.19sResponstijd (max)5.19sResponstijd (totaal)5.19sEen test is alleen volledig geslaagd als alle runs slagen.…
5.19sResponstijd (gem.)…
486Totaal aantal invoer-tokens…
72Uitvoer-tokens…
1,905Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
7.0Gemiddelde score over alle benchmarktests.…
3.7Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
1Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)6.44sResponstijd (max)6.44sResponstijd (totaal)6.44sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.04sResponstijd (max)4.70sResponstijd (totaal)8.08sEen test is alleen volledig geslaagd als alle runs slagen.…
4.04sResponstijd (gem.)…
615Totaal aantal invoer-tokens…
72Uitvoer-tokens…
2,709Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
9.9Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.18sResponstijd (max)4.46sResponstijd (totaal)8.36sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.05sResponstijd (max)5.64sResponstijd (totaal)12.15sEen test is alleen volledig geslaagd als alle runs slagen.…
4.05sResponstijd (gem.)…
558Totaal aantal invoer-tokens…
183Uitvoer-tokens…
4,365Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
6.1Gemiddelde score over alle benchmarktests.…
4.7Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
2Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Verkeerd antwoord: 1Responstijd (gem.)5.35sResponstijd (max)6.20sResponstijd (totaal)16.06sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.60sResponstijd (max)12.60sResponstijd (totaal)12.60sEen test is alleen volledig geslaagd als alle runs slagen.…
12.60sResponstijd (gem.)…
5,532Totaal aantal invoer-tokens…
234Uitvoer-tokens…
1,487Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.
10.0Gemiddelde score over alle benchmarktests.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.33sResponstijd (max)17.33sResponstijd (totaal)17.33sEen test is alleen volledig geslaagd als alle runs slagen.…
10.0Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).…
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.…
0Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).…
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.50sResponstijd (max)5.50sResponstijd (totaal)5.50sEen test is alleen volledig geslaagd als alle runs slagen.…
5.50sResponstijd (gem.)…
156Totaal aantal invoer-tokens…
11Uitvoer-tokens…
2,325Redeneer-tokens…
Hunter AlphaGearchiveerd model: dit model wordt niet langer bijgewerkt of getest op nieuwe tests.