10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
9.99Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
9.44Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
Kosten per resultaat
0.162Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).โฆ
0.403Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).โฆ
17.455Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).โฆ
0.624Toont de gemiddelde kosten per correct benchmark-antwoord in centen (lager is beter).โฆ
Totale kosten
$0.017Totale kostenโฆ
$0.037Totale kostenโฆ
$1.920Totale kostenโฆ
$0.069Totale kostenโฆ
Correcte tests
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 4Instructies niet gevolgd: 1Responstijd (gem.)2.89sResponstijd (max)9.54sResponstijd (totaal)43.35sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 4Instructies niet gevolgd: 2Responstijd (gem.)3.74sResponstijd (max)12.98sResponstijd (totaal)56.15sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Instructies niet gevolgd: 1Responstijd (gem.)69.85sResponstijd (max)232.25sResponstijd (totaal)1047.79sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Instructies niet gevolgd: 1Responstijd (gem.)6.32sResponstijd (max)14.72sResponstijd (totaal)94.86sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
Slaagpercentage per poging
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
60.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
73.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
75.6%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
Instabiele tests
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
1Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Uitvoer-tokens
1,392Uitvoer-tokensโฆ
1,417Uitvoer-tokensโฆ
943Uitvoer-tokensโฆ
1,274Uitvoer-tokensโฆ
Redeneer-tokens
6,379Redeneer-tokensโฆ
19,435Redeneer-tokensโฆ
1,275,768Redeneer-tokensโฆ
18,372Redeneer-tokensโฆ
Topmodellen op score
Score vs totale kosten
Categorie-uitsplitsing
Anti-AI-trucs
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
7.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.18sResponstijd (max)3.18sResponstijd (totaal)6.53sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
456Uitvoer-tokensโฆ
1,224Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
9.00Gemiddelde score over alle benchmarktests.โฆ
9.99Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)2.53sResponstijd (max)3.89sResponstijd (totaal)7.58sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
564Uitvoer-tokensโฆ
3,780Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)43.87sResponstijd (max)121.88sResponstijd (totaal)131.62sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
144Uitvoer-tokensโฆ
193,077Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.50sResponstijd (max)4.31sResponstijd (totaal)10.49sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
275Uitvoer-tokensโฆ
2,476Redeneer-tokensโฆ
Gecombineerd
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
1.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.96sResponstijd (max)2.96sResponstijd (totaal)2.96sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
75Uitvoer-tokensโฆ
253Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.98sResponstijd (max)12.98sResponstijd (totaal)12.98sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
109Uitvoer-tokensโฆ
2,449Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)232.25sResponstijd (max)232.25sResponstijd (totaal)232.25sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
112Uitvoer-tokensโฆ
126,813Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
1.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.96sResponstijd (max)2.96sResponstijd (totaal)2.96sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
104Uitvoer-tokensโฆ
0Redeneer-tokensโฆ
Gegevensparsering en extractie
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
9.88Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.00sResponstijd (max)3.74sResponstijd (totaal)5.99sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
291Uitvoer-tokensโฆ
696Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
9.88Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.29sResponstijd (max)2.31sResponstijd (totaal)4.59sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
279Uitvoer-tokensโฆ
2,952Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
9.88Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.16sResponstijd (max)8.54sResponstijd (totaal)14.31sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
279Uitvoer-tokensโฆ
6,186Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.46sResponstijd (max)14.72sResponstijd (totaal)18.92sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
305Uitvoer-tokensโฆ
3,004Redeneer-tokensโฆ
Domeinspecifiek
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
4.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
33.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)2.36sResponstijd (max)3.51sResponstijd (totaal)7.07sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
18Uitvoer-tokensโฆ
1,212Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
1.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
0.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)4.21sResponstijd (max)5.86sResponstijd (totaal)12.62sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
18Uitvoer-tokensโฆ
5,325Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
4.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
33.3%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)127.58sResponstijd (max)133.93sResponstijd (totaal)382.74sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
18Uitvoer-tokensโฆ
566,202Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
4.00Gemiddelde score over alle benchmarktests.โฆ
7.21Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
44.4%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
1Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)8.05sResponstijd (max)14.40sResponstijd (totaal)24.15sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
12Uitvoer-tokensโฆ
6,410Redeneer-tokensโฆ
Instructies opvolgen
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
8.50Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)1.49sResponstijd (max)1.66sResponstijd (totaal)2.99sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
72Uitvoer-tokensโฆ
753Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
8.00Gemiddelde score over alle benchmarktests.โฆ
9.99Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)1.91sResponstijd (max)1.93sResponstijd (totaal)3.82sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
72Uitvoer-tokensโฆ
2,121Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
8.00Gemiddelde score over alle benchmarktests.โฆ
9.96Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)70.07sResponstijd (max)136.53sResponstijd (totaal)140.14sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
69Uitvoer-tokensโฆ
190,053Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
7.50Gemiddelde score over alle benchmarktests.โฆ
9.99Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
50.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)7.02sResponstijd (max)7.35sResponstijd (totaal)14.03sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
71Uitvoer-tokensโฆ
2,752Redeneer-tokensโฆ
Puzzle Solving
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.76sResponstijd (max)5.08sResponstijd (totaal)8.27sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
243Uitvoer-tokensโฆ
1,248Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
7.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.58sResponstijd (max)4.41sResponstijd (totaal)10.75sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
141Uitvoer-tokensโฆ
1,896Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
7.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
66.7%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)46.33sResponstijd (max)134.22sResponstijd (totaal)139.00sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
87Uitvoer-tokensโฆ
190,953Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.44sResponstijd (max)10.27sResponstijd (totaal)19.32sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
273Uitvoer-tokensโฆ
3,315Redeneer-tokensโฆ
Toolaanroepen
Score
Consistentie
Slaagpercentage per poging
Instabiele tests
Correcte tests
Uitvoer-tokens
Redeneer-tokens
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.54sResponstijd (max)9.54sResponstijd (totaal)9.54sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
237Uitvoer-tokensโฆ
993Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.80sResponstijd (max)3.80sResponstijd (totaal)3.80sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
234Uitvoer-tokensโฆ
912Redeneer-tokensโฆ
Google: Gemini 3.1 Flash Lite Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.73sResponstijd (max)7.73sResponstijd (totaal)7.73sEen test is alleen volledig geslaagd als alle runs slagen.โฆ
234Uitvoer-tokensโฆ
2,484Redeneer-tokensโฆ
Google: Gemini 3 Flash Preview
10.00Gemiddelde score over alle benchmarktests.โฆ
10.00Consistentie geeft stabiliteit tussen runs weer (10 = zeer consistent, zelfs als consequent fout).โฆ
100.0%Slaagpercentage per poging = geslaagde pogingen / totale pogingen over alle runs.โฆ
0Instabiele tests hadden gemengde uitkomsten over runs (minstens รฉรฉn geslaagd en รฉรฉn gefaald).โฆ
Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.99sResponstijd (max)4.99sResponstijd (totaal)4.99sEen test is alleen volledig geslaagd als alle runs slagen.โฆ