Verglichene Modelle

Benchmark-Vergleich Gemini 3.1 Flash Lite Preview (low) vs Gemini 3.1 Flash Lite Preview (medium) vs Gemini 3.1 Flash Lite Preview (high) vs Gemini 3 Flash Preview (low): Gemini 3 Flash Preview (low) führt bei Punktzahl mit 7.4. Gemini 3.1 Flash Lite Preview (low) führt bei Zuverlässigkeit mit 10.0. Gemini 3.1 Flash Lite Preview (medium) hat den niedrigsten Gesamtkosten mit $0.115. Gemini 3.1 Flash Lite Preview (medium) ist mit 4.61s am schnellsten.

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-07-28

Rang: #117
Gesamte Ausgabe-Token: 412,200
Antwortzeit (Durchschnitt): 16.70s
Gesamtkosten: $0.646

Rang: #73
Gesamte Ausgabe-Token: 56,983
Antwortzeit (Durchschnitt): 4.61s
Gesamtkosten: $0.115

Rang: #183
Gesamte Ausgabe-Token: 1,534,593
Antwortzeit (Durchschnitt): 68.14s
Gesamtkosten: $2.310

Rang: #70
Gesamte Ausgabe-Token: 38,090
Antwortzeit (Durchschnitt): 6.28s
Gesamtkosten: $0.177

Empfohlenes Modell Gemini 3.1 Flash Lite Preview (medium)

Die Punktzahl bleibt nah an der besten hier (7.3 vs 7.4) und es kostet etwa 9.1x weniger als die anderen Modelle in diesem Vergleich.

Detaillierter Vergleich

Metrik	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Veröffentlichung: 2026-03-03	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Veröffentlichung: 2026-03-03	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview high Veröffentlichung: 2026-03-03	Gemini 3 Flash Preview Gemini 3 Flash Preview low Veröffentlichung: 2025-12-17

Metrik	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Veröffentlichung: 2026-03-03	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Veröffentlichung: 2026-03-03	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview high Veröffentlichung: 2026-03-03	Gemini 3 Flash Preview Gemini 3 Flash Preview low Veröffentlichung: 2025-12-17
Punktzahl	6.5	7.3	5.3	7.4
Rang	#117	#73	#183	#70
Zuverlässigkeit	10.0	10.0	k. A.	10.0
Konsistenz	10.0	9.9	7.3	9.2
Korrekte Tests
Erfolgsquote pro Versuch	59.1%	59.1%	59.1%	75.8%
Instabile Tests	0	0	0	2
Gesamtläufe	66	66	48	66
Kosten pro Ergebnis	4.969	0.884	17.763	1.101
Gesamtkosten	$0.646	$0.115	$2.310	$0.177
Eingabepreis	$0.250 / 1M	$0.250 / 1M	$0.250 / 1M	$0.500 / 1M
Ausgabepreis	$1.500 / 1M	$1.500 / 1M	$1.500 / 1M	$3.000 / 1M
Gesamte Eingabe-Token	110,185	117,480	28,980	123,684
Ausgabe-Token	14,717	10,589	1,283	9,572
Denk-Token	397,483	46,394	1,533,310	28,518
Antwortzeit (Durchschnitt)	16.70s	4.61s	68.14s	6.28s
Antwortzeit (Maximum)	309.35s	18.34s	280.52s	17.13s
Antwortzeit (Gesamt)	367.47s	101.39s	1090.28s	138.06s

Modell-Generierungs-Showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Gemini 3.1 Flash Lite Preview

low

Kosten: $0.002
Zeit: 3.7s
Token: 1,203 tok

#73 Gemini 3.1 Flash Lite Preview

medium

Kosten: $0.003
Zeit: 5.2s
Token: 1,944 tok

#183 Gemini 3.1 Flash Lite Preview

high

Kosten: $0.096
Zeit: 133.9s
Token: 63,687 tok

#70 Gemini 3 Flash Preview

low

Kosten: $0.007
Zeit: 12.1s
Token: 2,289 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	2.12s	506	462	1,638
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	2.33s	512	570	4,305
Gemini 3.1 Flash Lite Preview	7.5	7.5	75.0%	43.87s	368	144	193,077
Gemini 3 Flash Preview	10.0	10.0	100.0%	3.48s	500	281	3,082

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0	1.39s	8,138	660	1,060
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0	4.09s	8,126	461	8,597
Gemini 3.1 Flash Lite Preview	0.0	0.0	0.0%	0	0ms	0	0	0
Gemini 3 Flash Preview	5.8	7.2	44.4%	1	6.00s	8,122	456	7,421

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	160.63s	85,851	12,656	389,079
Gemini 3.1 Flash Lite Preview	7.2	9.1	50.0%	16.63s	93,097	8,706	16,997
Gemini 3.1 Flash Lite Preview	5.0	5.0	50.0%	280.52s	13,175	335	380,440
Gemini 3 Flash Preview	3.0	10.0	0.0%	10.20s	99,775	7,822	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	3.00s	7,455	291	696
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	2.29s	7,362	279	2,952
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	7.16s	7,360	279	6,186
Gemini 3 Flash Preview	10.0	10.0	100.0%	9.40s	7,261	279	3,656

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0	2.36s	641	18	1,212
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0	4.21s	639	18	5,325
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0	127.58s	643	18	566,202
Gemini 3 Flash Preview	5.3	7.2	44.4%	1	8.05s	645	12	6,410

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	1.54s	490	69	384
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	3.16s	488	96	1,488
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	5.25s	490	117	3,915
Gemini 3 Flash Preview	10.0	10.0	100.0%	3.68s	492	120	981

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	1.49s	621	72	753
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	1.91s	621	72	2,121
Gemini 3.1 Flash Lite Preview	9.8	10.0	100.0%	64.03s	625	69	190,053
Gemini 3 Flash Preview	9.9	10.0	100.0%	7.02s	621	71	2,752

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	1.69s	566	243	1,248
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	5.30s	566	141	1,896
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	46.68s	564	87	190,953
Gemini 3 Flash Preview	10.0	10.0	100.0%	5.77s	562	288	3,168

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	9.54s	5,757	237	993
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	3.80s	5,909	234	912
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	7.73s	5,755	234	2,484
Gemini 3 Flash Preview	10.0	10.0	100.0%	4.99s	5,550	234	415

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	1.35s	160	9	420
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	2.68s	160	12	1,801
Gemini 3.1 Flash Lite Preview	0.0	0.0	0.0%	0ms	0	0	0
Gemini 3 Flash Preview	10.0	10.0	100.0%	2.75s	156	9	633

Schnellvergleich

Vergleichspaar wechseln