Vergleichen Diagramme

Sprache:

❤️ Made by XCS

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Google: Gemini 3 Flash Preview

Modellname:

Benchmarks aus AI BENCHY-Test-Suites generiert am : 2026-02-27 15:16

Zusammenfassung

Metrik	Google: Gemini 3.1 Pro Preview medium Veröffentlichung: Unbekanntes Veröffentlichungsdatum	Google: Gemini 3 Flash Preview medium Veröffentlichung: Unbekanntes Veröffentlichungsdatum
Rang	#2	#1
Punktzahl	9.36	9.93
Konsistenz	10.00	10.00
Kosten pro Ergebnis	2.443	0.815
Gesamtkosten	$0.318	$0.114
Korrekte Tests
Falsche Tests	1	0
Erfolgsquote pro Versuch	92.9%	100.0%
Instabile Tests	0	0
Ausgabe-Token	1,000	1,111
Denk-Token	22,936	34,409

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		106	2,533
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		299	3,127

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		292	3,164
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		292	5,467

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Google: Gemini 3.1 Pro Preview	7.00	10.00	66.7%	0		18	10,688
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		12	15,295

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		72	2,436
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		72	4,092

Puzzle Solving	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		238	3,133
Google: Gemini 3 Flash Preview	9.67	10.00	100.0%	0		202	5,298

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
Google: Gemini 3.1 Pro Preview	10.00	10.00	100.0%	0		274	982
Google: Gemini 3 Flash Preview	10.00	10.00	100.0%	0		234	1,130

Vergleichspaar wechseln

Google: Gemini 3.1 Pro Preview vergleichen mit...

Google: Gemini 3 Flash Preview vergleichen mit...