Gemini 3.1 Pro Preview

Google Veröffentlichung: 2026-02-19 Getestet am: 2026-04-11 01:44 google/gemini-3.1-pro-preview::medium

Punktzahl

9.6

Konsistenz

10.0

Zuverlässigkeit

k. A.

Gesamtkosten

$0.578

Gesamte Ausgabe-Token

42,474

Eingabepreis

$2.000 / 1M

Ausgabepreis

$12.000 / 1M

Korrekte Tests

Falsche Tests: 1

Erfolgsquote pro Versuch: 94.4%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

15.96s

Antwortzeit (Maximum): 40.61s

Antwortzeit (Gesamt): 175.52s

Falsche Antwort: 1

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Korrekte Tests	Gesamtkosten	Vergleichen
2026-05-21 16:10 Suite geändert	9.3	10.0		$1.081	Vergleichen
2026-04-11 01:44 Erster erfasster Lauf	9.6	k. A.		$0.578	Aktueller Lauf

Laufvergleich

Lauf	Punktzahl	Konsistenz	Zuverlässigkeit	Korrekte Tests	Gesamte Ausgabe-Token	Gesamtkosten	Antwortzeit (Durchschnitt)
2026-04-11 01:44 · Erster erfasster Lauf	9.6	10.0	k. A.	17/18	42,474	$0.578	15.96s
2026-05-21 16:10 · Suite geändert	9.3	10.0	10.0	18/20	83,818	$1.081	31.82s
Differenz	+0.3	0.0		-1	-41344	-$0.503	-15859ms

Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Gemini 3.1 Pro PreviewmediumvsGemini 3.5 Flashlow Gemini 3.1 Pro PreviewmediumvsGemini 3.5 Flashmedium Gemini 3.1 Pro PreviewmediumvsGemini 3.5 Flashhigh Gemini 3.1 Pro PreviewmediumvsQwen3.7 Maxmedium Gemini 3.1 Pro PreviewmediumvsGemini 3 Flash Previewmedium Gemini 3.1 Pro PreviewmediumvsClaude Opus 4.7medium Gemini 3.1 Pro PreviewmediumvsRing-2.6-1Tmedium

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	10.0	10.0
Programmierung	10.0	10.0
Kombiniert	9.5	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	7.7	10.0
Allgemeine Intelligenz	10.0	10.0
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	10.0	10.0
Werkzeugaufrufe	10.0	10.0

Gemini 3.1 Pro Preview

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle