AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Laguna Xs.2

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-29

Metrik	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Veröffentlichung: 2026-02-19	Laguna Xs.2 Laguna Xs.2 none Veröffentlichung: 2026-04-28 Kostenlos verfügbar

Metrik	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Veröffentlichung: 2026-02-19	Laguna Xs.2 Laguna Xs.2 none Veröffentlichung: 2026-04-28 Kostenlos verfügbar
Punktzahl	9.6	5.0
Rang	#2	#118
Zuverlässigkeit	k. A.	9.9
Konsistenz	10.0	10.0
Korrekte Tests
Erfolgsquote pro Versuch	94.4%	27.8%
Instabile Tests	0	0
Gesamtläufe	54	54
Kosten pro Ergebnis	3.400	0.000
Gesamtkosten	$0.578	$0.000
Eingabepreis	$2.000 / 1M	$0.000 / 1M
Ausgabepreis	$12.000 / 1M	$0.000 / 1M
Ausgabe-Token	1,932	3,824
Denk-Token	40,542	0
Antwortzeit (Durchschnitt)	15.96s	1.68s
Antwortzeit (Maximum)	40.61s	16.04s
Antwortzeit (Gesamt)	175.52s	30.26s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Laguna Xs.2	3.2	10.0	0.0%	0		743ms	933	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Laguna Xs.2	2.5	10.0	0.0%	0		1.96s	866	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Laguna Xs.2	3.0	10.0	0.0%	0		2.01s	521	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	33	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Laguna Xs.2	5.0	10.0	0.0%	0		16.04s	200	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	81	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Laguna Xs.2	5.4	10.0	33.3%	0		688ms	552	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	392	0

Schnellvergleich

Vergleichspaar wechseln

Nemotron 3 Nano Omni 30b A3b ReasoningmediumKostenlos verfügbarvsLaguna Xs.2noneKostenlos verfügbar Elephant AlphamediumvsLaguna Xs.2noneKostenlos verfügbar MiniMax M2.7mediumvsLaguna Xs.2noneKostenlos verfügbar Laguna Xs.2noneKostenlos verfügbarvsQwen3 Coder Nextmedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Laguna Xs.2noneKostenlos verfügbarvsGLM 4.7 Flashmedium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Mistral Small 4mediumvsLaguna Xs.2noneKostenlos verfügbar MiniMax M2.5mediumKostenlos verfügbarvsLaguna Xs.2noneKostenlos verfügbar Laguna Xs.2noneKostenlos verfügbarvsQwen3.5-9Bmedium gpt-oss-120bmediumKostenlos verfügbarvsLaguna Xs.2noneKostenlos verfügbar Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighKostenlos verfügbar