AI BENCHY Compare

Trinity Large Preview vs Google: Gemini 3.1 Pro Preview

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-16

Metrik	Trinity Large Preview Trinity Large Preview none Veröffentlichung: 2026-01-27 Kostenlos verfügbar	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Veröffentlichung: 2026-02-19

Metrik	Trinity Large Preview Trinity Large Preview none Veröffentlichung: 2026-01-27 Kostenlos verfügbar	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Veröffentlichung: 2026-02-19
Punktzahl	5.3	9.6
Rang	#76	#2
Konsistenz	9.6	10.0
Korrekte Tests
Erfolgsquote pro Versuch	29.6%	94.4%
Instabile Tests	1	0
Gesamtläufe	52	54
Kosten pro Ergebnis	0.000	3.400
Gesamtkosten	$0.000	$0.578
Eingabepreis	$0.000 / 1M	$2.000 / 1M
Ausgabepreis	$0.000 / 1M	$12.000 / 1M
Ausgabe-Token	1,985	1,932
Denk-Token	0	40,542
Antwortzeit (Durchschnitt)	5.07s	15.96s
Antwortzeit (Maximum)	39.47s	40.61s
Antwortzeit (Gesamt)	91.23s	175.52s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982

Schnellvergleich

Vergleichspaar wechseln

Trinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.7medium Trinity Large PreviewnoneKostenlos verfügbarvsElephantmedium Trinity Large PreviewnoneKostenlos verfügbarvsMistral Small 4medium Trinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.5mediumKostenlos verfügbar Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Trinity Large PreviewnoneKostenlos verfügbarvsgpt-oss-120bmediumKostenlos verfügbar Trinity Large PreviewnoneKostenlos verfügbarvsQwen3 Coder Nextmedium Trinity Large PreviewnoneKostenlos verfügbarvsGLM 4.7 Flashmedium Trinity Large PreviewnoneKostenlos verfügbarvsGPT-5 Nanomedium Trinity Large PreviewnoneKostenlos verfügbarvsQwen3.5-9Bmedium Trinity Large PreviewnoneKostenlos verfügbarvsMercury 2medium Trinity Large PreviewnoneKostenlos verfügbarvsGrok 4.1 Fastmedium