AI BENCHY Compare

Trinity Large Preview vs Elephant

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-14

Metrik	Trinity Large Preview Trinity Large Preview none Veröffentlichung: 2026-01-27 Kostenlos verfügbar	Elephant Elephant none Veröffentlichung: 2026-04-14

Metrik	Trinity Large Preview Trinity Large Preview none Veröffentlichung: 2026-01-27 Kostenlos verfügbar	Elephant Elephant none Veröffentlichung: 2026-04-14
Punktzahl	5.3	5.2
Rang	#74	#81
Konsistenz	9.6	9.6
Korrekte Tests
Erfolgsquote pro Versuch	29.6%	31.5%
Instabile Tests	1	1
Gesamtläufe	52	54
Kosten pro Ergebnis	0.000	0.000
Gesamtkosten	$0.000	$0.000
Eingabepreis	$0.000 / 1M	$0.000 / 1M
Ausgabepreis	$0.000 / 1M	$0.000 / 1M
Ausgabe-Token	1,985	2,573
Denk-Token	0	0
Antwortzeit (Durchschnitt)	5.07s	1.23s
Antwortzeit (Maximum)	39.47s	3.81s
Antwortzeit (Gesamt)	91.23s	22.16s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
Elephant	6.6	10.0	50.0%	0		963ms	610	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
Elephant	6.4	3.3	66.7%	1		1.39s	375	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
Elephant	3.0	10.0	0.0%	0		3.81s	731	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
Elephant	6.5	10.0	50.0%	0		1.04s	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
Elephant	3.0	10.0	0.0%	0		927ms	24	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
Elephant	4.0	10.0	0.0%	0		854ms	106	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
Elephant	9.8	10.0	100.0%	0		1.03s	81	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
Elephant	3.3	10.0	0.0%	0		849ms	170	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Elephant	3.0	10.0	0.0%	0		2.79s	230	0

Schnellvergleich

Vergleichspaar wechseln

Trinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.7medium MiniMax M2.7mediumvsElephantnone Trinity Large PreviewnoneKostenlos verfügbarvsElephantmedium Trinity Large PreviewnoneKostenlos verfügbarvsMistral Small 4medium Trinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.5mediumKostenlos verfügbar Mistral Small 4mediumvsElephantnone ElephantnonevsQwen3 Coder Nextmedium MiniMax M2.5mediumKostenlos verfügbarvsElephantnone Trinity Large PreviewnoneKostenlos verfügbarvsgpt-oss-120bmediumKostenlos verfügbar ElephantnonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneKostenlos verfügbarvsQwen3 Coder Nextmedium gpt-oss-120bmediumKostenlos verfügbarvsElephantnone