Trinity Large Preview vs Z.ai: GLM 4.7 Flash

Trinity Large Preview führt beim Durchschnittsscore mit 4.8 vs 4.3. Trinity Large Preview hat die niedrigeren Benchmark-Kosten mit $0.008 vs $0.166. Trinity Large Preview ist schneller mit 2.98s vs 142.59s, mit Erfolgsraten von 21.2% vs 31.8%.

Empfohlenes ModellTrinity Large PreviewEs hat hier die beste Punktzahl (4.8) und kostet etwa 21.4x weniger als GLM 4.7 Flash (medium).

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-07-18

Metrik	Trinity Large Preview Trinity Large Preview none Veröffentlichung: 2026-01-27	GLM 4.7 Flash GLM 4.7 Flash medium Veröffentlichung: 2026-01-19

Metrik	Trinity Large Preview Trinity Large Preview none Veröffentlichung: 2026-01-27	GLM 4.7 Flash GLM 4.7 Flash medium Veröffentlichung: 2026-01-19
Punktzahl	4.8	4.3
Rang	#179	#190
Zuverlässigkeit	10.0	7.8
Konsistenz	8.9	7.0
Korrekte Tests
Erfolgsquote pro Versuch	21.2%	31.8%
Instabile Tests	2	8
Gesamtläufe	63	66
Kosten pro Ergebnis	0.017	4.147
Gesamtkosten	$0.008	$0.166
Eingabepreis	$0.243 / 1M	$0.061 / 1M
Ausgabepreis	$0.243 / 1M	$0.400 / 1M
Gesamte Eingabe-Token	29,828	79,051
Ausgabe-Token	2,169	43,754
Denk-Token	0	374,109
Antwortzeit (Durchschnitt)	2.98s	142.59s
Antwortzeit (Maximum)	14.34s	1539.97s
Antwortzeit (Gesamt)	56.57s	1996.21s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#179 Trinity Large Preview

none

No endpoints found for arcee-ai/trinity-large-preview:free.

Kosten: $0.000
Zeit: 0.0s
Token: 0 tok

#190 GLM 4.7 Flash

medium

Ungültiges SVG

Kosten: $0.000
Zeit: 186.2s
Token: 12,112 tok

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	555	1,122	6,110

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.7	7.7	11.1%	1		14.34s	738	397	0
GLM 4.7 Flash	3.2	7.4	11.1%	1		55.33s	3,106	4,981	22,387

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	1.5	5.0	0.0%	0		8.91s	12,053	294	0
GLM 4.7 Flash	2.9	6.0	16.7%	1		802.77s	59,030	2,585	305,678

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	7,107	584	2,755

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	643	33,000	25,394

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	318	18	2,138

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	636	388	2,181

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	521	781	5,255

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	6,949	224	1,014

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	186	71	1,197

Schnellvergleich

Vergleichspaar wechseln

Trinity Large PreviewnonevsQwen3 Coder Nextmedium Trinity Large PreviewnonevsCobuddymedium Trinity Large PreviewnonevsMiniMax M2.5medium Grok 4.20nonevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsMiniMax M2.7medium Granite 4.1 8BnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsMistral Small 4medium KAT-Coder-Air V2.5nonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Ring-2.6-1TnonevsGLM 4.7 Flashmedium gpt-oss-120bnoneKostenlos verfügbarvsGLM 4.7 Flashmedium