Vergleichen Diagramme Methodik

Sprache:

❤️ Made by XCS

#45

Trinity Large Preview

Arcee AI · Veröffentlichung: 2026-01-27 · arcee-ai/trinity-large-preview::none

4.2

Kosten pro Ergebnis

0.000

Konsistenz

9.6

$0.000

Falsche Tests: 11

Erfolgsquote pro Versuch: 33.3%

Instabile Tests

1

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

3.15s

Antwortzeit (Maximum): 8.91s

Antwortzeit (Gesamt): 50.46s

Falsche Antwort: 9 Anweisungen nicht befolgt: 2

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Ø-Score vs Gesamtkosten

Antwortzeit (Durchschnitt)

Ø-Score vs Antwortzeit (Durchschnitt)

Schnellvergleich

Trinity Large PreviewnoneKostenlos verfügbarvsGPT-5.4none Trinity Large PreviewnoneKostenlos verfügbarvsKimi K2.5none Trinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.5medium Trinity Large PreviewnoneKostenlos verfügbarvsGPT-4o-mininone Trinity Large PreviewnoneKostenlos verfügbarvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneKostenlos verfügbarvsQwen3 Coder Nextnone Trinity Large PreviewnoneKostenlos verfügbarvsGemini 3 Flash Previewmedium Trinity Large PreviewnoneKostenlos verfügbarvsGemini 3.1 Pro Previewmedium Trinity Large PreviewnoneKostenlos verfügbarvsStep 3.5 FlashmediumKostenlos verfügbar

Kategorieaufschlüsselung

Kategorie	Ø-Score	Konsistenz	Korrekte Tests
Anti-AI Tricks	10.0	10.0
Combined	10.0	10.0
Data parsing and extraction	9.9	10.0
Domain specific	4.0	10.0
General Intelligence	3.0	9.9
Instructions following	3.5	6.7
Puzzle Solving	4.0	10.0
Tool Calling	10.0	10.0