AI BENCHY
Vergleichen Diagramme Methodik
❤️ Made by XCS
Your ad here

#45

Trinity Large Preview

Arcee AI · Veröffentlichung: 2026-01-27 · arcee-ai/trinity-large-preview::none

Ø-Score

4.2

Kosten pro Ergebnis

0.000

Konsistenz

9.6

Gesamtkosten

$0.000

Korrekte Tests

Falsche Tests: 11

Erfolgsquote pro Versuch: 33.3%

Instabile Tests

1

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

3.15s

Antwortzeit (Maximum): 8.91s

Antwortzeit (Gesamt): 50.46s

Falsche Antwort: 9 Anweisungen nicht befolgt: 2

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Schnellvergleich

Kategorieaufschlüsselung

Kategorie Ø-Score Konsistenz Korrekte Tests
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0