#45
Arcee AI · Veröffentlichung: 2026-01-27 · arcee-ai/trinity-large-preview::none
Instabile Tests
1
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Falsche Antwort: 9 Anweisungen nicht befolgt: 2
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Schnellvergleich
Trinity Large PreviewnoneKostenlos verfügbarvsGPT-5.4noneTrinity Large PreviewnoneKostenlos verfügbarvsKimi K2.5noneTrinity Large PreviewnoneKostenlos verfügbarvsMiniMax M2.5mediumTrinity Large PreviewnoneKostenlos verfügbarvsGPT-4o-mininoneTrinity Large PreviewnoneKostenlos verfügbarvsQwen3.5-35B-A3BnoneTrinity Large PreviewnoneKostenlos verfügbarvsQwen3 Coder NextnoneTrinity Large PreviewnoneKostenlos verfügbarvsGemini 3 Flash PreviewmediumTrinity Large PreviewnoneKostenlos verfügbarvsGemini 3.1 Pro PreviewmediumTrinity Large PreviewnoneKostenlos verfügbarvsStep 3.5 FlashmediumKostenlos verfügbar
Kategorieaufschlüsselung
| Kategorie | Ø-Score | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 9.9 | 10.0 | |
| Domain specific | 4.0 | 10.0 | |
| General Intelligence | 3.0 | 9.9 | |
| Instructions following | 3.5 | 6.7 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |