#148
Arcee AI
Veröffentlichung: 2026-01-27
Getestet am: 2026-05-22 00:42
arcee-ai/trinity-large-preview::none
4.7
Konsistenz
9.3
10.0
Gesamte Ausgabe-Token
2,169
Gesamte Eingabe-Token
29,828
Eingabepreis
$0.243 / 1M
Ausgabepreis
$0.243 / 1M
Instabile Tests
2
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-22 00:42 Suite geändert | 4.8 | 10.0 | $0.001 | Aktueller Lauf | |
| 2026-05-08 15:30 Suite geändert | 4.8 | 10.0 | $0.001 | Vergleichen | |
| 2026-04-23 10:54 Erster erfasster Lauf | 5.3 | k. A. | $0.000 | Vergleichen |
Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.
Laufvergleich
| Lauf | Punktzahl | Konsistenz | Zuverlässigkeit | Korrekte Tests | Instabile Tests | Gesamte Ausgabe-Token | Gesamte Eingabe-Token | Gesamtkosten | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-05-22 00:42 · Aktueller Lauf | 4.7 | 9.3 | 10.0 | 4/20 | 2 | 2,169 | 29,828 | $0.001 | 2.98s |
| 2026-04-23 10:54 · Erster erfasster Lauf | 5.3 | 9.6 | k. A. | 5/18 | 1 | 1,985 | 0 | $0.000 | 5.07s |
| Differenz | -0.6 | -0.3 | -1 | +1 | +184 | +29828 | +$0.001 | -2091ms |
Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.
Preisverlauf
Historische Preisdaten für dieses Modell von OpenRouter.
| Datum | Eingabepreis | Ausgabepreis |
|---|---|---|
| 2026-06-03 21:35 | $0.243 / 1M | $0.243 / 1M |
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Trinity Large PreviewnonevsMiniMax M2.7mediumTrinity Large PreviewnonevsDeepSeek V3.2noneTrinity Large PreviewnonevsGrok 4.20noneTrinity Large PreviewnonevsQwen3.5-122B-A10BnoneTrinity Large Previewnonevsgpt-oss-120bnoneKostenlos verfügbarTrinity Large PreviewnonevsGLM 5 TurbononeTrinity Large PreviewnonevsGemini 3 Flash PreviewmediumTrinity Large PreviewnonevsGemini 3.5 FlashhighTrinity Large PreviewnonevsRing-2.6-1TmediumTrinity Large PreviewnonevsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 3.1 | 10.0 | |
| Programmierung | 4.0 | 6.6 | |
| Kombiniert | 3.0 | 10.0 | |
| Datenanalyse und -extraktion | 10.0 | 10.0 | |
| Domänenspezifisch | 5.3 | 10.0 | |
| Allgemeine Intelligenz | 4.5 | 10.0 | |
| Befolgung von Anweisungen | 3.5 | 10.0 | |
| Rätsellösen | 3.6 | 7.7 | |
| Werkzeugaufrufe | 10.0 | 10.0 | |
| Allgemeinwissen | 3.0 | 10.0 |