#130
Arcee AI
Releasedatum: 2026-01-27
Getest op: 2026-05-08 15:30
arcee-ai/trinity-large-preview::none
4.8
Consistentie
8.9
10.0
Totaal aantal uitvoer-tokens
2,190
Totaal aantal invoer-tokens
0
Invoerprijs
$0.150 / 1M
Uitvoerprijs
$0.450 / 1M
Instabiele tests
3
Instabiele tests hadden gemengde uitkomsten over runs (minstens één geslaagd en één gefaald).
Rungeschiedenis
| Getest op | Score | Betrouwbaarheid | Correcte tests | Totale kosten | Vergelijken |
|---|---|---|---|---|---|
| 2026-05-22 00:42 Suite gewijzigd | 4.8 | 10.0 | $0.001 | Vergelijken | |
| 2026-05-08 15:30 Suite gewijzigd | 4.8 | 10.0 | $0.001 | Huidige run | |
| 2026-04-23 10:54 Eerste geregistreerde run | 5.3 | n.v.t. | $0.000 | Vergelijken |
Deze run gebruikte een andere benchmarkset. Houd rekening met suitewijzigingen bij het lezen van historische verschuivingen.
Grafieken
Kies eerst het eerste model en klik daarna op een tweede model om een zij-aan-zijpagina te openen.
Score vs Totale kosten
Responstijd (gem.)
Score vs Responstijd (gem.)
Totaal aantal uitvoer-tokens
Score vs Totaal aantal uitvoer-tokens
Snelle vergelijking
Trinity Large PreviewnonevsMiniMax M2.7mediumTrinity Large PreviewnonevsDeepSeek V3.2noneTrinity Large PreviewnonevsGrok 4.20noneTrinity Large PreviewnonevsQwen3.5-122B-A10BnoneTrinity Large Previewnonevsgpt-oss-120bnoneGratis beschikbaarTrinity Large PreviewnonevsGLM 5 TurbononeTrinity Large PreviewnonevsGemini 3 Flash PreviewmediumTrinity Large PreviewnonevsGemini 3.5 FlashhighTrinity Large PreviewnonevsRing-2.6-1TmediumTrinity Large PreviewnonevsGemini 3.5 Flashlow
Categorie-uitsplitsing
| Categorie | Score | Consistentie | Correcte tests |
|---|---|---|---|
| Anti-AI-trucs | 3.1 | 10.0 | |
| Programmeren | 4.9 | 3.2 | |
| Gecombineerd | 3.0 | 10.0 | |
| Gegevensparsering en extractie | 10.0 | 10.0 | |
| Domeinspecifiek | 5.3 | 10.0 | |
| Algemene intelligentie | 4.5 | 10.0 | |
| Instructies opvolgen | 3.4 | 6.2 | |
| Puzzeloplossing | 3.6 | 7.7 | |
| Toolaanroepen | 10.0 | 10.0 | |
| Algemene kennis | 3.0 | 10.0 |