AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-03-03
| Metrik | Arcee AI: Trinity Large Preview (free) none Veröffentlichung: 2026-01-27 Kostenlos verfügbar | MoonshotAI: Kimi K2.5 none Veröffentlichung: 2026-01-27 |
|---|---|---|
| Rang | #33 | #35 |
| Ø-Score | 4.34 | 4.07 |
| Konsistenz | 9.97 | 8.92 |
| Kosten pro Ergebnis | 0.000 | 0.232 |
| Gesamtkosten | $0.000 | $0.010 |
| Korrekte Tests | 5/14 | 4/14 |
| Erfolgsquote pro Versuch | 35.7% | 35.7% |
| Instabile Tests | 0 | 2 |
| Ausgabe-Token | 1,415 | 1,915 |
| Denk-Token | 0 | 0 |
Kategorieaufschlüsselung
| Anti-KI-Tricks | Punktzahl | Konsistenz | Erfolgsquote pro Versuch | Instabile Tests | Korrekte Tests | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| Datenanalyse und -extraktion | Punktzahl | Konsistenz | Erfolgsquote pro Versuch | Instabile Tests | Korrekte Tests | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| Domänenspezifisch | Punktzahl | Konsistenz | Erfolgsquote pro Versuch | Instabile Tests | Korrekte Tests | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| Befolgung von Anweisungen | Punktzahl | Konsistenz | Erfolgsquote pro Versuch | Instabile Tests | Korrekte Tests | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | Punktzahl | Konsistenz | Erfolgsquote pro Versuch | Instabile Tests | Korrekte Tests | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| Werkzeugaufrufe | Punktzahl | Konsistenz | Erfolgsquote pro Versuch | Instabile Tests | Korrekte Tests | Ausgabe-Token | Denk-Token |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
Schnellvergleich
Vergleichspaar wechseln
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneKostenlos verfügbarvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneKostenlos verfügbarvsQwen3 Coder NextmediumTrinity Large Preview (free)noneKostenlos verfügbarvsMiniMax M2.5mediumTrinity Large Preview (free)noneKostenlos verfügbarvsgpt-oss-120bmediumKostenlos verfügbarTrinity Large Preview (free)noneKostenlos verfügbarvsQwen3.5-FlashmediumTrinity Large Preview (free)noneKostenlos verfügbarvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumKostenlos verfügbarTrinity Large Preview (free)noneKostenlos verfügbarvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneKostenlos verfügbarvsMiMo-V2-Flashmedium