AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-03
| Métrique | Arcee AI: Trinity Large Preview (free) none Sortie: 2026-01-27 Disponible gratuitement | MoonshotAI: Kimi K2.5 none Sortie: 2026-01-27 |
|---|---|---|
| Rang | #33 | #35 |
| Score moy. | 4.34 | 4.07 |
| Cohérence | 9.97 | 8.92 |
| Coût par résultat | 0.000 | 0.232 |
| Coût total | $0.000 | $0.010 |
| Tests corrects | 5/14 | 4/14 |
| Taux de réussite par tentative | 35.7% | 35.7% |
| Tests instables | 0 | 2 |
| Jetons de sortie | 1,415 | 1,915 |
| Jetons de raisonnement | 0 | 0 |
Répartition par catégorie
| Astuces anti-IA | Score | Cohérence | Taux de réussite par tentative | Tests instables | Tests corrects | Jetons de sortie | Jetons de raisonnement |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| Analyse et extraction des données | Score | Cohérence | Taux de réussite par tentative | Tests instables | Tests corrects | Jetons de sortie | Jetons de raisonnement |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| Spécifique au domaine | Score | Cohérence | Taux de réussite par tentative | Tests instables | Tests corrects | Jetons de sortie | Jetons de raisonnement |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| Suivi des instructions | Score | Cohérence | Taux de réussite par tentative | Tests instables | Tests corrects | Jetons de sortie | Jetons de raisonnement |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | Score | Cohérence | Taux de réussite par tentative | Tests instables | Tests corrects | Jetons de sortie | Jetons de raisonnement |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| Appel d'outils | Score | Cohérence | Taux de réussite par tentative | Tests instables | Tests corrects | Jetons de sortie | Jetons de raisonnement |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
Comparaison rapide
Changer la paire de comparaison
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneDisponible gratuitementvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneDisponible gratuitementvsQwen3 Coder NextmediumTrinity Large Preview (free)noneDisponible gratuitementvsMiniMax M2.5mediumTrinity Large Preview (free)noneDisponible gratuitementvsgpt-oss-120bmediumDisponible gratuitementTrinity Large Preview (free)noneDisponible gratuitementvsQwen3.5-FlashmediumTrinity Large Preview (free)noneDisponible gratuitementvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumDisponible gratuitementTrinity Large Preview (free)noneDisponible gratuitementvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneDisponible gratuitementvsMiMo-V2-Flashmedium