AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs xAI: Grok 4.20
Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-02
| Métrique | Kimi K2.5 Kimi K2.5 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| Score | 7.2 | 7.1 |
| Rang | #39 | #40 |
| Cohérence | 7.2 | 8.2 |
| Tests corrects | ||
| Taux de réussite par tentative | 72.6% | 66.7% |
| Tests instables | 6 | 4 |
| Exécutions totales | 51 | 51 |
| Coût par résultat | 2.232 | 7.358 |
| Coût total | $0.201 | $0.663 |
| Prix d'entrée | $0.383 / 1M | $2.000 / 1M |
| Prix de sortie | $1.909 / 1M | $6.000 / 1M |
| Jetons de sortie | 40,907 | 1,494 |
| Jetons de raisonnement | 75,121 | 97,078 |
| Temps de réponse (moy.) | 64.59s | 9.50s |
| Temps de réponse (max) | 137.29s | 29.87s |
| Temps de réponse (total) | 645.93s | 161.54s |
Score vs coût total
Temps de réponse (moy.)
Score vs Temps de réponse (moy.)
Total des jetons de sortie
Score vs Total des jetons de sortie
Répartition par catégorie
Comparaison rapide
Changer la paire de comparaison
Claude Sonnet 4.6nonevsKimi K2.5mediumClaude Sonnet 4.6nonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumKimi K2.5mediumvsGPT-5.3 ChatnoneGemma 4 31BnonevsGrok 4.20mediumGrok 4.20mediumvsGLM 5noneKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneGPT-5.3 ChatnonevsGrok 4.20mediumGemma 4 31BnonevsKimi K2.5mediumKimi K2.5mediumvsGLM 5noneKimi K2.5mediumvsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewnonevsKimi K2.5medium